Wann wurde das Christian Pfaff Blog zuletzt gespidert?
Die Registrierung von Beiträgen für das Christian Pfaff Blog durch Google kann durch eine Auswertung der Server Log Dateien erfolgen. Hier wird eine Erweiterung des Wordpress Systems zur komfortablen Auswertung vorgestellt.
Aufgabenstellung
Die Erfassung von Beiträgen im Christian Pfaff Blog durch Google soll erfasst werden und für den Administrator sichtbar gemacht werden
Lösung
Die wp_posts Datenbank wird um eine Spalte post_crawl erweitert. In dieser Spalte wird der letzte Crawl durch den Googlebot erfasst.
Hierfür ist neben der Erzeugung einer Spalte vom Typ datetime in der wp_posts Tabelle die Einfügung von Programmzeilen in das header.php Skript wie folgt erforderlich:
<!-- Zeilen am Anfang des Header Skriptes einfuegen fuer die Nutzung der Datenbank -->
<?php
include_once('wp-config.php');
include_once('wp-includes/wp-db.php');
?>
<!-- Ende Include der Datenbankfunktionalitaet -->
<!-- BEGIN Code fuer die Erfassung und Anzeige der Googlebotzugriffe -->
<!-- Bei Posts oder statischen Seiten Googlebotdatum einblenden, wenn Autor -->
<!-- am besten nach dem Titel des Blogs einfuegen -->
<?php
if(is_single() || is_page()) {
global $userdata; /* nur bei Autor anzeigen */
get_currentuserinfo();
if ( $userdata->user_level != '' ) {
$timestr = $wpdb->get_var("SELECT post_crawl FROM $wpdb->posts WHERE id=$post->ID");
if (preg_match("/20/i", "$timestr")) {
echo " $timestr";
}
}
?>
<!-- googlebot erkennen und Datum in Tabelle eintragen -->
<?php
if(is_single() || is_page()) {
$useragent = getenv("HTTP_USER_AGENT");
if (preg_match("/googlebot/i", "$useragent"))
{
$timestr = strftime("%Y-%m-%d %H:%M:%S",time());
$counter = $wpdb->get_var("UPDATE $wpdb->posts SET post_crawl='$timestr' WHERE id=$post->ID");
}
}
?>
<!-- ENDE Googleboterfassung -->