Betriebssysteme, Programme & Web

Seiten aus dem Google Index löschen

Wenn man eine Seite von seiner Website löscht ist es manchmal sinnig den Link auf eine andere Seite umzuleiten über den HTTP Status 302 oder 301. Dadurch gehen die eingehenden Links nicht verloren und man kann eine andere, neue Seite stärken. Doch manchmal macht es auch Sinn die Seiten einfach aus dem Google Index zu löschen. Das kann man zwar auch umständlich über die Webmaster Tools von Google für jede einzelne Seite beantragen, doch sobald das einige mehr sind, kann das dauern. Dort kommt dann der HTTP Status 410 ins Spiel.

410 Gone

Normalerweise liefern Webserver eine „404 Not Found“ Meldung aus sobald ein Besucher auf eine nicht mehr vorhandene Seite oder Datei kommt. Man hat dann zwei gute Möglichkeiten. Entweder man setzt einen 301 Status für eine permanente Weiterleitung oder eben 410 um die Löschung klar zu stellen.

Theoretisch hören Suchmaschinen bei einem 410 Status auf die Seite zu durchsuchen, da sie das nicht vorhanden sein der Seite bemerken. Bei 404 Seiten sollte das zwar eigentlich auch so sein, doch da sind diese wohl ein wenig träger.

410 Header in PHP

Einen 410 Header mit PHP zu senden ist total einfach. Man fügt einfach folgendes in die Datei ein:

header("HTTP/1.0 410 Gone");

Damit der Browser auch noch etwas anzeigt, falls mal ein normaler Besucher auf die Seite kommt, sollte man jedoch zumindest einen kurzen Text dazu schreiben. Die PHP-Datei könnte dann also beispielsweise so aussehen:

<?php
header("HTTP/1.0 410 Gone");
?>
Die angefragte Seite wurde entfernt.

Du kannst jedoch natürlich auch dein eigenes Template komplett einbinden, Hauptsache der Header ist mit enthalten.

.htaccess anpassen

Wir wollen natürlich nicht jede einzelne gelöschte Datei ersetzen und neu hochladen, deshalb behelfen wir uns der .htaccess-Datei. Dort geben wir folgendes ein:

ErrorDocument 410 /error/410.php

Der Pfad muss natürlich zu eurer hochgeladenen PHP-Datei führen, welche wir eben erstellt haben.

Nun brauchen wir natürlich noch die nicht mehr vorhandenen Seiten. Diese kann man über die Google Webmaster Tools sehr gut herausfinden, dort werden alle Seiten mit 404 Fehler aufgelistet. Einfach exportieren und ein wenig bearbeiten, beispielsweise mit Notepad++.

Die jeweilige Zeile der zu löschenden URL sollte dann folgendermaßen aussehen:

Redirect Gone /zuLoeschendeSeite

Einfach für jede URL so eine Zeile und die gespeicherte .htaccess-Datei wieder hochladen. Schon werden die Seiten in absehbarer Zeit bei Google entfernt.

Simon Lüthje

Ich bin der Gründer dieses Blogs und interessiere mich für alles was mit Technik zu tun hat, bin jedoch auch dem Zocken nicht abgeneigt. Geboren wurde ich in Hamburg, wohne nun jedoch in Bad Segeberg.

Ähnliche Artikel

Schreibe einen Kommentar

Schaltfläche "Zurück zum Anfang"