3 Möglichkeiten, unerwünschte Blogseiten von Google zu entfernen

3 Möglichkeiten, unerwünschte Blogseiten von Google zu entfernen / Wordpress & Webentwicklung

Glauben Sie an die Idee, dass etwas, das einmal im Internet veröffentlicht wird, für immer veröffentlicht wird? Nun, heute werden wir diesen Mythos zerstreuen.

Die Wahrheit ist, dass es in vielen Fällen durchaus möglich ist, Informationen aus dem Internet auszurotten. Sicher, es gibt eine Aufzeichnung von Webseiten, die gelöscht wurden, wenn Sie die Wayback-Maschine durchsuchen, oder? Ja, absolut. Auf dem Wayback Machine gibt es Aufzeichnungen von Webseiten, die viele Jahre zurückliegen - Seiten, die Sie bei einer Google-Suche nicht finden können, da die Webseite nicht mehr existiert. Jemand hat es gelöscht oder die Website wurde geschlossen.

Also gibt es kein Problem, richtig? Informationen werden für immer in den Stein des Internets eingraviert, um Generationen dort zu sehen? Nun, nicht genau.

Die Wahrheit ist, dass es zwar schwierig oder unmöglich ist, wichtige Nachrichtengeschichten, die sich von einer Nachrichten-Website oder einem Blog zu einem anderen wie ein Virus entwickelt haben, auszulöschen, dass es jedoch ziemlich einfach ist, eine Webseite oder mehrere Webseiten aus allen Datensätzen vollständig auszuradieren der Existenz - um diese Seite für beide Suchmaschinen sowie die Wayback-Maschine zu entfernen Die neue Wayback-Maschine lässt Sie visuell in Internet-Zeit zurückreisen Die neue Wayback-Maschine lässt Sie visuell in Internet-Zeit zurückreisen Es scheint, dass seit der Wayback-Maschine gestartet wird 2001 haben sich die Websitebesitzer entschieden, das Alexa-basierte Backend zu veröffentlichen und mit ihrem eigenen Open Source-Code umzugestalten. Nach der Durchführung von Tests mit dem… Read More. Es gibt natürlich einen Haken, aber dazu kommen wir.

3 Möglichkeiten, Blogseiten aus dem Internet zu entfernen

Die erste Methode ist die, die die Mehrheit der Websitebesitzer verwendet, weil sie es nicht besser wissen - Webseiten einfach löschen. Dies kann passieren, weil Sie festgestellt haben, dass Sie doppelten Inhalt auf Ihrer Website haben oder weil Sie eine Seite haben, die Sie nicht in den Suchergebnissen anzeigen möchten.

Löschen Sie einfach die Seite

Das Problem beim vollständigen Löschen von Seiten von Ihrer Website besteht darin, dass, da Sie die Seite bereits im Internet eingerichtet haben, wahrscheinlich Links von Ihrer eigenen Website sowie externe Links von anderen Websites zu dieser bestimmten Seite vorhanden sind. Wenn Sie es löschen, erkennt Google diese Seite sofort als fehlende Seite.

Beim Löschen Ihrer Seite haben Sie also nicht nur ein Problem mit erstellt “Nicht gefunden” Fehler beim Crawlen für sich selbst, Sie haben jedoch auch ein Problem für alle erstellt, die auf die Seite verlinkt sind. Normalerweise sehen Benutzer, die über diese externen Links auf Ihre Website gelangen, Ihre 404-Seite. Dies ist kein großes Problem, wenn Sie einen benutzerdefinierten 404-Code von Google verwenden, um Benutzern hilfreiche Vorschläge oder Alternativen zu geben. Aber Sie denken, es könnte elegantere Methoden geben, um Seiten aus den Suchergebnissen zu löschen, ohne alle 404s für vorhandene eingehende Links zu starten, richtig?

Nun, das gibt es.

Entfernen Sie eine Seite aus den Google-Suchergebnissen

Zunächst sollten Sie verstehen, dass die Seite, die Sie aus den Google-Suchergebnissen entfernen möchten, keine Seite von Ihrer eigenen Website ist, dann haben Sie kein Glück, es sei denn, es gibt rechtliche Gründe oder die Website hat Ihre persönliche Website veröffentlicht Informationen online ohne Ihre Erlaubnis. Wenn dies der Fall ist, senden Sie eine Anfrage zur Entfernung der Seite aus den Suchergebnissen mit dem Entfernungs-Ratgeber von Google. Wenn Sie einen gültigen Fall haben, kann es sein, dass Sie mit dem Entfernen der Seite Erfolg haben. Natürlich ist es sogar noch erfolgreicher, wenn Sie sich an den Inhaber der Website wenden wie ich bereits im Jahr 2009 beschrieben habe.

Wenn sich die Seite, die Sie aus den Suchergebnissen entfernen möchten, auf Ihrer eigenen Website befindet, haben Sie Glück. Alles was Sie tun müssen, ist ein robots.txt Datei und stellen Sie sicher, dass Sie entweder die bestimmte Seite, die Sie nicht in den Suchergebnissen sehen möchten, oder das gesamte Verzeichnis mit den Inhalten, die Sie nicht indizieren möchten, nicht zulassen. So sieht das Blockieren einer einzelnen Seite aus.

User-Agent: * Nicht zulassen: /my-deleted-article-that-i-want-removed.html

Sie können Bots daran hindern, ganze Verzeichnisse Ihrer Site zu durchsuchen, wie folgt.

Benutzeragent: * Nicht zulassen: / content-about-personal-stuff /

Google verfügt über eine hervorragende Support-Seite, auf der Sie eine robots.txt-Datei erstellen können, wenn Sie noch keine erstellt haben. Dies funktioniert extrem gut, wie ich vor kurzem in einem Artikel über die Strukturierung von Syndikatsgeschäften erklärt habe. Wie verhandelt man Syndikatsgeschäfte und schützt Sie Ihre Suchrankings? Wie verhandeln Sie Syndikationsgeschäften? Und schützen Sie Ihre Suchrankings? Syndikate sind heutzutage der letzte Schrei. Aber plötzlich konnten Sie feststellen, dass der Syndikationspartner für eine Geschichte, die Sie ursprünglich geschrieben haben, in den Suchergebnissen höher aufgeführt wird als Sie! Schützen Sie Ihre Suchrankings. Lesen Sie mehr, damit sie Sie nicht verletzen (Bitten Sie die Syndikationspartner, die Indizierung ihrer Seiten, auf denen Sie syndiziert werden, zu verbieten). Nachdem mein eigener Syndikationspartner dem zugestimmt hatte, verschwanden die Seiten, die aus meinem Blog dupliziert wurden, vollständig aus den Sucheinträgen.

Nur die Hauptwebsite erscheint an dritter Stelle der Seite, auf der sie unseren Titel aufführen, aber mein Blog ist jetzt sowohl an der ersten als auch an der zweiten Stelle aufgeführt. Etwas, das fast unmöglich gewesen wäre, wenn eine Website mit höherer Autorität die duplizierte Seite indiziert hätte.

Was viele nicht wissen, ist, dass dies auch mit dem Internet-Archiv (der Wayback-Maschine) möglich ist. Hier sind die Zeilen, die Sie Ihrer robots.txt-Datei hinzufügen müssen, um dies zu ermöglichen.

Benutzeragent: ia_archiver Ablehnen: / sample-category /

In diesem Beispiel richte ich das Internetarchiv ein, alles im Unterverzeichnis sample-category auf meiner Site von der Wayback-Maschine zu entfernen. Wie das geht, erfahren Sie im Internet-Archiv auf der Ausschluss-Hilfeseite. Hier erklären sie auch das “Das Internetarchiv ist nicht daran interessiert, Zugang zu Websites oder anderen Internetdokumenten zu bieten, deren Autoren ihr Material nicht in der Sammlung haben möchten.”

Dies widerspricht dem weit verbreiteten Glauben, dass alles, was ins Internet gestellt wird, für alle Ewigkeit in das Archiv mitgerissen wird. Nope - Webmaster, die Eigentümer des Inhalts sind, können den Inhalt mithilfe des Ansatzes "robots.txt" gezielt aus dem Archiv entfernen.

Entfernen Sie eine einzelne Seite mit Metatags

Wenn Sie nur wenige Einzelseiten haben, die Sie aus den Ergebnissen der Google-Suche entfernen möchten, müssen Sie den Ansatz "robots.txt" überhaupt nicht verwenden. Sie können einfach die richtige hinzufügen “Roboter” Meta-Tag für die einzelnen Seiten, und weisen Sie die Roboter an, Links auf der gesamten Seite nicht zu indizieren oder ihnen zu folgen.

Sie könnten das verwenden “Roboter” Um die Indizierung der Seite durch Robots zu stoppen, können Sie den Google-Roboter ausdrücklich anweisen, nicht zu indizieren, sodass die Seite nur aus den Google-Suchergebnissen entfernt wird und andere Suchroboter weiterhin auf den Seiteninhalt zugreifen können.

Es liegt ganz bei Ihnen, wie Sie festlegen möchten, was Roboter mit der Seite tun und ob die Seite aufgelistet wird oder nicht. Für wenige Einzelseiten ist dies möglicherweise der bessere Ansatz. Um ein gesamtes Inhaltsverzeichnis zu entfernen, verwenden Sie die robots.txt-Methode.

Die Idee von “Entfernen” Inhalt

Diese Art dreht den ganzen Begriff von “Inhalte aus dem Internet löschen” auf dem Kopf. Wenn Sie alle eigenen Links zu einer Seite auf Ihrer Website entfernen und diese mit der robots.txt-Technik aus der Google-Suche und dem Internet-Archiv entfernen, ist die Seite technisch gesehen in jeder Hinsicht bestimmt “gelöscht” aus dem Internet. Die coole Sache ist jedoch, dass diese Links weiterhin funktionieren, wenn bereits Links auf der Seite vorhanden sind, und Sie keine 404-Fehler für diese Besucher auslösen.

Es ist mehr “sanft” Sie können Inhalte aus dem Internet entfernen, ohne die bestehende Link-Popularität Ihrer Website im gesamten Internet zu beeinträchtigen. Letztendlich liegt es bei Ihnen, wie Sie festlegen, welche Inhalte von Suchmaschinen und dem Internet-Archiv gesammelt werden. Sie sollten jedoch immer daran denken, dass die Inhalte, die online veröffentlicht werden, trotz der Aussagen der Menschen wirklich vollständig unter Ihrer Kontrolle liegen.

Erfahren Sie mehr über: Google, Google-Suche, SEO, Webdesign, Webmaster-Tools.