Einsteigerhandbuch zum Verhindern des Verfalls von Blog-Inhalten in WordPress
Wenn Sie tagein und tagaus Originalinhalte schreiben, wissen Sie bereits, dass Ihre Beiträge innerhalb weniger Tage auf einigen SPAM-Sites landen, manchmal sogar auf wenige Minuten. Einige Benutzer stellten sogar fest, dass die Website mit gestohlenem Inhalt den ursprünglichen Beitrag überstieg. Als Inhaber einer Website ist es sehr frustrierend, zu sehen, dass jemand Ihre Inhalte ohne Erlaubnis stiehlt, monetarisiert, in SERPs höher eingestuft wird und Ihr Publikum stiehlt. Das Scraping von Inhalten ist heutzutage ein großes Problem, wenn man bedenkt, dass es für jemanden so einfach ist, Inhalte zu stehlen. In diesem Artikel werden wir behandeln, was Blog-Content-Scraping ist, wie Content-Scraper abgefangen werden können, wie mit Content-Scrapers umgegangen wird, wie Content-Scraping reduziert und verhindert werden kann und ist zufrieden damit, immer gut zu kratzen?
Was ist Blog Content Scraping??
Blog-Content-Scraping ist ein Vorgang, der normalerweise mit Skripts ausgeführt wird, die Inhalt aus zahlreichen Quellen extrahieren und auf eine Website ziehen. Es ist jetzt so einfach, dass jeder eine WordPress-Site installieren, ein kostenloses oder ein kommerzielles Design erstellen und ein paar Plugins installieren kann, die Inhalte von ausgewählten Blogs scrapchen und auf ihrer Website veröffentlichen können.
Warum stehlen sie meinen Inhalt??
Einige unserer Nutzer haben uns gefragt, warum sie meine Inhalte stehlen. Die einfache Antwort ist, dass Sie super sind. Die Wahrheit ist, dass diese Inhaltskratzer andere Motive haben. Im Folgenden sind nur einige Gründe aufgeführt, warum jemand Ihren Inhalt kratzen würde:
- Affiliate-Kommission - Es gibt ein paar schmutzige Affiliate-Vermarkter, die das System nutzen wollen, um ein paar Dollar mehr zu verdienen. Sie verwenden Ihre Inhalte und die Inhalte anderer Personen, um durch Suchmaschinen Datenverkehr auf ihre Website zu bringen. Diese Websites sind in der Regel auf eine bestimmte Nische ausgerichtet, sodass sie verwandte Produkte anbieten, für die sie werben.
- Lead-Generierung - Oft sehen wir Anwälte und Makler, die dies tun. Sie wollen in ihren kleinen Gemeinschaften als Branchenführer erscheinen. Sie haben nicht die Bandbreite, um qualitativ hochwertige Inhalte zu erzeugen, also gehen sie aus und kratzen Inhalte aus anderen Quellen. Manchmal sind sie sich dessen gar nicht bewusst, weil sie einige $ 30 / Monat dafür bezahlen, um Inhalte hinzuzufügen und ihnen zu helfen, bessere SEO zu erhalten. Wir haben schon viele davon in der Vergangenheit getroffen.
- Werbeeinkommen - Einige Leute möchten einfach nur einen "Knotenpunkt" des Wissens schaffen. Ein One-Stop-Shop für Benutzer in einer bestimmten Nische. Wenn ich einen Cent für jedes Mal hätte, wenn jemand dies mit unseren Inhalten getan hat, dann hätten wir ein paar hundert Pennys. Häufig stellen wir fest, dass der Inhalt unserer Website ausrangiert wird. Der Schaber antwortet immer, ich tat dies zum Wohl der Gemeinschaft. Außer die Website ist mit Anzeigen verputzt.
Dies sind nur einige Gründe, warum jemand Ihre Inhalte stiehlt.
Wie man Content Scrapers fängt?
Content Scraper zu fangen, ist eine langwierige Aufgabe und kann viel Zeit in Anspruch nehmen. Dies sind einige Möglichkeiten, um Content Scraper zu fangen.
Durchsuchen Sie Google mit Ihren Posttiteln
Das ist so schmerzhaft wie es klingt. Diese Methode ist es wahrscheinlich nicht wert, besonders wenn Sie über ein sehr beliebtes Thema schreiben.
Trackbacks
Wenn Sie in Ihren Posts interne Links hinzufügen, werden Sie einen Trackback feststellen, wenn eine Website Ihren Inhalt stiehlt. Dieser Weg ist so ziemlich der Scraper, der Ihnen mitteilt, dass er Ihren Inhalt kratzt. Wenn Sie Akismet verwenden, werden viele dieser Trackbacks im SPAM-Ordner angezeigt. Auch dies funktioniert nur, wenn Sie in Ihren Posts interne Links haben.
Webmaster werkzeuge
Wenn Sie Google Webmaster-Tools verwenden, kennen Sie wahrscheinlich die Links zu Ihrer Site-Seite. Wenn Sie unter "Traffic" suchen, wird eine Seite mit Links zu Ihrer Site angezeigt. Ihre Kratzer werden wahrscheinlich zu den besten gehören. Sie werden Hunderte, wenn nicht Tausende von Links zu Ihren Seiten haben (in Anbetracht der Tatsache, dass Sie interne Links haben).
FeedBurner Ungewöhnliche Verwendung
Wenn Sie Feedburner für Ihren WordPress-Blog eingerichtet haben, können Sie einige ungewöhnliche Anwendungen sehen. Auf der Registerkarte "Analysieren" unter Feedstatistiken wird "Ungewöhnliche Verwendung" angezeigt. Dort sehen Sie eine Liste von Websites.
Umgang mit Content Scrapers
Es gibt nur wenige Ansätze, mit denen Menschen beim Umgang mit Content-Scrapern umgehen. Der Ansatz "Nichts tun", "Töte sie alle", nutze sie.
Der Ansatz "Nichts tun"
Dies ist bei weitem der einfachste Ansatz, den Sie ergreifen können. Normalerweise würden die beliebtesten Blogger dies empfehlen, da es viel Zeit braucht, um die Schaber zu bekämpfen. Bei diesem Ansatz wird lediglich empfohlen, dass Sie Ihre Zeit damit verbringen, noch mehr qualitativ hochwertige Inhalte zu erstellen und Spaß zu haben, anstatt sie zu bekämpfen. Wenn es sich um ein bekanntes Blog wie Smashing Magazine, CSS-Tricks, Problogger oder andere handelt, müssen Sie sich natürlich keine Sorgen machen. Sie sind Autoritätsseiten in den Augen von Google.
Während des Panda-Updates wissen wir jedoch, dass einige gute Websites als Scraper gekennzeichnet wurden, da Google der Meinung war, dass ihre Scraper ursprünglicher Inhalt waren. Daher ist dieser Ansatz unserer Meinung nach nicht immer der beste.
Töte sie alle Annäherung
Das genaue Gegenteil von "Do Nothing Approach". Bei diesem Ansatz wenden Sie sich einfach an den Schaber und bitten ihn, den Inhalt herunterzunehmen. Wenn sie dies ablehnen oder einfach nicht auf Ihre Anfragen antworten, reichen Sie einen DMCA (Digital Millennium Copyright Act) bei ihrem Gastgeber ein. Nach unserer Erfahrung steht für die meisten Scraping-Websites kein Kontaktformular zur Verfügung. Wenn ja, dann nutzen Sie es. Wenn sie nicht über das Kontaktformular verfügen, müssen Sie eine Whois-Suche durchführen.
Die Kontaktinformationen finden Sie auf dem administrativen Kontakt. In der Regel ist der administrative und technische Kontakt derselbe. Der whois zeigt auch den Domain-Registrar. Die meisten bekannten Webhosting-Unternehmen und Domain-Registrare verfügen über DMCA-Formulare oder E-Mails. Sie können sehen, dass diese bestimmte Person wegen ihrer Nameserver bei Hostgator ist. HostGator hat ein Formular für DMCA-Beschwerden. Wenn der Nameserver so etwas wie ns1.theirdomain.com ist, müssen Sie tiefer suchen, indem Sie Reverse-IP-Lookups durchführen und nach IPs suchen.
Sie können auch einen Drittanbieter-Service für DMCA.com für Deaktivierungen verwenden.
Jeff Starr schlägt in seinem Artikel vor, dass Sie die IPs des bösen Mannes blockieren sollten. Greifen Sie auf Ihre Protokolle für ihre IP-Adresse zu und blockieren Sie sie dann mit etwas Ähnlichem in Ihrer root-Datei .htaccess:
Deny von 123.456.789
Sie können sie auch auf einen Dummy-Feed umleiten, indem Sie Folgendes tun:
RewriteCond% REMOTE_ADDR 123 \ .456 \ .789 \. RewriteRule. * Http://dummyfeed.com/feed [R, L]
Sie können hier wirklich kreativ werden, wie Jeff vorschlägt. Schicken Sie sie mit Lorem Ipsum an wirklich große Text-Feeds. Sie können ihnen einige widerliche Bilder von schlechten Dingen schicken. Sie können sie auch direkt an ihren eigenen Server zurücksenden, wodurch eine Endlosschleife verursacht wird, die ihre Site zum Absturz bringt.
Der letzte Ansatz, den wir verfolgen, ist, sie zu nutzen.
So nutzen Sie Content Scrapers
Dies ist unser Ansatz im Umgang mit Content Scrapers und erweist sich als ziemlich gut. Es hilft unserem SEO und hilft uns, zusätzliches Geld zu verdienen. Die Mehrheit der Scraper verwendet Ihren RSS-Feed, um Ihre Inhalte zu stehlen. Dies sind also einige der Dinge, die Sie tun können:
- Interne Verknüpfung - Sie müssen die CRAP mit Ihren Posts verknüpfen. Mit der internen Verknüpfungsfunktion in WordPress 3.1 ist es jetzt einfacher als je zuvor. Wenn Sie in Ihrem Artikel über interne Links verfügen, können Sie damit die Seitenzugriffe verbessern und die Absprungrate auf Ihrer eigenen Website reduzieren. Zweitens erhalten Sie Backlinks von den Personen, die Ihre Inhalte stehlen. Schließlich können Sie ihr Publikum stehlen. Wenn Sie ein talentierter Blogger sind, verstehen Sie die Kunst der internen Verlinkung. Sie müssen Ihre Links auf interessante Keywords setzen. Machen Sie es für den Benutzer verführerisch, darauf zu klicken. Wenn Sie das tun, wird auch das Publikum des Scrapers darauf klicken. So haben Sie einen Besucher von seiner Website mitgenommen und dahin gebracht, wo er eigentlich hätte sein sollen.
- Auto-Link-Keywords mit Partner-Links - Es gibt einige Plugins wie Ninja Affiliate und SEO Smart Links, die zugewiesene Keywords automatisch durch Affiliate-Links ersetzen. Zum Beispiel: HostGator, StudioPress, MaxCDN, Gravity Forms << These all will be auto-replaced with affiliate links when this post goes live.
- Mit RSS-Fußzeile kreativ werden - Sie können entweder die RSS-Fußzeile oder das WordPress SEO by Yoast-Plugin verwenden, um benutzerdefinierte Elemente zu Ihrer RSS-Fußzeile hinzuzufügen. Sie können hier alles hinzufügen, was Sie möchten. Wir kennen einige Leute, die ihre eigenen Produkte gerne bei ihren RSS-Readern bewerben. Also werden sie Banner hinzufügen. Ratet mal was, jetzt erscheinen diese Banner auch auf der Scraper-Website. In unserem Fall fügen wir in unseren RSS-Feeds immer einen kleinen Haftungsausschluss an. Es liest sich einfach wie "Wie Sie Ihre WordPress-Site in den schreibgeschützten Zustand für Site-Migrationen und -Pflege setzen - ist ein Beitrag von: WPBeginner, das nicht auf andere Sites kopiert werden darf." Dadurch erhalten Sie einen Backlink zum Originalartikel Von der Scraper-Site, auf der Google und andere Suchmaschinen wissen, dass wir Autorität sind. Die Benutzer werden darüber informiert, dass die Website unsere Inhalte stiehlt. Wenn Sie mit Codes gut sind, können Sie völlig verrückt werden. Fügen Sie dazu verwandte Posts nur für Ihre RSS-Reader hinzu und viele andere Dinge. In unserem Handbuch erfahren Sie, wie Sie Ihren WordPress-RSS-Feed vollständig bearbeiten können.
Wie Sie Blog-Content-Scraping reduzieren und möglicherweise verhindern können
In Anbetracht dessen, ob Sie viele interne Links verwenden, Affiliate-Links, RSS-Banner und solche Chancen hinzufügen, besteht die Möglichkeit, dass Sie das Content-Scraping auf ein gutes Maß reduzieren. Wenn Sie den Vorschlag von Jeff Starr zur Umleitung von Inhalts-Scrapers annehmen, werden auch diese Scraper gestoppt. Abgesehen von dem, was wir oben geteilt haben, gibt es noch ein paar andere Tricks, die Sie verwenden können.
Vollständiger vs. Zusammenfassung-RSS-Feed
In der Blogging-Community gab es eine Debatte darüber, ob ein vollständiger RSS-Feed oder ein zusammenfassender RSS-Feed vorhanden ist. Wir werden nicht viel auf diese Debatte eingehen, jedoch ist es eines der PROS, einen RSS-Feed nur für die Zusammenfassung zu haben, dass Sie das Content-Scraping verhindern. Sie können die Einstellungen ändern, indem Sie in Ihr WordPress-Administrationsfenster gehen und unter Einstellungen »Lesen gehen. Ändern Sie dann die Einstellung für jeden Artikel in einer Feedshow: Zusammenfassung.
Hinweis: Wir haben vollen Feed, weil uns unsere RSS-Reader mehr interessieren als die Spammer.
Trackback SPAM
Trackbacks und Pingbacks hatten definitiv einen großen Nutzen, werden aber jetzt ständig missbraucht. Oft zeigen Themen Trackbacks und Pingbacks unter oder zwischen den Kommentaren. Dies gibt dem Spammer einen Anreiz, Ihre Site zu kratzen und Trackbacks zu senden. Wenn Sie es versehentlich genehmigen, erhalten sie einen Backlink und eine Erwähnung von Ihrer Site. So können Sie Trackbacks für alle zukünftigen Beiträge deaktivieren. In diesem Artikel erfahren Sie, wie Sie Trackbacks und Pings in vorhandenen WordPress-Beiträgen deaktivieren.
Ist Content Scraping immer gut?
Es kann sein. Wenn Sie sehen, dass Sie mit der Site des Scrapers Geld verdienen, dann können Sie sicher sein. Wenn Sie viel Verkehr von einer Scraper-Site sehen, kann es sein. In den meisten Fällen ist dies jedoch nicht der Fall. Sie sollten immer versuchen, Ihre Inhalte abzunehmen. Mit zunehmendem Umfang Ihres Blogs werden Sie jedoch feststellen, dass es fast unmöglich ist, alle Content-Scraper zu verfolgen. Wir senden immer noch DMCA-Beschwerden, obwohl wir wissen, dass es eine Unzahl anderer Websites gibt, die unsere Inhalte stehlen, mit denen wir einfach nicht mithalten können.
Was sind deine Gedanken? Verwenden Sie andere Mechanismen, um das Scraping von Inhalten zu verhindern? Würde gerne deine Gedanken hören.