Anfängerleitfaden zum Verhindern des Scrapings von Blog-Inhalten in WordPress

Suchen Sie nach einer Möglichkeit, Spammer und Betrüger davon abzuhalten, Ihre WordPress-Bloginhalte mit Content Scrapern zu stehlen?

Contents

Was ist das Scraping von Blog-Inhalten?Warum stehlen Content Scraper meine Inhalte?Wie fängt man Content Scraper ab?Umgang mit Content Scrapern So nutzen Sie Content Scraper Wie Sie WordPress Blog Scraping reduzieren und verhindern können Vollständiger vs. Zusammenfassungs-RSS-Feed Trackback-SPAM Ist Content Scraping immer gut?

Es ist sehr frustrierend für einen Websitebesitzer zu sehen, dass jemand Ihre Inhalte ohne Erlaubnis stiehlt, sie zu Geld macht, Sie in Google übertrifft und Ihr Publikum stiehlt.

In diesem Artikel erfahren Sie, was das Scraping von Blog-Inhalten ist, wie Sie das Scraping von Inhalten reduzieren und verhindern können und sogar, wie Sie das Scraping von Inhalten zu Ihrem eigenen Vorteil nutzen können.

Was ist das Scraping von Blog-Inhalten?

Beim Scraping von Blog-Inhalten werden Inhalte aus zahlreichen Quellen entnommen und auf einer anderen Website erneut veröffentlicht. Normalerweise geschieht dies automatisch über den RSS-Feed Ihres Blogs.

Das Scraping von Inhalten ist jetzt so einfach, dass jeder eine WordPress-Site starten, ein kostenloses oder kommerzielles Thema erstellen und ein paar Plugins installieren kann, die Inhalte aus ausgewählten Blogs schaben.

Warum stehlen Content Scraper meine Inhalte?

Einige unserer Benutzer haben uns gefragt, warum sie meine Inhalte stehlen? Die einfache Antwort ist, weil Sie FANTASTISCH sind. Die Wahrheit ist, dass diese Content Scraper Hintergedanken haben. Im Folgenden sind nur einige Gründe aufgeführt, warum jemand Ihren Inhalt kratzen würde:

Affiliate-Provision – Es gibt einige schmutzige Affiliate-Vermarkter, die das System nur ausnutzen wollen, um ein paar zusätzliche Dollars zu verdienen. Sie werden Ihre Inhalte und die Inhalte anderer verwenden, um Traffic über die Suchmaschine auf ihre Website zu bringen. Diese Websites sind normalerweise auf eine bestimmte Nische ausgerichtet, daher haben sie verwandte Produkte, für die sie werben.
Lead-Generierung – Wir sehen oft Anwälte und Makler, die dies tun. Sie wollen in ihren kleinen Gemeinden als Branchenführer erscheinen. Sie haben nicht die Bandbreite, um qualitativ hochwertige Inhalte zu produzieren, also gehen sie los und kratzen Inhalte aus anderen Quellen. Manchmal sind sie sich dessen nicht einmal bewusst, weil sie 30 Dollar pro Monat zahlen, um Inhalte hinzuzufügen und ihnen zu helfen, eine bessere SEO zu erzielen. Wir haben in der Vergangenheit einige davon kennengelernt.
Werbeeinkommen – Manche Leute wollen einfach nur eine „Drehscheibe“ des Wissens schaffen. Ein One-Stop-Shop für Benutzer in einer bestimmten Nische. Oft stellen wir fest, dass der Inhalt unserer Website gescrapt wird. Der Schaber antwortet immer, ich habe das zum Wohle der Gemeinschaft getan. Außer die Site ist mit Werbung übersät.

Dies sind nur einige Gründe, warum jemand Ihre Inhalte stehlen würde.

Wie fängt man Content Scraper ab?

Das Auffangen von Content Scrapern ist eine mühsame Aufgabe und kann viel Zeit in Anspruch nehmen. Es gibt nur wenige Möglichkeiten, wie Sie Content Scraper fangen können.

Durchsuchen Sie Google mit Ihren Beitragstiteln

Ja, das ist so schmerzhaft, wie es sich anhört. Diese Methode lohnt sich wahrscheinlich nicht, besonders wenn Sie über ein sehr beliebtes Thema schreiben.

Trackbacks

Wenn Sie in Ihren Beiträgen interne Links hinzufügen, werden Sie einen Trackback bemerken, wenn eine Site Ihre Inhalte stiehlt. Auf diese Weise sagt Ihnen der Scraper so ziemlich, dass er Ihren Inhalt abkratzt.

Wenn Sie Akismet verwenden, werden viele dieser Trackbacks im SPAM-Ordner angezeigt. Auch dies funktioniert nur, wenn Sie interne Links in Ihren Beiträgen haben.

Ahrefs

Wenn Sie Zugriff auf ein SEO-Tool wie Ahrefs haben, können Sie Ihre Backlinks überwachen und nach gestohlenen Inhalten Ausschau halten.

Umgang mit Content Scrapern

Es gibt wenige Ansätze, die Menschen beim Umgang mit Content Scrapern verfolgen: den Do-Nothing-Ansatz, den Take-Down-Ansatz oder den Take Advantage-Ansatz.

Werfen wir einen Blick auf jeden einzelnen.

Der Nichtstun-Ansatz

Dies ist bei weitem der einfachste Ansatz, den Sie wählen können. Normalerweise würden die beliebtesten Blogger dies empfehlen, da es VIEL Zeit in Anspruch nimmt, die Schaber zu bekämpfen.

Nun, wenn es sich um ein bekanntes Blog wie Smashing Magazine, CSS-Tricks, Problogger oder andere handelt, müssen sie sich natürlich nicht darum kümmern. In den Augen von Google sind sie Autoritätsseiten.

Wir kennen jedoch einige gute Websites, die als Scraper gekennzeichnet wurden, weil Google dachte, ihre Scraper seien der ursprüngliche Inhalt. Daher ist dieser Ansatz unserer Meinung nach nicht immer der beste.

Take-Down-Ansatz

Dies ist das genaue Gegenteil des „Do Nothing Approach“. Bei diesem Ansatz kontaktieren Sie einfach den Scraper und bitten ihn, den Inhalt zu entfernen.

Wenn sie dies ablehnen oder einfach nicht auf Ihre Anfragen antworten, reichen Sie einen DMCA (Digital Millennium Copyright Act) bei ihrem Gastgeber ein.

Unserer Erfahrung nach verfügen die meisten Scraping-Websites über kein Kontaktformular. Wenn dies der Fall ist, verwenden Sie es. Wenn sie kein Kontaktformular haben, müssen Sie eine Whois-Suche durchführen.

Whois-Suche

Die Kontaktdaten können Sie dem administrativen Kontakt entnehmen. Normalerweise ist der administrative und technische Kontakt derselbe.

Es wird auch der Domain-Registrar angezeigt. Die meisten bekannten Webhosting-Unternehmen und Domain-Registrare haben DMCA-Formulare oder E-Mails. Sie können sehen, dass diese bestimmte Person aufgrund ihrer Nameserver bei HostGator ist. HostGator hat ein Formular für DMCA-Beschwerden.

Wenn der Nameserver so etwas wie ns1.theirdomain.com ist, müssen Sie tiefer graben, indem Sie Reverse-IP-Lookups durchführen und nach IPs suchen.

Sie können auch einen Drittanbieterdienst für DMCA.com für Takedowns.

Jeff Starr schlagen in seinem Artikel vor, dass Sie die IPs des Bösewichts blockieren sollten. Greifen Sie auf Ihre Protokolle für ihre IP-Adresse zu und blockieren Sie sie dann mit etwas wie diesem in Ihrer Root-.htaccess-Datei:

Deny from 123.456.789

Sie können sie auch auf einen Dummy-Feed umleiten, indem Sie Folgendes tun:

RewriteCond %{REMOTE_ADDR} 123.456.789.
RewriteRule .* http://dummyfeed.com/feed [R,L]

Hier können Sie richtig kreativ werden, wie Jeff vorschlägt. Senden Sie sie mit Lorem Ipsum an wirklich große Text-Feeds. Sie können ihnen ein paar widerliche Bilder von schlechten Dingen schicken. Sie können sie auch direkt an ihren eigenen Server zurücksenden, was eine Endlosschleife verursacht, die ihre Site zum Absturz bringt.

Der letzte Ansatz, den wir verfolgen, besteht darin, sie zu nutzen.

So nutzen Sie Content Scraper

Dies ist unser Ansatz, mit Content Scrapern umzugehen, und er stellt sich als recht gut heraus. Es hilft unserer SEO und hilft uns, zusätzliches Geld zu verdienen.

Die meisten Scraper verwenden Ihren RSS-Feed, um Ihre Inhalte zu stehlen. Dies sind einige der Dinge, die Sie tun können:

Interne Verlinkung – Sie müssen Ihre Blog-Posts oft miteinander verlinken. Wenn Ihr Artikel interne Links enthält, können Sie die Seitenaufrufe erhöhen und die Absprungrate auf Ihrer eigenen Website reduzieren. Zweitens erhalten Sie Backlinks von den Leuten, die Ihre Inhalte stehlen. Schließlich ermöglicht es Ihnen, ihr Publikum zu stehlen. Wenn Sie ein talentierter Blogger sind, dann verstehen Sie die Kunst der internen Verlinkung. Sie müssen Ihre Links auf interessante Keywords platzieren. Machen Sie es für den Benutzer verlockend, darauf zu klicken. Wenn Sie dies tun, wird auch das Publikum des Scrapers darauf klicken. Auf diese Weise haben Sie einen Besucher von seiner Site genommen und ihn dorthin zurückgebracht, wo er ursprünglich hätte sein sollen.
Keywords automatisch mit Affiliate-Links verknüpfen – Es gibt nur wenige Plugins wie ThirstyAffiliates, die zugewiesene Keywords automatisch durch Affiliate-Links ersetzen,
Werden Sie kreativ mit RSS-Fußzeile – Sie können das All-in-One-SEO-Plugin verwenden, um benutzerdefinierte Elemente zu Ihrer RSS-Fußzeile hinzuzufügen. Sie können hier fast alles hinzufügen, was Sie möchten. Wir kennen einige Leute, die gerne ihre eigenen Produkte bei ihren RSS-Readern bewerben. Also werden sie Banner hinzufügen. Ratet mal was, jetzt werden diese Banner auch auf der Website dieses Scrapers erscheinen. In unserem Fall fügen wir in unseren RSS-Feeds am Ende unserer Beiträge immer einen kleinen Haftungsausschluss hinzu. Auf diese Weise erhalten wir einen Backlink zum Originalartikel von der Scraper-Site, der Google und andere Suchmaschinen wissen lässt, dass wir Autorität sind. Es informiert ihre Benutzer auch darüber, dass die Site unsere Inhalte stiehlt.

Weitere Tipps und Ideen finden Sie in unserem Leitfaden zur Steuerung Ihrer RSS-Feed-Fußzeile in WordPress.

Wie Sie WordPress Blog Scraping reduzieren und verhindern können

Wenn Sie bedenken, dass Sie unseren Ansatz der vielen internen Verlinkungen, des Hinzufügens von Affiliate-Links, RSS-Bannern und dergleichen anwenden, besteht die Möglichkeit, dass Sie das Scraping von Inhalten weitgehend reduzieren. Wenn Sie Jeff Starrs Vorschlag folgen, Content Scraper umzuleiten, werden diese Scraper ebenfalls gestoppt. Abgesehen von dem, was wir oben geteilt haben, gibt es noch ein paar andere Tricks, die Sie verwenden können.

Vollständiger vs. Zusammenfassungs-RSS-Feed

In der Blogging-Community gab es eine Debatte, ob ein vollständiger RSS-Feed oder ein zusammenfassender RSS-Feed bereitgestellt werden soll. Wir werden nicht auf viele Details dieser Debatte eingehen, aber einer der Vorteile eines RSS-Feeds nur mit Zusammenfassung besteht darin, dass Sie das Scraping von Inhalten verhindern.

Sie können die Einstellungen ändern, indem Sie zu Ihrem WordPress-Admin-Panel gehen und unter . gehen Einstellungen » Lesen. Ändern Sie dann die Einstellung Für jeden Artikel in einer Feed-Show: Zusammenfassung.

Trackback-SPAM

Trackbacks und Pingbacks hatten definitiv einen großen Nutzen, aber sie werden jetzt ständig missbraucht.

Themen zeigen oft Trackbacks und Pingbacks unter oder zwischen den Kommentaren an. Dies gibt dem Spammer einen Anreiz, Ihre Site zu durchsuchen und Trackbacks zu senden. Wenn Sie es fälschlicherweise genehmigen, erhalten sie einen Backlink und eine Erwähnung von Ihrer Website. So können Sie Trackbacks für alle zukünftigen Beiträge deaktivieren.

Hier ist ein Artikel, der Ihnen zeigt, wie Sie Trackbacks und Pings auch in bestehenden WordPress-Posts deaktivieren können.

Ist Content Scraping immer gut?

Es kann sein. Wenn Sie sehen, dass Sie mit der Website des Schabers Geld verdienen, kann dies sicher sein. Wenn Sie viel Verkehr von der Site eines Scrapers sehen, kann dies der Fall sein.

In den meisten Fällen ist dies jedoch nicht der Fall. Sie sollten immer versuchen, Ihre Inhalte zu entfernen. Aber Sie werden feststellen, dass es mit zunehmender Größe Ihres Blogs fast unmöglich ist, den Überblick über alle Content Scraper zu behalten. Wir senden immer noch DMCA-Beschwerden, wissen jedoch, dass es unzählige andere Websites gibt, die unsere Inhalte stehlen, mit denen wir einfach nicht Schritt halten können.

Wir hoffen, dieser Artikel hat Ihnen geholfen, das Scraping von Blog-Inhalten in WordPress zu verhindern. Vielleicht möchten Sie auch unseren Leitfaden zum Verhindern von Bilddiebstahl in WordPress lesen.