Blog

Como Prevenir Content Scraping no WordPress

Content Scraping
Guias para Iniciantes

Como Prevenir Content Scraping no WordPress

Se você escrever conteúdo original dia a dia, você já está ciente do fato de que seus Posts vão acabar em um monte de sites dentro de alguns dias, às vezes, até mesmo alguns minutos. Alguns usuários ainda observam que o site com conteúdo roubado absorve também tráfego que seria do post original (outranked). É muito frustrante como proprietário de um site ver que alguém está roubando o seu conteúdo sem permissão, monetizando isso, às vezes até superando você em SERPs e roubando o seu público. Content Scraping é um grande problema nos dias de hoje, considerando o quão fácil é para alguém roubar seu conteúdo. Neste artigo, vamos abordar o que é Content Scraping, como pegar Content Scrapers, a forma de lidar com Content Scrapers, como você pode reduzir e prevenir Content Scraping, como tirar proveito do Content Scraping, como fazer dinheiro a partir de Content Scraping e será que é bom Content Scraping?

O que é a Blog Content Scraping?

Blog Content Scraping é um ato geralmente realizado com scripts que extraem o conteúdo de várias fontes e puxando-o para algum site. É tão fácil agora, que qualquer um pode instalar um site WordPress, colocar um tema livre ou comercial e instalar alguns plugins que vão fazer Content Scraping (Raspagem de Conteúdo) de blogs selecionados, para que possa ser publicado em seu site.

Por que estão roubando meu conteúdo?

Alguns usuários têm perguntado por que alguns estão roubando seu conteúdo? A resposta é simples, porque você é IMPRESSIONANTE. A verdade é que estes Content Scrapers têm segundas intenções. Abaixo estão apenas algumas das razões por que alguém iria roubar o seu conteúdo:

  • Comissão de afiliados – Há alguns marketeiros afiliados por aí que só querem explorar o sistema para fazer algum dinheiro extra. Eles vão usar o seu conteúdo e conteúdo de outros para trazer tráfego para o seu site através dos motores de busca. Estes sites são geralmente direcionados para um nicho específico, por isso eles têm produtos relacionados ao que estão promovendo.
  • Geração de Leads – Muitas vezes nós vemos advogados e corretores de imóveis que fazem isso. Eles querem parecer-se com líderes da indústria em suas pequenas comunidades. Eles não têm estrtutura para a produção de conteúdo de qualidade, por isso roubam o conteúdo de outras fontes. Às vezes, eles nem sequer estão conscientes disso, porque estão pagando algum &%[email protected]# para adicionar conteúdo e ajudá-los a obter um melhor SEO.
  • Receita com Publicidade – Algumas pessoas só querem criar um “hub” de conhecimento. Um one-stop-shop para os usuários em um nicho específico. Muitas vezes, percebemos que o nosso conteúdo do site está sendo roubado. O Scraper sempre responde: “Eu estava fazendo isso para o bem da comunidade”. Exceto seu site, recheado com anúncios.

Estas são apenas algumas das razões por que alguém roubaria seu conteúdo.

Como Bloquear Content Scrapers?

Bloquear Content Scrapers é uma tarefa tediosa e pode exigir um bom tempo. Mas, falaremos sobre algumas maneiras que você pode utilizar para bloquear Content Scrapers:

Pesquisa do Google com o seu post Títulos

Este método provavelmente não vale muito a pena, especialmente se você estiver escrevendo sobre um tema muito popular.

Trackbacks

Se você adicionar links internos em seus Posts, vai notar um trackback se algum site roubar o seu conteúdo. Desta forma, praticamente, os Scrapers estão dizendo que estão roubando seu conteúdo. Se você estiver usando o plugin Akismet, então muitas desses trackbacks vão aparecer na pasta de SPAM. Mais uma vez, isto só irá funcionar se você tiver links internos em seus posts.

Ferramentas do Google para webmasters

Se você usar Google Webmaster Tools, então provavelmente você estará ciente dos links para seu site. Se você olhar em “Tráfego de Pesquisa”, você verá a página “Links para seu Site”. As possibilidades são de seus Scrapers estarem entre os top lá. Eles terão centenas, se não milhares de links para suas páginas (considerando que você tenha links internos).

Links para Seu Site

Uso Incomum do FeedBurner

Se você fez a configuração do Feedburner para o seu blog WordPress, então você poderá ver alguns usos incomuns. Na guia “Analyse” em Feed Stats, você vai ver “Uncommon Uses”. Lá você verá uma lista de sites.

Feedburner > Analyze > Uncommon Uses

Como lidar com raspadores conteúdo

Existem algumas abordagens que as alguns tomam quando se lida com Content Scrapers. A Abordagem do Nada, Mate todos eles abordagem, aproveitá-las abordagem.

Abordagem do Não Fazer Nada

Esta é, de longe, a abordagem mais simples que você pode tomar. Normalmente, os blogueiros mais populares recomendam isso porque lutam há bastante tempo contra os Scrapers. Esta abordagem simplesmente recomenda que “em vez de combatê-los, gaste seu tempo produzindo ainda mais conteúdo de qualidade e se divertindo”. Agora, obviamente, se é um blog conhecido como Smashing Magazine, CSS-Tricks, Problogger, ou outros, então eles não têm que se preocupar com isso. Eles são sites de autoridade aos olhos do Google.

Abordagem Acabe com todos Eles

O exato oposto da “Abordagem do Não Fazer Nada”. Nesta abordagem, basta contatar o Scraper e pedir-lhes para remover seu conteúdo. Se eles se recusarem a fazê-lo ou simplesmente não responderem aos seus pedidos, então você pode registrar um DMCA (Digital Millennium Copyright Act), com seu Host. Mas, a maioria dos sites de Scraping não tem um formulário de contato disponível. Se tiverem, então utilize-o. Se eles não têm um formulário de contato, então você precisa fazer um Whois Lookup ou Consulta no Registro.br. Assim, Você poderá ver as informações de contato sobre o contato administrativo. Normalmente, o contato administrativo e técnico é o mesmo. O whois mostra também o registro de domínio. A maioria das empresas bem conhecidas web de hospedagem e registro de domínios têm formulários ou e-mails DMCA. Por exemplo, a HostGator tem um formulário para reclamações DMCA. Se o nameserver é algo como “ns1.dominioproprio.com“, então você tem que cavar mais fundo, fazendo pesquisas de IP reverso e em busca de IPs.

Jeff Starr em seu artigo sugere que você deve bloquear IPs desses caras. Acesse seus logs para seus IPs, e depois bloqueie-o com algo parecido com isso no seu .htaccess principal (do diretório raiz):

Deny from 123.456.789

Você também pode redirecioná-los para uma feed falsa, fazendo algo parecido com isto:

RewriteCond %{REMOTE_ADDR} 123\.456\.789\.
RewriteRule .* http://feedfalsa.com/feed [R,L]

Você pode ser realmente criativo como o Jeff sugere. Enviá-los para um texto realmente grande com Lorem Ipsum. Você pode enviar-lhes algumas imagens repugnantes de coisas ruins. Você também pode enviá-los de volta para seu próprio servidor, causando um loop infinito que irá travar o seu site.

A última abordagem à tomar é tirar proveito deles.

Como tirar proveito de Content Scrapers

Recomendamos esta abordagem para lidar com Content Scrapers. Ela ajuda o nosso SEO, bem como pode ajudar a fazer dinheiro extra. A maioria dos Scrapers usam suas Feeds RSS para roubar o seu conteúdo. Então, essas são algumas das coisas que você pode fazer:

  • Linkagem Interna – Com o recurso de linkagem interna do WordPress 3.1, fica mais fácil do que nunca. Quando você tem links internos no seu artigo, eles ajudam a aumentar pageviews e reduzir a taxa de rejeição em seu próprio site . Em segundo lugar, você recebe backlinks das pessoas que estão roubando o seu conteúdo. Por fim, permite que você roube sua audiência. Se você é um blogueiro talentoso, então você entende a arte de “linkagem” interna. Você tem que colocar seus links em palavras-chave interessantes. Torná-las tentadoras para que o usuário clique nelas. Se você fizer isso, então a audiência do Scraper vai também clicar nos links. Só assim, você leva um visitante do seu site e os traz de volta para onde eles deveriam estar desde o início.
  • Auto Link de Palavras-chave com Links de afiliados – Existem alguns plugins como Ninja Affiliate e o SEO Smart Links que substituem automaticamente palavras-chave atribuídas com links de afiliados. Por exemplo: HostGator, StudioPress, Gravity Forms << Todos estes serão automaticamente substituídos por links de afiliados quando este post for publicado.
  • Seja criativo no Rodapé das Feeds RSS – Você pode usar o Plugin RSS Footer ou o WordPress SEO by Yoast para adicionar itens personalizados para o seu rodapé RSS. Você pode adicionar qualquer coisa que você quiser nele. Sabemos que há algumas pessoas que gostam de promover os seus próprios produtos para os seus leitores de RSS. Então, eles adicionam banners. Adivinha… agora os banners aparecerão no site do Scrapers também. Você pode adicionar pequenos avisos no rodapé dos seus posts nas suas Feeds RSS. Ele simplesmente lê algo como: “Como colocar o WordPress em Somente Leitura para Migrações e Manutenção é um post de WP24Horas, que não é permitido ser copiado em outros sites“. Ao fazer isso, temos um backlink para o artigo original a partir do site do Scraper que permite que o Google e outros motores de busca saibam que nós somos autoridade. Ele também permitem que seus usuários saibam que o site está roubando nosso conteúdo. Se você é bom com os códigos, então você pode ficar totalmente maluco. Tal como a adição de posts relacionados apenas para os seus leitores de RSS, e monte de outras coisas. Confira nosso guia sobre Como adicionar conteúdo e manipular completamente as Feeds RSS do WordPress.

Como você pode reduzir o Blog Content Scraping e possivelmente evitá-lo

Considerando-se que você tome a abordagem de tirar proveito do Content Scraping e faça linkagem interna, acrescente links de afiliados, banners, as chances são de que você irá reduzir bastante o Scraping. Se você aceitar e executar a sugestão do Jeff Starr de redirecionar scrapers de conteúdo, também reduzirá bastante. Além do que compartilhamos acima, existem alguns outros truques que você pode usar.

Feed RSS Completa vs. Resumida

Existe um debate na comunidade de blogs sobre ter feed RSS completas ou resumidas. Nós não vamos entrar em muitos detalhes sobre esse debate, no entanto, uma das vantagens de ter um apenas uma feed RSS Resumida, é que você evita bastante Content Scraping. Você pode alterar as configurações em Configurações > Leitura do seu painel administrativo do WordPress. Em seguida, mude a configuração “Para cada post em um feed, mostrar”: Resumo.

Nota: Temos Feeds completas porque nos preocupamos mais com os nossos leitores de RSS do que com os Spammers.

Trackback SPAM

Trackbacks e Pingbacks definitivamente tinham grande usabilidade, no entanto, agora estão sendo constantemente abusados. Muitas vezes, temas exibem trackbacks e pingbacks sob ou entre os comentários. Isto dá ao spammer um incentivo para roubar seu site e enviar trackbacks. Se, por engano o aprovar, então eles ficam com um backlink e menção a partir de seu site. Veja como desativar Trackbacks em todas os próximos Posts. Veja também um artigo que irá mostrar-lhe como desativar trackbacks e pings nos posts existentes.

Content Scraping é sempre bom?

Pode ser. Se você ver que você está fazendo dinheiro com o site do Scraper, então tudo bem, pode ser. Se você vê bastante tráfego do site de um Scraper, então pode ser também. Na maioria dos casos, no entanto, não é bom. Você deve sempre tentar conseguir que seu conteúdo seja retirado. Mas você vai perceber que, conforme o seu blog fica maior, é quase impossível manter o controle de todos os scrapers de conteúdo. Mesmo enviando reclamações DMCA, sabemos que existem milhares de outros sites que roubam conteúdo e que nós, simplesmente, não conseguimos acompanhar.

O que você pensa a respeito? Você usa outros mecanismos para evitar Content Scraping? Gostaríamos de ler seus comentários.

Deixe seu comentário aqui...

O seu endereço de e-mail não será publicado.

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.

Nosso site usa cookies e, portanto, coleta informações sobre sua visita para melhorar nosso site (por meio de análise), mostrar a você conteúdo de mídia social e anúncios relevantes. Por favor, consulte nossa página Termos & Políticas para mais detalhes ou concorde clicando no botão 'Aceitar'. OBS: Ao continuar a navegação, você, automaticamente, concorda.

Configurações de Cookies

Abaixo, você pode escolher os tipos de cookies que quer permitir neste site. Clique no botão "Salvar Configurações de Cookies" para aplicar sua escolha.

FuncionalNosso site usa cookies funcionais. Esses cookies são necessários para permitir que nosso site funcione.

AnalíticoNosso site usa cookies analíticos para permitir a análise de nosso site e a otimização para o propósito de a.o. a usabilidade.

Mídia SocialNosso site coloca cookies de mídia social para mostrar conteúdo de terceiros, como YouTube e Facebook. Esses cookies podem rastrear seus dados pessoais.

PublicidadeNosso site coloca cookies de publicidade para mostrar anúncios de terceiros com base em seus interesses. Esses cookies podem rastrear seus dados pessoais.

OutrosNosso site coloca cookies de terceiros de outros serviços que não são analíticos, mídia social ou publicidade.