¿Un complemento de WordPress para eliminar todo legalmente?

Los complementos de WordPress son geniales, es un verdadero placer, ¡hay algo para todo y para todos! Los buenos, los muy buenos así como los malos y a veces los malos … El que les contaré a continuación es un excelente complemento que se usa incorrectamente puede ser extremadamente dañino.

INTRO: El plagiario y yo

Lo primero es lo primero, recientemente descubrí un plagiario endiabladamente eficiente que raspa todos los artículos de WPFormation (y muchos más) dentro de los 15 minutos posteriores a la publicación. Raspar es asombroso, todo está ahí: imágenes, formato, enlaces truncados… En fin, ¡el total!

Artículo original publicado en WPFormation

Artículo original publicado en WPFormation

La copia raspada de WPFormation 15 minutos después

La copia raspada de WPFormation 15 minutos después

Con no menos de 40 plagios de artículos de WPFormation, este plagiario usa su sitio www.cnews.ga para generar tráfico artificial y enviar enlaces truncados, que al final son solo enlaces de afiliados vulgares a WPEngine.

Descubrí a este plagiario gracias al excelente https://www.killduplicate.com. Al principio intenté contactar con la fotocopiadora, sin éxito. Luego me comuniqué con WPEngine quien, a pesar del plagio obvio, me envió un archivo DMCA completo para completar (en otras palabras, iba a pasar el día allí). Ok, nos olvidamos …

Ok no importa, intentaremos ver cómo lo hace y simplemente bloquearemos a este bribón. Después de un bloqueo de la IP del sitio y las IP de WPEngine, nada ayuda, tan pronto como publico un artículo sobre WPFormation, inevitablemente lo encuentro en el sitio del plagiario 15 minutos después ^^ Pero, ¿cómo lo hace?

¡Un complemento que puede DESCARGAR casi cualquier cosa!

El complemento que le permite eliminar cualquier tipo de contenido es Complemento automático de WordPress.

Puede eliminar y publicar artículos específicos como : Amazon, Clickbank, productos de Walmart, videos de Youtube, Vimeo, DailyMotion, feeds RSS, subastas de eBay, imágenes parpadeantes, Instagram, Pinterest, Reddits, tweets, publicaciones de Facebook, anuncios de Craigslist, pero también aplicaciones Itunes (canciones, libros electrónicos, películas, podcasts), elementos de Envato y SoundCloud, todo en modo de piloto automático.

complemento automático wp

Yo estaba absolutamente asombrado por el poder de este complemento y su capacidad para copiar casi cualquier cosa. Si te digo que además, es capaz de usar proxies (en caso de que quieras bloquear la IP de su servidor), que puede truncar enlaces, reemplazar cierto contenido, girar, excluir, filtrar, etc … claramente, ¡Te resultará difícil contrarrestarlo!

BUENAS razones para usar este complemento 🙂

No todo es para tirar en este complemento, no es fundamentalmente malo. Es el uso que se puede hacer de ella. Podríamos desechar perfectamente los productos de Amazon o Clickbank, subastas de eBay con este complemento para realizar la afiliación.

También podría usarse para hacer un mire a través de RSS y publique un extracto respetando los derechos de autor (extensión del extracto, menciones, enlace al sitio original).

En resumen, una gran herramienta en un mundo de personas que se respetan a sí mismas y respetan los derechos y el trabajo de los demás.

MALAS razones para usar este complemento: – /

Desafortunadamente, nuestro mundo no es el de los osos cariñosos y el sitio www.cnews.ga me lo recordó. Mal uso e intencionalmente, El complemento automático de WordPress puede raspar completamente su sitio de WordPress y todos tus artículos cariñosos con el sudor de tus deditos.

De hecho, el complemento puede extraer de sus fuentes RSS y copiar todo el contenido (texto, imágenes, videos, enlaces). Pero eso no es todo, también puedo truncar tus enlaces, reemplazar la mención de la fuente y así sucesivamente …

¡Esto es exactamente lo que hizo el sitio gabonés que plagió WPFormation!

Como funciona ?

Lo que es más asombroso y también más preocupante es que es increíblemente fácil de usar y que se puede configurar en modo “piloto automático” en tan solo unos minutos.

Para mostrarte la «bestia» en acción, me permití rastrear temporalmente los sitios de mis amigos. Creanico y Julio. (Nota: Gracias chicos, el contenido raspado se eliminó inmediatamente y el tutorial se envió a su respectivo Skype;)

Así es como pude raspar 2 sitios en menos de 5 millones:

¿Cómo protegerse de esto?

Si el usuario realmente está buscando eliminar su sitio, tomará los pasos necesarios y usará la opción de proxy para evitar cualquier bloqueo de IP. Pero tenga la seguridad de que hay una manera de evitar que el complemento automático de WordPress robe su contenido;)

Lo primero que debe hacer es identificar la fotocopiadora., para hacer esto, use herramientas de búsqueda de plagio como Kill-duplicate, Duplicate Content de Positeo o incluso Plagiarisma.net.

matar duplicado

Luego, en su «access.log» encuentra la dirección IP que raspas, en general “escribe” la primera vez en el artículo y una vez por cada imagen de esta última con el mismo “Usuario-Agente” y la misma IP, como puedes verlo aquí :

104.197.119.71 - - [24/May/2017:10:00:09 +0200] "GET /wp-content/uploads/2017/05/sachant-WordPress-1024x512.jpg HTTP/1.1" 200 68568 "https://wpformation.com" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.8) Gecko/2009032609 Firefox/3.0.8"
104.197.119.71 - - [24/May/2017:10:00:10 +0200] "GET /wp-content/uploads/2017/05/Fotolia_152984051_S-300x225.jpg HTTP/1.1" 200 7152 "https://wpformation.com" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.8) Gecko/2009032609 Firefox/3.0.8"
104.197.119.71 - - [24/May/2017:10:00:10 +0200] "GET /wp-content/uploads/2017/05/Fotolia_80868341_S-300x200.jpg HTTP/1.1" 200 12079 "https://wpformation.com" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.8) Gecko/2009032609 Firefox/3.0.8"
104.197.119.71 - - [24/May/2017:10:00:10 +0200] "GET /wp-content/uploads/2017/05/no-300x180.jpg HTTP/1.1" 200 5393 "https://wpformation.com" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.8) Gecko/2009032609 Firefox/3.0.8"
104.197.119.71 - - [24/May/2017:10:00:10 +0200] "GET /wp-content/plugins/bloom/images/premade-image-21.png HTTP/1.1" 200 9598 "https://wpformation.com" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.8) Gecko/2009032609 Firefox/3.0.8"

Luego verifique si el raspador usa el complemento Complemento automático de WordPress, es bastante fácil de ver a través del código fuente (busque / wp-automatic /) o con herramientas como whatwpthemeisthat.com o wpthemedetector.com.

codificado

Finalmente, bloquea la IP de este sitio pero si usa proxies especialmente necesitará bloquear el «User-Agent», porque sí el plugin deja un rastro claro de su paso. Entonces, al identificar a este usuario-agente, puede prohibirlo en su WordPress. El agente de usuario que se debe bloquear para protegerse contra la eliminación del complemento automático de WordPress es actualmente Gecko / 2009032609 Firefox / 3.0.8.

Y sí, fíjate que digo “actualmente” porque si indagamos un poco (con algún conocimiento de todos modos), es posible cambiar el agente de usuario de WordPress Automático: / No explicaré aquí cómo hacerlo por razones obvias …

Para bloquear a un usuario-agente puede usar un tipo de complemento de seguridad WordFence (Bloqueo >> Bloqueo avanzado >> Usuario-Agente (navegador) que coincide), o tu .htaccess.

valla de palabras

Y aquí está la regla exacta para su .htaccess:

SetEnvIfNoCase User-Agent "Gecko/2009032609 Firefox/3.0.8" bad_ua
Deny from env=bad_ua

Por mi parte y con la preciosa ayuda de Benedicto, nosotros tenemos compró el complemento para hacer pruebas, ver el código y protegerse si el desarrollador cambiara su modo de desecho. También contacté a este último para decirle que ciertas prácticas eran simplemente detestables. ¡Espera mira!

Edición del 30/05/2017 : El autor respondió y planea configurar una clave meta para proteger los sitios de WordPress que no quieren ser raspados.

respuesta del autor

También notamos que si aplica el «Carga lenta”En sus imágenes, el complemento tiene más dificultades para recuperarlas, aunque tiene una opción para contrarrestar esto;)

En WPFormation, bloqueamos el complemento a través de WordFence y .htaccess. Aprovechamos para preparar una regla Nginx para todos los servidores de Servidor WP para proteger a nuestros clientes.

Para concluir…

Sigo dividido y estoy muy mezclado con este complemento. Si debo admitir que estoy asombrado por su desempeño y sus múltiples posibilidades, el uso que se ha hecho contra WPFormation me deja con un sabor amargo. Al profundizar un poco en el tema y en la web, el uso de este complemento es conocido y reconocido, algunos no dudan en utilizar proxies para fines detestables.

Lo curioso (bueno, forma de hablar), siempre y cuando te interese el tema, es que puedes encontrar otros muy fácilmente: https://codecanyon.net/item/scrapes-web- scraper-plugin-for-wordpress / y casualmente, WordPress especializado: /

Sin embargo, bien utilizado y respetando los derechos de autor, este complemento le permitirá simplificar su seguimiento, su intercambio, su afiliación …