Question 1

¿Debo bloquear a Diffbot?

Accepted Answer

No es recomendable. Sus datos estructurados acaban en herramientas de empresas y sistemas de IA que pueden mostrar tu negocio. Estar bien representado en su base de conocimiento juega a tu favor.

Question 2

¿Diffbot respeta el robots.txt?

Accepted Answer

Parcialmente. Sus rastreos masivos (Crawl) respetan robots.txt según su documentación oficial, incluidas las directivas disallow y crawl-delay; pero las extracciones de URLs concretas pedidas por clientes pueden procesarse aunque exista bloqueo.

Question 3

¿Cómo sé si Diffbot visita mi web?

Accepted Answer

Busca "Diffbot" en los logs de tu servidor. Su user-agent incluye un enlace a la documentación de su rastreador que permite identificarlo sin dudas.

Diffbot

Cómo permitirlo en tu robots.txt

Cómo bloquearlo (no recomendado)

Preguntas frecuentes

¿Debo bloquear a Diffbot?

¿Diffbot respeta el robots.txt?

¿Cómo sé si Diffbot visita mi web?

Recursos relacionados

Los bots ya leen tu web. ¿Sabes qué dice la IA de tu negocio?