Bots y crawlers de IA

Estos son los robots que leen tu web para alimentar a ChatGPT, Gemini, Perplexity y compañía. Si los bloqueas, tu negocio desaparece de sus respuestas.

OpenAI

BotTipoQué hace
GPTBotEntrenamientoRecopila contenido público para entrenar los modelos de IA de OpenAI, como los que usa ChatGPT.
ChatGPT-UserAcción de usuarioVisita tu web en directo cuando un usuario de ChatGPT pide información que requiere consultar tu página.
OAI-SearchBotBúsquedaIndexa webs para que aparezcan como resultados y enlaces en la búsqueda de ChatGPT.

Anthropic

BotTipoQué hace
ClaudeBotEntrenamientoRecopila contenido público para entrenar y mejorar los modelos Claude de Anthropic.
Claude-UserAcción de usuarioAccede a tu web en directo cuando un usuario de Claude hace una pregunta que requiere consultarla.
Claude-SearchBotBúsquedaIndexa contenido web para mejorar la calidad y relevancia de los resultados de búsqueda de Claude.

Google

BotTipoQué hace
GooglebotMixtoRastrea la web para la búsqueda de Google, incluidos los resúmenes con IA (AI Overviews).
Google-ExtendedEntrenamientoToken de control en robots.txt que decide si tu contenido puede usarse para entrenar los modelos Gemini de Google.
GoogleOtherMixtoRastreador genérico que los equipos de producto de Google usan para descargar contenido público con fines diversos, incluida investigación y desarrollo de IA.

Perplexity

BotTipoQué hace
PerplexityBotBúsquedaIndexa webs para mostrarlas y enlazarlas en los resultados de búsqueda de Perplexity.
Perplexity-UserAcción de usuarioVisita tu web en directo cuando un usuario hace una pregunta en Perplexity que requiere consultar tu página.

Microsoft

BotTipoQué hace
BingbotMixtoRastrea la web para el buscador Bing y alimenta también las respuestas de Microsoft Copilot.

Meta

BotTipoQué hace
Meta-ExternalAgentEntrenamientoRastrea la web para entrenar los modelos de IA de Meta (Llama) y para indexar contenido en sus productos.
Meta-ExternalFetcherAcción de usuarioDescarga enlaces concretos que piden los usuarios y asiste a las capacidades agénticas de la IA de Meta.

Apple

BotTipoQué hace
ApplebotBúsquedaRastrea la web para las funciones de búsqueda de Apple: Siri, Spotlight y sugerencias de Safari.
Applebot-ExtendedEntrenamientoToken de control que decide si Apple puede usar tu contenido para entrenar los modelos de Apple Intelligence.

Amazon

BotTipoQué hace
AmazonbotMixtoRastrea la web para mejorar productos y servicios de Amazon, como las respuestas de Alexa, y puede usarse para entrenar sus modelos de IA.

ByteDance

BotTipoQué hace
BytespiderEntrenamientoRecopila contenido web de forma masiva para entrenar los modelos de IA de ByteDance, la empresa de TikTok y Doubao.

Common Crawl

BotTipoQué hace
CCBotEntrenamientoCrea un archivo abierto de la web que sirve de base de entrenamiento para muchos modelos de IA.

Cohere

BotTipoQué hace
cohere-training-data-crawlerEntrenamientoRecopila contenido web público para entrenar los modelos de lenguaje de Cohere, orientados a empresas.

Mistral AI

BotTipoQué hace
MistralAI-UserAcción de usuarioVisita tu web cuando un usuario de Vibe, el asistente de Mistral, hace una pregunta que requiere consultarla.

DuckDuckGo

BotTipoQué hace
DuckAssistBotBúsquedaRecoge contenido para DuckAssist, las respuestas generadas con IA del buscador DuckDuckGo.

You.com

BotTipoQué hace
YouBotBúsquedaDescubre e indexa páginas web para que el buscador y los asistentes de IA de You.com den respuestas actualizadas.

Diffbot

BotTipoQué hace
DiffbotMixtoExtrae datos estructurados de páginas web para construir una base de conocimiento que usan empresas y sistemas de IA.

Allen Institute for AI

BotTipoQué hace
AI2BotEntrenamientoRecopila documentos web para crear datasets abiertos con los que entrenar y evaluar modelos de lenguaje de Ai2.

xAI

BotTipoQué hace
GrokBotMixtoRecupera contenido web para Grok, el asistente de IA de xAI integrado en X (antes Twitter).

Huawei

BotTipoQué hace
PetalBotMixtoRastrea la web para Petal Search, el buscador de Huawei, y los servicios de su ecosistema.

Hive

BotTipoQué hace
ImagesiftBotMixtoRecopila imágenes públicas y su contexto para los productos de inteligencia web e IA de Hive.