AI bots & crawlers

These are the robots that read your website to feed ChatGPT, Gemini, Perplexity and friends. Block them and your business disappears from their answers.

OpenAI

BotTypeWhat it does
GPTBotTrainingRecopila contenido público para entrenar los modelos de IA de OpenAI, como los que usa ChatGPT.
ChatGPT-UserUser actionVisita tu web en directo cuando un usuario de ChatGPT pide información que requiere consultar tu página.
OAI-SearchBotSearchIndexa webs para que aparezcan como resultados y enlaces en la búsqueda de ChatGPT.

Anthropic

BotTypeWhat it does
ClaudeBotTrainingRecopila contenido público para entrenar y mejorar los modelos Claude de Anthropic.
Claude-UserUser actionAccede a tu web en directo cuando un usuario de Claude hace una pregunta que requiere consultarla.
Claude-SearchBotSearchIndexa contenido web para mejorar la calidad y relevancia de los resultados de búsqueda de Claude.

Google

BotTypeWhat it does
GooglebotMixedRastrea la web para la búsqueda de Google, incluidos los resúmenes con IA (AI Overviews).
Google-ExtendedTrainingToken de control en robots.txt que decide si tu contenido puede usarse para entrenar los modelos Gemini de Google.
GoogleOtherMixedRastreador genérico que los equipos de producto de Google usan para descargar contenido público con fines diversos, incluida investigación y desarrollo de IA.

Perplexity

BotTypeWhat it does
PerplexityBotSearchIndexa webs para mostrarlas y enlazarlas en los resultados de búsqueda de Perplexity.
Perplexity-UserUser actionVisita tu web en directo cuando un usuario hace una pregunta en Perplexity que requiere consultar tu página.

Microsoft

BotTypeWhat it does
BingbotMixedRastrea la web para el buscador Bing y alimenta también las respuestas de Microsoft Copilot.

Meta

BotTypeWhat it does
Meta-ExternalAgentTrainingRastrea la web para entrenar los modelos de IA de Meta (Llama) y para indexar contenido en sus productos.
Meta-ExternalFetcherUser actionDescarga enlaces concretos que piden los usuarios y asiste a las capacidades agénticas de la IA de Meta.

Apple

BotTypeWhat it does
ApplebotSearchRastrea la web para las funciones de búsqueda de Apple: Siri, Spotlight y sugerencias de Safari.
Applebot-ExtendedTrainingToken de control que decide si Apple puede usar tu contenido para entrenar los modelos de Apple Intelligence.

Amazon

BotTypeWhat it does
AmazonbotMixedRastrea la web para mejorar productos y servicios de Amazon, como las respuestas de Alexa, y puede usarse para entrenar sus modelos de IA.

ByteDance

BotTypeWhat it does
BytespiderTrainingRecopila contenido web de forma masiva para entrenar los modelos de IA de ByteDance, la empresa de TikTok y Doubao.

Common Crawl

BotTypeWhat it does
CCBotTrainingCrea un archivo abierto de la web que sirve de base de entrenamiento para muchos modelos de IA.

Cohere

BotTypeWhat it does
cohere-training-data-crawlerTrainingRecopila contenido web público para entrenar los modelos de lenguaje de Cohere, orientados a empresas.

Mistral AI

BotTypeWhat it does
MistralAI-UserUser actionVisita tu web cuando un usuario de Vibe, el asistente de Mistral, hace una pregunta que requiere consultarla.

DuckDuckGo

BotTypeWhat it does
DuckAssistBotSearchRecoge contenido para DuckAssist, las respuestas generadas con IA del buscador DuckDuckGo.

You.com

BotTypeWhat it does
YouBotSearchDescubre e indexa páginas web para que el buscador y los asistentes de IA de You.com den respuestas actualizadas.

Diffbot

BotTypeWhat it does
DiffbotMixedExtrae datos estructurados de páginas web para construir una base de conocimiento que usan empresas y sistemas de IA.

Allen Institute for AI

BotTypeWhat it does
AI2BotTrainingRecopila documentos web para crear datasets abiertos con los que entrenar y evaluar modelos de lenguaje de Ai2.

xAI

BotTypeWhat it does
GrokBotMixedRecupera contenido web para Grok, el asistente de IA de xAI integrado en X (antes Twitter).

Huawei

BotTypeWhat it does
PetalBotMixedRastrea la web para Petal Search, el buscador de Huawei, y los servicios de su ecosistema.

Hive

BotTypeWhat it does
ImagesiftBotMixedRecopila imágenes públicas y su contexto para los productos de inteligencia web e IA de Hive.