Todos los bots de IA

AI2Bot

Allen Institute for AIEntrenamiento

AI2Bot es el rastreador del Allen Institute for AI (Ai2), una organización de investigación sin ánimo de lucro. Recoge páginas web para construir datasets abiertos, como Dolma, que sirven para entrenar y evaluar sus modelos de lenguaje de código abierto. Esos datasets los reutilizan después muchos otros proyectos de IA, así que estar en ellos amplía tu huella en el ecosistema.

User-agent
AI2BotMozilla/5.0 (compatible) AI2Bot (+https://www.allenai.org/crawler)
¿Respeta robots.txt?
Documentación oficial
https://allenai.org/crawler

Cómo permitirlo en tu robots.txt

User-agent: AI2Bot
Allow: /

Cómo bloquearlo (no recomendado)

User-agent: AI2Bot
Disallow: /

Preguntas frecuentes

¿Debo bloquear a AI2Bot?

No es recomendable. Sus datasets abiertos alimentan modelos de código abierto que usan miles de desarrolladores y productos. Permitirlo extiende el alcance de tu contenido en la IA sin coste para ti.

¿AI2Bot respeta el robots.txt?

Sí. Ai2 publica un aviso de rastreo oficial donde documenta su user-agent y confirma que puedes filtrar o rechazar su tráfico con las reglas estándar dirigidas a "AI2Bot".

¿Cómo sé si AI2Bot visita mi web?

Busca "AI2Bot" en los logs de tu servidor. Su user-agent incluye un enlace a allenai.org/crawler, la página oficial donde el instituto explica su funcionamiento.

Recursos relacionados

¿Sabes si estos bots ya leen tu web y qué dicen de ti? Haz el test gratis.

Hacer el test gratis