Webzio-Extended
Webzio-Extended es uno de los dos rastreadores de Webz.io, una empresa que vende datos de la web a compañías de inteligencia artificial. Su función es actuar como filtro ético: analiza el contenido que recoge su bot compañero (Webzio) y determina si cada pieza está permitida para entrenar modelos de IA o no. Si tu web deja pasar a este rastreador, tu contenido puede acabar en los conjuntos de datos con los que se forman modelos comerciales de IA, lo que puede aumentar las probabilidades de que esos modelos reconozcan y mencionen tu negocio.
- User-agent
webzio-extendedwebzio-extended (+https://webz.io/bot.html)- ¿Respeta robots.txt?
- Sí
- Documentación oficial
- https://webz.io/blog/company/an-overview-of-the-webz-io-duo-of-crawlers/
Cómo permitirlo en tu robots.txt
User-agent: webzio-extended
Allow: /Cómo bloquearlo (no recomendado)
User-agent: webzio-extended
Disallow: /Preguntas frecuentes
¿Debo bloquear a Webzio-Extended?
Para un negocio que quiere ganar visibilidad en la IA, probablemente no. Este bot respeta el robots.txt, así que tú tienes el control. Bloquearlo significa que tu contenido no llega a los datos de entrenamiento que Webz.io vende a empresas de IA, lo que reduce las posibilidades de que esos modelos conozcan tu negocio.
¿Qué tiene que ver este bot con que mi negocio aparezca en respuestas de IA?
Webzio-Extended decide qué contenido queda marcado como apto para entrenar modelos de IA. Si tu web está bien escrita, es accesible y este bot la procesa, tu contenido puede formar parte de los datos con los que aprenden futuros modelos comerciales, lo que puede favorecer que mencionen tu marca cuando alguien haga una pregunta relacionada con lo que ofreces.
¿Cómo sé si Webzio-Extended visita mi web?
Revisa los registros (logs) de tu servidor o el panel de tu proveedor de hosting o CDN, por ejemplo Cloudflare. Busca el término 'webzio-extended' en el campo user-agent: cada visita de este bot quedará registrada con ese nombre.