# robots.txt — ninolegal.com # Última actualización: 2026-05-11 Sitemap: https://ninolegal.com/sitemap.xml Sitemap: https://ninolegal.com/blog/rss.xml # Archivos de descubrimiento para agentes de IA: # https://ninolegal.com/llms.txt # https://ninolegal.com/llms-full.txt # === Política general === User-agent: * Allow: / Disallow: /admin/ Disallow: /api/ Disallow: /auth/ Disallow: /dashboard/ # === Crawlers de IA permitidos explícitamente === # Indexan contenido para búsqueda generativa y citas en respuestas IA. # OpenAI User-agent: GPTBot Allow: / User-agent: OAI-SearchBot Allow: / User-agent: ChatGPT-User Allow: / # Anthropic User-agent: ClaudeBot Allow: / User-agent: Claude-Web Allow: / User-agent: anthropic-ai Allow: / # Google AI User-agent: Google-Extended Allow: / # Perplexity User-agent: PerplexityBot Allow: / User-agent: Perplexity-User Allow: / # Common Crawl User-agent: CCBot Allow: / # Apple User-agent: Applebot-Extended Allow: / # Meta User-agent: Meta-ExternalAgent Allow: / User-agent: Meta-ExternalFetcher Allow: / # Amazon User-agent: Amazonbot Allow: / # Cohere User-agent: cohere-ai Allow: / # You.com User-agent: YouBot Allow: / # Mistral User-agent: MistralAI-User Allow: / # === Crawlers no deseados === # Bytespider tiene historial documentado de ignorar robots.txt. # Se documenta aquí la intención de exclusión. User-agent: Bytespider Disallow: /