# robots.txt — ninolegal.com
# Última actualización: 2026-05-11

Sitemap: https://ninolegal.com/sitemap.xml
Sitemap: https://ninolegal.com/blog/rss.xml

# Archivos de descubrimiento para agentes de IA:
# https://ninolegal.com/llms.txt
# https://ninolegal.com/llms-full.txt

# === Política general ===
User-agent: *
Allow: /
Disallow: /admin/
Disallow: /api/
Disallow: /auth/
Disallow: /dashboard/

# === Crawlers de IA permitidos explícitamente ===
# Indexan contenido para búsqueda generativa y citas en respuestas IA.

# OpenAI
User-agent: GPTBot
Allow: /

User-agent: OAI-SearchBot
Allow: /

User-agent: ChatGPT-User
Allow: /

# Anthropic
User-agent: ClaudeBot
Allow: /

User-agent: Claude-Web
Allow: /

User-agent: anthropic-ai
Allow: /

# Google AI
User-agent: Google-Extended
Allow: /

# Perplexity
User-agent: PerplexityBot
Allow: /

User-agent: Perplexity-User
Allow: /

# Common Crawl
User-agent: CCBot
Allow: /

# Apple
User-agent: Applebot-Extended
Allow: /

# Meta
User-agent: Meta-ExternalAgent
Allow: /

User-agent: Meta-ExternalFetcher
Allow: /

# Amazon
User-agent: Amazonbot
Allow: /

# Cohere
User-agent: cohere-ai
Allow: /

# You.com
User-agent: YouBot
Allow: /

# Mistral
User-agent: MistralAI-User
Allow: /

# === Crawlers no deseados ===
# Bytespider tiene historial documentado de ignorar robots.txt.
# Se documenta aquí la intención de exclusión.
User-agent: Bytespider
Disallow: /