Pular para o conteúdo principal
🇧🇷
robots.txt AI Crawlers Shopify

robots.txt do Shopify para crawlers de IA: checklist prático

Configure o robots.txt do Shopify para permitir os crawlers de IA certos (GPTBot, ClaudeBot, PerplexityBot) sem expor páginas de checkout.

2 min read

O robots.txt do Shopify herda padrões razoáveis, mas esses padrões foram escritos antes da era dos crawlers de IA. Se você quer que GPTBot, ClaudeBot e PerplexityBot indexem suas páginas de produto — e deixar os spam crawlers de fora — precisa configurar o arquivo manualmente.

O que configurar

Em Online Store → Themes → Edit code → robots.txt.liquid, controle:

  • Allow para User-agent: GPTBot, ChatGPT-User, ClaudeBot, PerplexityBot, Google-Extended, OAI-SearchBot, Amazonbot
  • Disallow páginas privadas: /checkout, /account, /cart, /admin, /search?, parâmetros UTM canônicos
  • Permitir páginas de produto, coleção, blog e políticas
  • Sitemap: linha apontando para /sitemap.xml

Se você usa Shopify Markets ou domínios internacionais, replique a configuração por domínio.

Checklist de validação

  1. Teste com user-agent: curl -A "GPTBot" https://yourstore.com/robots.txt deve retornar 200 e mostrar o robots.txt customizado.
  2. Bloqueio de checkout: curl -A "GPTBot" https://yourstore.com/checkout deve ser disallowed (ou retornar disallow no robots.txt).
  3. Sitemap acessível: curl https://yourstore.com/sitemap.xml retorna XML válido.
  4. Sem Disallow: / para nenhum bot legítimo (erro comum: bloquear tudo por engano).
  5. Search Console: Crawl Errors mostra 0 issues após mudanças.

Erros frequentes

  • Copiar regras do site antigo sem ajustar paths atuais.
  • Bloquear /products/ por engano enquanto tenta bloquear admin.
  • Esquecer Google-Extended (versão dedicada para AI training do Googlebot).
  • Não atualizar quando o tema muda — robots.txt.liquid pode ser sobrescrito.
  • Confiar só no robots.txt para privacidade — checkout deve ter proteção real, não apenas Disallow.

Diferença robots.txt vs llms.txt

  • robots.txt: o que crawlers podem visitar.
  • llms.txt: quais URLs você quer que LLMs priorizem para entendimento.

Os dois trabalham juntos. robots.txt é o gate, llms.txt é o mapa curado.

Próximos passos

Após robots.txt limpo, gere e publique llms.txt apontando para coleções principais, FAQ, políticas e guias de compra. Reaudite mensalmente quando você troca tema, instala apps ou muda estrutura de URLs.

Related Articles

Shopify AI SEO AI Crawlers

The Rise of AI Crawlers: A Guide for Website and Shopify Store Owners

As artificial intelligence reshapes how we find and consume information, a new class of web crawlers has emerged: AI crawlers. These intelligent agents are the data-gathering arms of AI models like ChatGPT, Perplexity, and Google's Gemini. Understanding how they work, how they differ from traditional crawlers like Googlebot, and how to optimize your site for them is becoming critical for digital visibility and success.

Vincent Vincent
Leia mais