Vai al contenuto principale
🇮🇹
robots.txt AI Crawlers Shopify

robots.txt di Shopify per i crawler AI: checklist pratica

Configura il robots.txt di Shopify per consentire i crawler AI giusti (GPTBot, ClaudeBot, PerplexityBot) proteggendo checkout e account.

2 min read

Il robots.txt di Shopify eredita default ragionevoli, ma quei default sono stati scritti prima dell’era dei crawler AI. Se vuoi che GPTBot, ClaudeBot e PerplexityBot indicizzino le tue pagine prodotto — e tenere fuori gli spam crawler — devi configurare il file a mano.

Cosa configurare

In Online Store → Themes → Edit code → robots.txt.liquid controlla:

  • Allow per User-agent: GPTBot, ChatGPT-User, ClaudeBot, PerplexityBot, Google-Extended, OAI-SearchBot, Amazonbot
  • Disallow pagine private: /checkout, /account, /cart, /admin, /search?, parametri UTM
  • Permetti pagine prodotto, collezione, blog e policy
  • Sitemap: una riga che punta a /sitemap.xml

Se usi Shopify Markets o domini internazionali, replica la configurazione per dominio.

Checklist di validazione

  1. Test con user-agent: curl -A "GPTBot" https://yourstore.com/robots.txt deve tornare 200 e mostrare il robots.txt personalizzato.
  2. Blocco checkout: curl -A "GPTBot" https://yourstore.com/checkout deve essere disallow.
  3. Sitemap accessibile: curl https://yourstore.com/sitemap.xml ritorna XML valido.
  4. Nessun Disallow: / per bot legittimi (errore comune: bloccare tutto).
  5. Search Console: Crawl Errors mostra 0 problemi dopo le modifiche.

Errori frequenti

  • Copiare regole dal vecchio sito senza adeguare i path attuali.
  • Bloccare /products/ per sbaglio mentre si tenta di bloccare admin.
  • Dimenticare Google-Extended (variante AI training di Googlebot).
  • Non aggiornare al cambio tema — robots.txt.liquid può essere sovrascritto.
  • Affidarsi solo al robots.txt per la privacy — il checkout deve avere protezione reale, non solo Disallow.

Differenza robots.txt vs llms.txt

  • robots.txt: dove i crawler possono andare.
  • llms.txt: quali URL vuoi che gli LLM diano priorità per la comprensione.

I due lavorano insieme. robots.txt è il cancello, llms.txt è la mappa curata.

Prossimi passi

Dopo aver ripulito il robots.txt, genera e pubblica llms.txt che punta alle collezioni principali, FAQ, policy e guide all’acquisto. Riaudit ogni mese quando cambi tema, installi app o ristrutturi URL.

Related Articles

Shopify AI SEO AI Crawlers

The Rise of AI Crawlers: A Guide for Website and Shopify Store Owners

As artificial intelligence reshapes how we find and consume information, a new class of web crawlers has emerged: AI crawlers. These intelligent agents are the data-gathering arms of AI models like ChatGPT, Perplexity, and Google's Gemini. Understanding how they work, how they differ from traditional crawlers like Googlebot, and how to optimize your site for them is becoming critical for digital visibility and success.

Vincent Vincent
Leggi di più