# robots.txt Shopify : accès bots IA utiles
> Votre robots.txt Shopify bloque peut-etre ChatGPT et Perplexity. Comment distinguer bots de recherche, bots utilisateur, bots d'entraînement et validation publicitaire.
- Canonical HTML: https://verityscore.io/fr/kb/robots-crawlers/
- Markdown alternate: https://verityscore.io/fr/kb/robots-crawlers.md
- Language: fr
- Content type: kb
- Published: 2026-01-28
- Updated: 2026-05-07
- Tags: robots-txt, crawlers, gptbot, perplexitybot
- Audit zone: Robots.txt
## Pourquoi le robots.txt est critique

La configuration de votre fichier `robots.txt` à un impact direct sur l'accessibilité de votre store aux crawlers IA. Un robots.txt mal configuré peut rendre vos fiches produit plus difficiles à retrouver, citer, valider ou recommander.

## Pourquoi c'est important pour l'IA

Le fichier robots.txt est la première chose qu'un crawler visite avant d'explorer votre site. S'il contient une règle de blocage, un crawler respectueux s'arrête immédiatement. Le point clé est la séparation des rôles : bots de recherche, fetchers utilisateur, bots d'entraînement et bots de validation publicitaire n'ont pas le même impact business.

C'est le point de contact numéro 1 entre votre store et l'IA. Et paradoxalement, c'est souvent le plus négligé.

## Les crawlers IA à connaître

| Crawler | Opérateur | Usage |
|---------|-----------|-------|
| `GPTBot` | OpenAI | Entraînement ChatGPT et connaissance IA générale |
| `OAI-SearchBot` | OpenAI | Recherche et citations ChatGPT Shopping (sans collecte de données d'entraînement) |
| `OAI-AdsBot` | OpenAI | Validation et pertinence des landing pages ChatGPT Ads |
| `ChatGPT-User` | OpenAI | ChatGPT avec browsing en temps réel |
| `PerplexityBot` | Perplexity | Perplexity Search & Shopping |
| `ClaudeBot` | Anthropic | Claude avec browsing (trafic doublé Q3 2025 - Q1 2026, [SE Ranking, 2026](https://seranking.com/blog/ai-statistics/)) |
| `Google-Extended` | Google | Contrôle d'usage/entraînement IA, pas crawler Google Search |
| `Amazonbot` | Amazon | Alexa, Amazon Search |
| `Bytespider` | ByteDance | Fonctionnalités IA TikTok |

**Pourquoi OAI-SearchBot est essentiel** : Contrairement à GPTBot (utilisé pour l'entraînement), OAI-SearchBot sert la recherche et la découverte shopping dans ChatGPT. `OAI-AdsBot` est encore différent : il valide les landing pages publicitaires et doit être lu comme un signal paid media, pas comme un signal GEO organique.

## Ce qu'il faut vérifier

<figure>
  <img src="/diagrams/robots-decision-tree-fr.svg" alt="Arbre de décision robots.txt : le crawler IA arrive, vérifie si un Disallow global bloque tout (site invisible), puis si un blocage spécifique le cible (partiellement bloqué), sinon le site est accessible et indexé" width="800" height="340" loading="lazy" decoding="async" style="width:100%;height:auto;" />
  <figcaption style="text-align:center;font-size:0.875rem;color:#6B6B76;margin-top:0.5rem;">Figure 1  -  Comment un crawler IA décide d'indexer votre store selon le robots.txt</figcaption>
</figure>

Votre robots.txt peut contenir différents types de blocages :

- **Blocage global** : `Disallow: /` sous `User-agent: *` → tout est bloqué pour tous les crawlers
- **Blocages spécifiques** : `User-agent: GPTBot` + `Disallow: /` → ce crawler est ciblé et bloqué
- **Blocages partiels** : `Disallow: /policies/` → seules les politiques sont bloquées (moins grave mais impactant)

Si un crawler n'est pas mentionné spécifiquement, les règles sous `User-agent: *` s'appliquent.

Verity Score analyse automatiquement votre robots.txt et vous alerte si des crawlers IA sont bloqués.

### Cas Shopify par défaut

Le robots.txt par défaut de Shopify contient :

```
User-agent: *
Disallow: /admin
Disallow: /cart
Disallow: /orders
Disallow: /checkouts/
Disallow: /*/checkouts
Disallow: /carts
Disallow: /account
```

Ces règles sont **correctes** : elles bloquent uniquement les pages d'administration et de checkout. Vos fiches produit, collections et pages restent accessibles.

**Attention** : certaines apps Shopify ou configurations personnalisées ajoutent des règles supplémentaires qui peuvent bloquer les crawlers IA. Vérifiez régulièrement.

## Les erreurs les plus courantes

### Erreur 1 : Disallow global

```
User-agent: *
Disallow: /
```

Cela bloque **tout** votre site pour **tous** les crawlers. C'est la pire configuration possible.

### Erreur 2 : Blocage spécifique des bots IA

```
User-agent: GPTBot
Disallow: /

User-agent: PerplexityBot
Disallow: /
```

Certains guides SEO recommandent de bloquer les crawlers IA pour "protéger le contenu". C'est contre-productif si vous voulez être recommandé par ces systèmes.

### Erreur 3 : Confusion Disallow: / vs Disallow: /policies/

`Disallow: /` bloque TOUT le site. `Disallow: /policies/` bloque uniquement le répertoire /policies/. La différence est un seul caractère mais l'impact est total.

## Comment corriger sur Shopify

### Vérifier le robots.txt actuel

Allez sur `https://votre-store.com/robots.txt` et lisez le contenu.

### Modifier sur Shopify

Sur Shopify, le robots.txt est contrôlé via le fichier `robots.txt.liquid` dans votre thème :

1. Admin Shopify → Themes → Actions → Edit code
2. Cherchez `robots.txt.liquid` dans le dossier Templates
3. Vérifiez qu'aucun crawler IA n'est bloqué
4. Si le fichier n'existe pas, Shopify utilise le défaut (qui est correct)

### Configuration recommandée

```
User-agent: *
Disallow: /admin
Disallow: /cart
Disallow: /orders
Disallow: /checkouts/
Disallow: /account

# Crawlers OpenAI (entraînement + recherche/citations)
User-agent: GPTBot
Allow: /

User-agent: OAI-SearchBot
Allow: /

User-agent: ChatGPT-User
Allow: /

# Autres crawlers IA
User-agent: PerplexityBot
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: Google-Extended
Allow: /

Sitemap: https://votre-store.com/sitemap.xml
```

## Ressources

- [OpenAI GPTBot documentation](https://platform.openai.com/docs/bots)
- [Shopify robots.txt documentation](https://shopify.dev/docs/thèmes/seo/robots-txt)
- [Google crawlers overview](https://developers.google.com/search/docs/crawling-indexing/overview-google-crawlers)

---

## Articles connexes

- [llms.txt pour Shopify : index de contenu IA utile](/fr/kb/llms-txt)
- [Score Agent Readiness : les 11 fichiers /.well-known/ à publier en 2026](/fr/blog/well-known-agent-ready)
- [Comprendre votre score GEO : 9 facteurs décryptés](/fr/kb/geo-readiness)
- [GEO vs SEO : quelles différences pour le e-commerce ?](/fr/kb/geo-vs-seo)
- [Schema.org Product : pourquoi et comment sur Shopify](/fr/kb/schema-org)
- [Vendre dans ChatGPT : le guide Shopify complet pour 2026](/fr/kb/vendre-chatgpt-shopify)

---

**Prêt à vérifier votre store ?** [Lancer un audit GEO gratuit →](https://verityscore.io)
## FAQ

### Faut-il bloquer ou autoriser les crawlers IA comme GPTBot dans robots.txt ?

Il faut séparer les rôles. Pour la découverte organique, évitez de bloquer OAI-SearchBot, ChatGPT-User, PerplexityBot, Claude-SearchBot et Claude-User. Les bots d'entraînement comme GPTBot relèvent d'un choix de consentement séparé, et OAI-AdsBot concerne seulement la validation des publicités ChatGPT.

### Quel est le robots.txt par défaut de Shopify ?

Le robots.txt par défaut de Shopify bloque uniquement les pages d'administration, de panier et de checkout. Vos fiches produit et collections restent accessibles, ce qui est correct.

### Comment modifier le robots.txt sur Shopify ?

Éditez le fichier robots.txt.liquid dans votre thème Shopify (Admin → Themes → Edit code → Templates). Si ce fichier n'existe pas, Shopify utilise le robots.txt par défaut.

### Quels sont les principaux crawlers IA à autoriser ?

Pour l'organique, surveillez surtout OAI-SearchBot et ChatGPT-User (OpenAI), PerplexityBot et Perplexity-User, Claude-SearchBot et Claude-User. GPTBot/ClaudeBot/Google-Extended sont plutôt des signaux d'entraînement ou d'usage du contenu. OAI-AdsBot est un cas paid distinct.

### Bloquer les crawlers IA protège-t-il mon contenu du vol ?

Bloquer les crawlers empêche ces IA d'indexer et de recommander vos produits, mais ne protège pas votre contenu de la copie. C'est contre-productif si votre objectif est de vendre via ces canaux.

## Sources

- [70+ AI Search Stats for 2026 (Fully Verified & Up-to-Date)](https://seranking.com/blog/ai-statistics/) (industry)
- [Q1 2026 AI Citation Trends Report for Shopify Brands](https://ecommercefastlane.com/2026-ai-citation-trends-report/) (industry)

