Le guide en 60 mots
Le 15 mai 2026, Google a publié son AI Optimization Guide officiel pour AI Overviews et AI Mode. Le message central : llms.txt, Markdown alternate, chunking artificiel et réécriture pour LLM ne sont pas des facteurs de ranking. Universal Commerce Protocol (UCP) est cité comme protocole agentique émergent. Trois surfaces que Google déclare inspectées par les browser agents : screenshot, DOM, accessibility tree.
Mise à jour du 1er juin 2026. Le même mois, côté Chrome : Lighthouse 13.3 embarque une catégorie expérimentale “Agentic Browsing” qui vérifie la présence d’un
llms.txt(doc Chrome mise à jour le 5 mai 2026). Contradiction apparente avec le guide Search : non. Deux surfaces distinctes (recherche Google vs agents et navigateurs IA). Le 20 mai, John Mueller a clarifié le point. Détail dans la section dédiée ci-dessous.
Ce que Google rejette explicitement
Le guide consacre une section entière aux “myths and hacks to ignore”. Six leviers couramment vendus comme GEO universel sont nommés :
| Levier rejeté | Mot du guide |
|---|---|
Fichiers llms.txt | « AI text files » non consommés par les systèmes IA de Google |
<link rel="alternate" type="text/markdown"> | Markup spécial sans effet |
| Schema.org markup « custom pour IA » | Inutile, structured data classique suffit pour rich results |
| Chunking artificiel du contenu | Inefficace, Google comprend les pages longues multi-sujets |
| Réécriture long-tail « pour les LLM » | Inefficace, les IA comprennent les synonymes |
| Mentions artificielles sur le web | Bloqué par les systèmes anti-spam |
John Mueller, Search Advocate chez Google, l’avait déjà dit publiquement en juin 2025 : « no AI system currently uses llms.txt ». Le guide officiel confirme cette position.
La nuance Lighthouse : Google audite quand même llms.txt
Le même mois, signal opposé côté Chrome. Lighthouse 13.3 (doc Chrome mise à jour le 5 mai 2026) embarque une catégorie “Agentic Browsing” qui vérifie la présence d’un llms.txt à la racine du domaine. La justification de la doc : « Without llms.txt, agents may spend more time crawling the site to understand its high-level structure and primary content. » La catégorie est expérimentale (« under development »), sans score 0-100, et l’audit est marqué N/A si le fichier est absent (il reste optionnel).
Le 20 mai, interpellé sur Bluesky par la consultante SEO Lily Ray (qui demandait pourquoi Google publie lui-même des llms.txt sur ses docs développeur tout en déconseillant le fichier), John Mueller a tranché : Google le fait pour aider les systèmes de code IA à parser sa documentation, pas pour Search. Il parle d’une « béquille temporaire, peut-être pour économiser des tokens ».
La leçon est exactement celle que vend Verity Score : un même signal vaut, ou ne vaut pas, selon la surface.
| Surface | llms.txt utile ? |
|---|---|
| Recherche Google (AI Overviews, AI Mode) | Non. RAG sur l’index Search classique. |
| Agents et navigateurs IA (Lighthouse “Agentic Browsing”, Comet, Operator) | Oui. Réduit le crawl et les tokens. |
| ChatGPT, Claude, écosystème agent-readiness | Oui. Lu et valorisé. |
Le fichier n’est jamais la réponse en soi. Ce qui compte, c’est la qualité des données derrière, et la surface que vous ciblez.
Ce que Google confirme valoriser
Le guide réaffirme les fondamentaux SEO comme socle des AI Overviews :
- Indexabilité technique (crawl budget, JavaScript rendu correctement, pas de duplicate content)
- HTML sémantique sans fétichisme de validation
- Schema.org standard pour rich results, qui alimentent les AI Overviews
- Merchant Center et Google Business Profile pour le commerce et le local
- Contenu non-commodité avec un point de vue unique et de l’expérience first-hand
- Médias riches (images, vidéos) suivant les best practices existantes
Citation textuelle du guide : « the best practices for SEO continue to be relevant because our generative AI features on Google Search are rooted in our core Search ranking and quality systems ». Les AI Overviews sont alimentées par RAG (Retrieval-Augmented Generation) sur l’index Search classique et Query Fan-Out (génération de requêtes connexes en parallèle).
Les 3 surfaces que les browser agents inspectent
C’est l’un des points les plus actionnables du guide. Google déclare que les browser agents qui visitent votre site inspectent trois surfaces distinctes :
- Le rendu visuel (screenshot) : ce que voit un humain. Layout, hiérarchie, lisibilité.
- La structure DOM : la mise en forme HTML rendue (post-JavaScript). Titres, listes, attributs.
- L’accessibility tree : les rôles ARIA, labels, semantic landmarks. Ce que lit un lecteur d’écran.
Concrètement : un site avec un beau rendu mais un DOM truffé de <div> sans structure, ou un accessibility tree vide (ARIA labels manquants, headings illogiques) sera mal interprété par les agents Google. C’est le rappel le plus fort que l’accessibilité technique a un nouveau rôle de levier de visibilité.
UCP : le seul protocole agentique cité par nom
Dans la section “Agentic experiences” du guide, Google cite un seul protocole par nom : Universal Commerce Protocol. UCP a été lancé le 11 janvier 2026 au NRF (National Retail Federation), co-développé par Google avec Shopify, Etsy, Wayfair, Target et Walmart. Plus de 20 partenaires ont endorsé le protocole à date : Adyen, American Express, Best Buy, Flipkart, Macy’s, Mastercard, Stripe, The Home Depot, Visa, Zalando, et plus.
Concrètement, UCP est un manifeste publié à /.well-known/ucp qui déclare les capabilities commerciales d’un marchand (checkout, fulfillment, returns, tracking, identity, payment handlers). Les agents Google AI Mode et Gemini négocient avec ce manifeste pour exécuter des achats sans friction.
Si vous êtes Head of E-com DTC sur Shopify, UCP est probablement déjà partiellement actif sur votre boutique via Shopify Agentic Storefronts. Vérifiez l’endpoint https://votre-domaine.com/.well-known/ucp pour confirmer.
Ce qui ne sert pas pour Google sert ailleurs
Le piège du guide Google, c’est de croire que ce qu’il dit s’applique à tous les moteurs IA. Faux. Le guide parle de Google Search et des AI Overviews. Il ne parle pas de :
- ChatGPT Search et Shopping (OpenAI) : utilise le feed Agentic Commerce Protocol (ACP) pour Instant Checkout, lit le HTML rendu pour Browse. Schema.org Product + GTIN par variant restent critiques.
- Claude (Anthropic) : Anthropic publie lui-même un llms.txt sur ses docs officielles. Claude lit le HTML rendu, valorise schema.org et Markdown alternate quand disponible.
- Outils d’agent-readiness (Cloudflare isitagentready.com) : valorisent llms.txt, agent-card.json, Web Bot Auth, fichiers
/.well-known/pour leur score. - Google lui-même, côté agents : depuis Lighthouse 13.3 (mai 2026), l’audit “Agentic Browsing” de Chrome vérifie le
llms.txt. Ce n’est pas Google Search, c’est l’outillage agent de Google, mais c’est bien Google qui le mesure.
Donc : llms.txt n’est pas un gaspillage. C’est juste un effort à scoper, pas un levier Google. Anthropic, Stripe, Cloudflare et Mintlify publient leur llms.txt sur leurs propres docs. Cela compte pour ChatGPT, Claude et l’écosystème agent-readiness, pas pour AI Overviews.
Implications pour les Head of E-com DTC
Si vous payez une agence GEO ou un outil de visibilité IA, voici les trois questions à poser cette semaine :
1. Quels signaux ciblent quoi ? Pour chaque levier facturé, demandez à votre prestataire : “ce levier compte pour Google AI Overviews ? Pour ChatGPT Shopping ? Pour Perplexity ?” La réponse “tous les moteurs IA” est une réponse rouge. Les règles diffèrent par moteur.
2. UCP est-il prioritaire dans le plan ? Si vous êtes sur Shopify, l’activation UCP via Agentic Storefronts est probablement la première chose à valider. C’est le seul protocole agentique cité officiellement par Google.
3. Le DOM et l’accessibility tree de vos PDP sont-ils crawlables ? Demandez un audit qui vérifie les trois axes que Google cite : rendu visuel cohérent, DOM structuré, accessibility tree complet. C’est nouveau dans le scoring 2026.
Le panel Verity Score “Engine Coverage”
Verity Score publie depuis le 16 mai un panel dédié dans chaque audit qui étiquette chaque signal par moteur cible (Google AI Overviews, Google AI Mode, ChatGPT Search, ChatGPT Shopping, Claude, Gemini, isitagentready.com). Pour chaque cellule, la citation officielle est consultable au survol. Vous voyez immédiatement si une recommandation s’applique chez Google ou chez ChatGPT, et la doctrine officielle qui la justifie.
Lancer un audit gratuit pour voir la doctrine appliquée à votre boutique.
Conclusion : effort à scoper, pas à supprimer
Le guide Google clarifie ce qu’il consomme pour ses propres AI Overviews. Il ne déclare pas que llms.txt ou Markdown alternate sont inutiles partout. Ils restent valides chez Anthropic, Cloudflare, isitagentready.com, et probablement chez d’autres moteurs IA tiers.
Mais pour un Head of E-com DTC qui doit prioriser un budget GEO limité, le message est clair : commencer par le SEO technique et schema.org standard, ajouter UCP en priorité 1 sur les protocoles agentiques, et considérer llms.txt, agent-card et Web Bot Auth comme des couches secondaires utiles pour ChatGPT, Claude et l’écosystème agent. Pas comme des leviers Google.