SEO et IA : être cité par ChatGPT et les AI Overviews

13 juin 20264 min de lecture

SEOGEOIA

Pourquoi le SEO classique ne suffit plus

Le SEO classique ne suffit plus parce que la page de résultats a changé de nature. ChatGPT, Perplexity et les AI Overviews de Google ne se contentent plus d'aligner dix liens bleus : ils rédigent une réponse et citent deux ou trois sources en appui. L'utilisateur lit la synthèse et ne clique souvent sur rien. Si votre page n'est pas dans les sources retenues, vous n'existez plus dans cette conversation, même si vous étiez troisième sur Google.

J'appelle ce travail le GEO, pour Generative Engine Optimization. L'objectif n'est plus seulement de classer une page, mais de devenir une source que la machine choisit de reprendre et d'attribuer. Les bases du SEO restent valables — un site rapide, indexable, bien structuré reste un prérequis — mais elles deviennent un point de départ, pas une ligne d'arrivée.

Comment les moteurs IA choisissent leurs sources

Les moteurs IA choisissent leurs sources en cherchant des passages clairs, autonomes et faciles à attribuer. Un modèle de langage découpe le web en fragments. Quand il répond, il privilégie les passages qui contiennent une réponse complète dans peu de phrases, sans dépendre du reste de la page. Un paragraphe qui commence par « Pour faire X, il faut Y » est plus citable qu'un texte qui tourne autour du sujet pendant dix lignes avant de conclure.

Trois signaux comptent dans mon expérience. D'abord la clarté du passage : une affirmation directe, suivie de sa justification. Ensuite la structure : des titres explicites, des listes, des définitions, des tableaux que la machine isole sans effort. Enfin la cohérence de la marque sur le web : si votre nom et votre expertise reviennent sur plusieurs pages et plusieurs sites, le modèle vous associe plus volontiers au sujet.

Structurer ses pages pour être repris mot pour mot

Pour être repris mot pour mot, il faut écrire en répondant à la question dès la première phrase de chaque section. C'est la règle que j'applique sur ce portfolio : chaque sous-titre est une question ou une affirmation, et la phrase qui suit y répond sans détour. Le lecteur gagne du temps, et la machine trouve un passage prêt à être cité sans avoir à le reformuler.

Je découpe ensuite le contenu en blocs autonomes. Une définition par paragraphe, une procédure en liste numérotée, les chiffres et faits regroupés au même endroit. J'évite les transitions vides du type « comme nous l'avons vu plus haut » : elles cassent l'autonomie du passage. Chaque bloc doit pouvoir être extrait seul et rester juste hors de son contexte.

Le sur-mesure aide ici. Sur un site codé à la main en Next.js, je contrôle le HTML produit, l'ordre des balises et la hiérarchie des titres. Un page builder enterre souvent le texte sous des couches de div décoratives qui brouillent la lecture machine. Du HTML sémantique propre — un seul H1, des H2 logiques, des listes réelles plutôt que des paragraphes déguisés — reste le meilleur terrain pour la citation.

Le rôle des données structurées et du fichier llms.txt

Les données structurées et le fichier llms.txt servent à donner aux machines une lecture sans ambiguïté de votre contenu. Le JSON-LD décrit explicitement ce qu'est une page : un article, un service, une FAQ, une personne. Sur ce portfolio, j'expose du BlogPosting et du BreadcrumbList sur chaque article, du Service et du FAQPage sur les pages d'offre, un Person et un ProfessionalService ancré à Rouen au niveau du site. La machine n'a plus à deviner, je lui donne les faits.

Le fichier llms.txt va plus loin : c'est un résumé en Markdown, placé à la racine, qui liste l'essentiel d'un site pour les modèles. J'y mets mon identité, mes services, mes projets, mes articles et mon contact. Je le génère dynamiquement pour qu'il reste synchronisé avec le vrai contenu. C'est jeune comme convention, et aucun moteur ne garantit qu'il le lit, mais le coût est faible et la logique est saine : faciliter le travail des crawlers IA plutôt que de le subir.

Reste un point que beaucoup oublient : il faut autoriser ces crawlers. GPTBot, ClaudeBot, PerplexityBot, Google-Extended doivent pouvoir accéder à vos pages dans le robots.txt. Les bloquer par réflexe de « protection », c'est se retirer soi-même des réponses IA.

Ce que je mesure et ce que je ne promets pas

Ce que je mesure, ce sont les citations réelles, pas un score abstrait. Je pose les mêmes questions à ChatGPT, Perplexity et Google sur les sujets d'un client, et je regarde qui est cité, dans quel ordre, avec quel extrait. Je surveille aussi les logs serveur pour voir si les crawlers IA passent vraiment. C'est artisanal, mais c'est concret, et ça vaut mieux qu'un outil qui invente une note de visibilité.

Je ne promets pas une place dans les réponses IA, et personne de sérieux ne le devrait. Les moteurs changent leurs critères sans préavis, et la part de hasard reste réelle. Ce que je garantis, c'est un terrain favorable : un contenu clair, structuré, attribuable, accessible aux crawlers. Le reste se gagne dans la durée, en publiant des pages qui répondent vraiment aux questions de votre métier.

Pourquoi le SEO classique ne suffit plus

Comment les moteurs IA choisissent leurs sources

Structurer ses pages pour être repris mot pour mot

Le rôle des données structurées et du fichier llms.txt

Ce que je mesure et ce que je ne promets pas

Sur le même sujet