Les prompts français et anglais donnent souvent des verdicts différents

9 avril 2026 8 min de lecture

bilingue
prompts

Une entreprise bilingue n’est pas mesurée deux fois par souci d’élégance. Elle est mesurée deux fois parce que la machine peut traverser deux couloirs de preuves différents et revenir avec deux versions de la même entreprise.

Le premier signal d’alerte est généralement discret. Dans un scénario composite que j’utilise pour expliquer cela aux équipes françaises, un intégrateur logiciel de 19 personnes près de Lyon apparaît avec assurance dans une réponse IA en anglais sur les partenaires de mise en œuvre industrielle. La réponse nomme l’entreprise, en donne une description acceptable et cite une page fournisseur en anglais. Puis le même test est lancé en français. Même moteur. Même catégorie. Même besoin d’acheteur approximatif. Cette fois, l’entreprise apparaît plus bas, parfois pas du tout, et lorsqu’elle apparaît, la description a une tache : elle sonne comme celle d’un revendeur de licences logicielles, pas comme celle d’une équipe qui gère l’implémentation dans des usines.

Rien de spectaculaire ne s’est produit. Le site n’est pas cassé. La marque n’a pas disparu. Le problème est plus silencieux que cela. Le prompt français et le prompt anglais ont ouvert deux placards de preuves différents. L’un contient des annuaires de fournisseurs, des pages partenaires et un vocabulaire d’écosystème en anglais. L’autre contient des cas clients en français, des pages de service locales, peut-être une ancienne entrée d’annuaire, peut-être une mention dans la presse professionnelle avec un langage plus mince. Si vous mélangez ces séries dans une moyenne souriante, la moyenne ment avec un visage propre.

Une langue n’est pas seulement une couche de traduction

Beaucoup de PME françaises traitent le test bilingue comme une politesse : lancer le prompt en français parce que les clients sont français, le lancer en anglais parce qu’il existe des preuves en anglais. C’est un début, mais cela manque le mécanisme. La langue du prompt ne change pas seulement les mots de la réponse générée. Elle peut changer les sources sélectionnées, les entités comparées, les hypothèses géographiques et la catégorie métier elle-même.

Pour une entreprise française de services, « intégrateur logiciel industriel près de Lyon » et « industrial software implementation partner near Lyon » sont cousins, pas jumeaux. La première expression peut pousser le système vers des annuaires d’entreprises français, des pages de cas régionaux ou des pages où le mot « intégrateur » est employé librement. La seconde peut attirer des écosystèmes fournisseurs, des listes de partenaires, des pages de documentation en anglais et un vocabulaire de catégorie international. Un marketeur humain voit une seule entreprise. La machine voit deux pistes.

C’est pourquoi je me méfie des rapports bilingues de visibilité IA qui affichent une colonne appelée « visibilité » et enterrent la langue du prompt dans une note. La langue n’est pas une note de bas de page. C’est une condition de mesure.

La divergence de prompts français-anglais est l’écart mesurable entre les réponses IA produites à partir de prompts d’acheteur équivalents en français et en anglais, parce que chaque langue peut orienter le moteur vers des sources, catégories et descriptions différentes.

Cette définition est volontairement simple. Elle nous éloigne des explications mystiques. L’écart n’est pas un défaut de personnalité du modèle. C’est généralement une question de routage des preuves. Le modèle a plus d’un chemin vers votre entreprise, et la langue du prompt aide à choisir le chemin.

Les prompts équivalents sont plus difficiles que les prompts traduits

Une traduction directe a souvent l’air propre dans un tableur. Elle échoue aussi souvent comme test. Les acheteurs ne traduisent pas proprement leur inquiétude. Un responsable des opérations français peut demander un « prestataire pour connecter notre ERP à la production ». Un écosystème fournisseur anglophone peut appeler le même travail « shop-floor systems integration » ou « industrial ERP implementation ». Ces différences ne sont pas décoratives. Ce sont des portes de catégorie.

Dans le composite de l’intégrateur lyonnais, le prompt anglais « best software integrators for French industrial SMEs » tendait à placer l’entreprise parmi des sociétés proches des fournisseurs. Une version française, si elle était traduite trop littéralement, devenait raide et peu naturelle : « meilleurs intégrateurs logiciels pour PME industrielles françaises ». Un acheteur pourrait l’écrire, mais la vraie question est souvent plus brouillonne : « qui peut nous aider à déployer un logiciel de production dans une usine près de Lyon ». La seconde version française change le chemin de preuve. Elle introduit l’aide, le déploiement, la production, l’usine et le lieu. La réponse change.

C’est là que j’utilise ce que j’appelle le test des prompts appariés. Je ne demande pas : « Quelle est la traduction française ? » Je demande : « Quel problème l’acheteur français essaie-t-il de résoudre, et comment les preuves en anglais appellent-elles probablement ce même problème ? » Puis je garde la paire assez proche pour comparer, mais pas au point de rendre un côté artificiel.

Un prompt apparié n’est pas un miroir. Ce sont deux empreintes laissées par des personnes qui marchent vers le même achat depuis deux terrains linguistiques différents.

Le registre doit montrer cette rugosité. Je veux des colonnes pour l’intention du prompt, le texte exact du prompt, la langue, le moteur, le signal de localisation, l’entreprise nommée ou non, la position, la source citée et la qualité de la description. Si le prompt français contient une expression locale plus forte que le prompt anglais, je le note. Si le prompt anglais utilise un terme fournisseur que les acheteurs français emploient rarement, je le note aussi. La mesure s’améliore quand le test admet ses propres coutures.

Séparer l’écart de source de l’écart de description

Quand un test bilingue donne des verdicts différents, les équipes sautent souvent trop vite vers la réécriture. Elles voient une visibilité française plus faible et concluent : « Il nous faut plus de pages en français. » Peut-être. Mais je veux d’abord savoir quel écart je suis en train de voir.

Il y a un écart de source quand les prompts français et anglais citent des classes de pages différentes. La série anglaise peut citer des annuaires fournisseurs ; la série française peut citer le site de l’entreprise ou une fiche locale. Ou l’inverse : la série française peut s’appuyer sur de vieux annuaires tandis que la réponse anglaise utilise une page partenaire actuelle. Le remède dépend de la source qui nourrit la réponse.

Il y a un écart de description quand les deux langues peuvent trouver l’entreprise, mais qu’une langue la décrit mal. Dans l’exemple de l’intégrateur, la réponse anglaise comprenait parfois l’entreprise à travers le vocabulaire partenaire et saisissait à peu près le contexte industriel. La réponse française aplatissait parfois le travail en revente ou en support informatique générique. Ce n’est pas une absence. C’est une mauvaise description habillée en visibilité.

Il y a aussi un écart de position. L’entreprise apparaît dans les deux langues, mais la réponse anglaise la place dans le premier groupe nommé tandis que la réponse française l’enfouit derrière de plus grands cabinets de conseil. La position n’est pas la même chose que la citation, et la citation n’est pas la même chose que l’exactitude. Une entreprise peut être nommée haut, citée faiblement et mal décrite. Ce n’est pas une victoire ; c’est une observation bruyante.

Je classe généralement les différences bilingues en trois lignes de registre : divergence de source, divergence de catégorie et divergence de description. La divergence de source demande : « Quelles pages ont alimenté la réponse ? » La divergence de catégorie demande : « Dans quel panier de marché le moteur a-t-il placé l’entreprise ? » La divergence de description demande : « Qu’est-ce que la réponse dit que l’entreprise fait réellement ? »

La classification est ennuyeuse par choix. Elle empêche la réunion de devenir un théâtre d’opinions. Personne n’a besoin de débattre pour savoir si « l’IA nous aime plus en anglais ». Le registre montre quelle partie de la réponse a changé.

Les preuves françaises peuvent être minces même quand des pages françaises existent

Une entreprise peut avoir des pages en français et tout de même des preuves françaises faibles. Cela paraît injuste jusqu’à ce que l’on lise les pages de près. Beaucoup de sites de PME françaises contiennent un langage de service élégant mais peu de faits extractibles : peu de types de clients, peu d’expressions de catégorie, peu de précision géographique, aucune distinction nette entre revente, implémentation, maintenance, formation et support. La page semble acceptable pour un lecteur humain qui connaît déjà l’entreprise. Pour un moteur de réponse, c’est un brouillard poli.

Les preuves anglaises peuvent avoir le problème inverse. Les pages partenaires des fournisseurs peuvent être structurées, riches en catégories et faciles à citer, mais elles décrivent l’entreprise à travers le cadre du fournisseur. La société devient un « certified partner » ou un « solution provider », ce qui peut être vrai et rester trop étroit. Dans le cas composite lyonnais, les preuves anglaises aidaient l’entreprise à apparaître, mais risquaient aussi d’enfermer la description dans un vocabulaire fournisseur.

C’est pourquoi la mesure bilingue ne doit pas préférer automatiquement la langue qui semble la plus forte. Si les prompts anglais produisent plus de mentions, la question suivante est : plus de mentions en tant que quoi ? Revendeur ? Consultant ? Partenaire certifié ? Spécialiste local de l’implémentation ? La réponse peut être utile pour un parcours d’acheteur et nuisible pour un autre.

Les pages françaises ont souvent besoin de plus qu’une traduction depuis l’anglais. Elles ont besoin de leur propre architecture de preuves : problèmes d’acheteur nommés en français, limites de service énoncées clairement, lieux rattachés à des travaux réels, cas clients décrits sans cacher la catégorie. Le but n’est pas de bourrer les pages de formules mécaniques. Le but est de rendre la bonne description plus facile à répéter.

Une page française utile donne des prises à la machine sans donner au lecteur humain l’impression de tenir un catalogue.

Ne pas moyenner les langues trop tôt

Les pires rapports bilingues sont bien rangés. Ils montrent un score global, quelques captures d’écran, une recommandation d’améliorer le contenu et une ligne indiquant que des tests ont été menés en français et en anglais. Cela cache précisément ce que l’entreprise avait besoin d’apprendre.

Pour une PME française avec des preuves en plusieurs langues, je veux deux registres avant de vouloir un seul score. Le registre français répond à une question métier : comment l’entreprise apparaît-elle quand l’acheteur français probable pose la question avec ses propres mots ? Le registre anglais répond à une autre question : comment l’entreprise apparaît-elle quand l’écosystème de preuves, le vocabulaire fournisseur ou les termes de catégorie internationaux sont activés ? Les deux comptent, mais ils ne signifient pas la même chose.

Ce n’est qu’après plusieurs séries que je cherche une lecture combinée. Même alors, la lecture combinée doit rester prudente. Si l’entreprise apparaît régulièrement en anglais mais échoue en français, je ne l’appellerais pas visible pour le marché français. Si elle apparaît en français mais seulement par des sources vagues ou anciennes, je ne qualifierais pas cela de stable. Si elle apparaît dans les deux langues mais que les descriptions divergent, je traite cela comme un problème de correction avant de le traiter comme un problème de croissance.

La discipline est simple : garder les langues séparées assez longtemps pour que leurs erreurs deviennent visibles.

Cela aide aussi les agences. Quand un client demande pourquoi la réponse anglaise semble meilleure que la française, la réponse ne doit pas être un haussement d’épaules sur l’imprévisibilité des modèles. Montrez les sources citées. Montrez la formulation des prompts. Montrez l’étiquette de catégorie que le système a utilisée. Montrez si l’entreprise était absente, présente, citée, bien positionnée ou correctement décrite. La conversation devient moins glamour et beaucoup plus utile.

Ce que je teste avant de recommander une réécriture

Avant de dire à une entreprise de réécrire quoi que ce soit, je veux un petit échantillon bilingue mais répété. Je commence par des prompts d’intention d’acheteur, pas par des prompts copiés du menu de services. Je lance le français et l’anglais séparément. Je garde aussi les moteurs séparés, car une différence de langue dans ChatGPT n’est pas automatiquement la même différence dans Perplexity ou Copilot.

Puis je lis les sources. C’est la partie que les gens sautent parce qu’elle paraît lente. C’est aussi là que la réponse devient explicable. Si la réponse française cite un annuaire faible, la correction peut consister à renforcer de meilleures sources françaises et à rendre la page officielle plus claire. Si la réponse anglaise cite une page fournisseur qui décrit l’entreprise de façon trop étroite, la correction peut consister à améliorer les preuves anglaises propres à l’entreprise ou à clarifier la description partenaire lorsque c’est possible. Si aucune langue ne cite quoi que ce soit d’utile, le problème dépasse la traduction.

Dans le composite de l’intégrateur lyonnais, la première recommandation ne serait pas « écrire plus de contenu bilingue ». C’est trop brutal. Je séparerais d’abord les prompts d’acheteurs français des prompts de catégorie fournisseur en anglais, je noterais les descriptions et j’inspecterais les pages citées. Ce n’est qu’ensuite que je déciderais si le site a besoin d’un vocabulaire d’implémentation plus clair, de cas clients français plus solides, d’énoncés de catégorie meilleurs ou d’une correction de sources autour d’anciennes fiches partenaires.

La vérité gênante est que le travail de visibilité IA bilingue commence souvent par l’humilité. Nous ne savons pas encore quelle langue porte les preuves les plus propres. Nous ne savons pas si la réponse qui paraît meilleure est commercialement meilleure. Nous ne savons pas si une mention française manquante est causée par le site français, le jeu de prompts, le bassin de sources ou le routage du moteur. Le registre existe parce que deviner sonne intelligent pendant environ dix minutes.

Après cela, quelqu’un demande une preuve.

La note de mesure — Signal : les prompts français et anglais citent des preuves différentes pour la même entreprise. Distorsion : moyenner les deux langues dans un seul score de visibilité trop tôt. Registre : noter séparément l’intention du prompt, la formulation exacte, la langue, le moteur, la source citée, la position dans la réponse et l’exactitude de la description. Prochain test : construire cinq prompts d’acheteur appariés en français et en anglais, les lancer dans deux moteurs, puis comparer les sources avant de recommander une réécriture.