C’est une bataille invisible mais capitale pour le contrôle de l’information. Une étude majeure de Semrush, portant sur l’analyse de 230 000 requêtes, vient de révéler quelles sont les sources réellement utilisées par les géants de l’intelligence artificielle. Si vous pensiez que l’IA piochait ses données au hasard, la réalité est bien plus structurée… et révèle des stratégies de confidentialité et de monopole divergentes.

Le déclin brutal de Reddit et Wikipedia sur ChatGPT
Le premier choc de l’étude concerne ChatGPT. En septembre dernier, la plateforme a radicalement réduit ses citations vers Reddit et Wikipedia. Alors que Reddit était cité dans près de 60 % des réponses début août, ce chiffre s’est effondré à seulement 10 % à la mi-septembre. Wikipedia a suivi la même courbe, chutant de 55 % à moins de 20 %.
Ce changement brusque ressemble à une volonté d’OpenAI de limiter les comportements biaisés. Selon Sergei Rogulin de Semrush, il s’agirait d’une tentative de ChatGPT pour devenir « plus résilient aux tentatives de manipulation » en évitant de sur-citer certains domaines. Ce vide profite désormais à des services et plateformes comme LinkedIn, Forbes et Medium, qui enregistrent une hausse constante de leur visibilité.
Le « privilège » de Google : Une stratégie d’écosystème
L’analyse du Google AI Mode montre une stratégie bien différente. Contrairement à ses concurrents, l’IA de Google favorise massivement ses propres propriétés ou partenaires. Parmi les cinq domaines les plus cités, on retrouve exclusivement LinkedIn, YouTube, Reddit, Google et Google Blog.
L’étude souligne un point technique crucial : la suppression par Google du paramètre de recherche num=100 à la mi-septembre. Cette modification a limité la capacité de nombreux outils à accéder aux résultats au-delà de la première page, créant des restrictions de visibilité pour les petits acteurs. Pour les utilisateurs de smartphones, l’information devient de plus en plus centralisée autour d’un noyau dur d’émetteurs.
Perplexity : Le modèle de la stabilité ?
À l’inverse de la volatilité de ChatGPT, l’IA Perplexity affiche des sources beaucoup plus stables. Bien que Reddit y ait légèrement décliné, les sources académiques et institutionnelles comme le NIH (National Institutes of Health) restent des piliers. Cela montre que chaque app d’IA développe sa propre « bulle de confiance », avec des protocoles de sélection radicalement différents.
La vigilance de Clara : Les risques du monopole de l’info
Clara, notre experte en tech et cybersécurité, nous alerte sur cette concentration :
« Si l’IA ne cite plus que trois ou quatre sources dominantes, nous perdons la diversité des opinions. Un changement d’algorithme chez Google ou OpenAI peut effacer des pans entiers de connaissances ou favoriser des offres commerciales au détriment de la vérité privée. »
Elle conseille d’être particulièrement attentif aux signaux de biais lors de l’usage de l’IA pour le télétravail ou la gestion de vos comptes critiques. La domination de Forbes, PRnewswire et Medium sur ChatGPT après septembre montre que l’IA privilégie désormais des sources « institutionnalisées » au détriment du contenu généré par les utilisateurs (UGC).
Source : Étude « The Most-Cited Domains in AI: A 3-Month Study », Semrush Blog, 10 Novembre 2025.













