Contenus générés automatiquement : Google remet le sujet sur le tapis !

Contenus generes automatiquement

Une fois de plus, Google, par la voix de John Mueller, son Webmaster Trend Analyst, rappelle que les contenus générés automatiquement par une intelligence artificielle dédiée à la rédaction sont contraires à ses directives pour les webmasters. En effet, ce type de content est non seulement fortement susceptible d’être considéré comme un spam, mais aussi punissable par le moteur de recherche phare.

Qu’est-ce que Google considère comme un contenu généré automatiquement ?

Quelques simples recherches sur la toile permettent de comprendre ce qu’est un contenu généré automatiquement selon les normes de la firme de Mountain View :

« Le contenu généré automatiquement (également appelé contenu « auto-généré ») est un contenu qui a été généré de manière programmatique. Dans les cas où il est destiné à manipuler les classements de recherche et non à aider les utilisateurs, Google peut prendre des mesures concernant ce type de contenu. Voici quelques exemples de cas, non exhaustifs :

  • Un texte qui n’a aucun sens pour le lecteur, mais qui peut contenir des mots-clés de recherche ;
  • Texte traduit par un outil automatisé sans révision humaine ou reformulation avant publication ;
  • Texte généré par des processus automatisés, tels que les chaînes de Markov ;
  • Texte généré par des techniques automatisées de synonymisation ou d’obscurcissement ;
  • Texte généré par l’extraction de flux Atom/RSS ou de résultats de recherche ;
  • L’assemblage ou la combinaison de contenus provenant de différentes pages web sans y ajouter une valeur suffisante. »

Les conseils de Google aux webmasters : « si vous hébergez ce type de contenu sur votre site, empêchez-le d’apparaître dans les résultats de recherche. »

Comment les contenus peuvent-ils être générés automatiquement ?

GPT-3 est un modèle de prédiction linguistique. Plus clairement, il est doté d’un modèle d’apprentissage automatique à réseau neuronal capable de prendre un texte source puis de le réécrire de manière à ce qu’il obtienne un score élevé de référencement. De nombreux sites internet décrivent les résultats obtenus comme étant très similaires à ceux produits par les humains.

Néanmoins, un tel système possède ses limites :

  • L’absence d’apprentissage permanent ;
  • Une incapacité à expliciter un contenu qu’il a créé à partir d’une source ;
  • Une limitation de la taille de la source fournie pour obtenir un résultat ;
  • Un temps de traitement relativement long ;
  • Le manque de discernement parmi les thèmes abordés dans les contenus créés (complotisme, racisme, etc.) ;
  • Une qualité telle qu’il est possible de créer des fake news automatiquement.

Pourquoi les contenus générés automatiquement sont-ils pénalisables par Google ?

Créé avec une intervention humaine minime pour ne pas dire inexistante, le contenu généré automatiquement à l’aide d’un logiciel. En face, il y a les règles relatives au référencement, à respecter scrupuleusement par les sites internet, s’ils veulent être avantageusement positionnés sur les moteurs de recherche.

Or, pour y parvenir, lesdits sites internet doivent fournir une vitesse optimale de chargement de ses pages, des caractéristiques conviviales, mais aussi, et surtout… des contenus pertinents, originaux et utiles.

Comment Google peut-il pénaliser les contenus générés automatiquement ?

L’algorithme Panda de Google a été spécialement conçu pour détecter les contenus de mauvaise qualité. Lorsque le cas se présente, le site internet concerné est pénalisé au niveau du domaine par Google. Le résultat ne se fait pas attendre, le site connaît une baisse drastique de son classement, entraînant naturellement une diminution tout aussi significative de son trafic organique.

Pourquoi Google a-t-il décidé de faire un rappel sur le sujet des contenus auto-générés ?

Google a profité d’une question posée sur les outils de rédaction d’IA GPT-3 à l’occasion d’un hangout du bureau de Google Search Central SEO pour aborder de nouveau ce sujet délicat. En effet, depuis plusieurs années, l’usage de tels outils, leur acceptabilité du point de vue du géant est sujet à débat parmi les référenceurs.

Pour John Mueller, y compris si les systèmes de Google sont incapables de détecter ces types de contenus, ces derniers ont toujours été considérés comme appartenant à cette catégorie particulière par Google. C’est « essentiellement la même chose que si vous vous contentez de mélanger des mots, de chercher des synonymes ou de mettre en pratique des astuces de traduction ». « Je pense que la qualité du contenu est peut-être un peu meilleure que celle des outils de la vieille école, mais pour nous, il s’agit toujours d’un contenu généré automatiquement, ce qui signifie qu’il est toujours contraire aux directives destinées aux webmasters. Nous considérons donc que c’est du spam. »

« Actuellement, tout cela va à l’encontre des directives pour les webmasters. Donc de notre point de vue, si nous devions tomber sur quelque chose comme ça, si l’équipe de webspam le voyait, elle le considérerait comme du spam. ».

Quel est le conseil de Google aux webmasters en matière de contenu ?

Dans son Google Webmaster Guideline, la firme rappelle que « l’une des étapes les plus importantes pour améliorer le classement de votre site dans les résultats de recherche Google est de veiller à ce qu’il contienne beaucoup d’informations riches, notamment des mots-clés pertinents, utilisés de manière appropriée, qui indiquent le sujet de votre contenu. » Quant aux webmasters et propriétaires de sites tentés d’optimiser leur référencement en créant des contenus longs, mais peu, voire pas du tout authentiques, leur site peut tout simplement être supprimé des résultats de recherches.

Peut-on mélanger les contenus originaux et les contenus générés automatiquement ?

Il n’existe à ce jour aucun outil suffisamment intelligent pour imiter parfaitement la capacité de création de contenu d’un humain, y compris si de nombreuses entreprises vantent la qualité de leur produit pour ce faire.

Pour éviter tout faux pas et ne pas être tenté de mélanger contenu généré automatiquement et contenu créé par une personne en chair et en os, il est préférable pour certains spécialistes d’investir dans des outils de correction, des outils certes de création de contenu, mais nécessitant impérativement une amélioration par un(e) rédacteur(trice) !

0 réponses

Laisser un commentaire

Rejoindre la discussion?
N’hésitez pas à contribuer !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *