Écrire des textes en grand nombre avec une forme similaire peut très vite se révéler fastidieux si vous en êtes l’auteur, ou bien très coûteux si vous déléguez ce travail à des rédacteurs. Perdre du temps, de l’argent ou ne pas écrire de texte, trois solutions qui sont loin d’être satisfaisantes. C’est pourquoi le content spinning a été développé. Qu’est-ce que c’est ? En quoi cela peut-il vous aider ? Qu’est-ce que la GAT ? Autant de questions auxquelles nous apporterons des réponses à travers cet article.
Le content spinning, qu’est-ce que c’est ?
Derrière ce mot assez mystérieux se cache en réalité une méthode efficace pour générer, à partir d’un modèle, un très grand nombre de textes en peu de temps. Cette technique est particulièrement utilisée dans le milieu du référencement. L’avantage est qu’elle permet de réduire le taux de similarité entre les pages d’un même site. Le principe du content spinning s’appuie sur la création de multiples imbrications au sein d’une matrice textuelle. Ainsi des logiciels spécialisés ou des scripts vont générer à partir d’un texte de départ, la matrice, que l’on appelle un spin, un spin master (ou un masterspin chez les SEO Français qui ignorent le principe d’inversion qui s’applique dans la langue anglaise). À partir de cette matrice, de nombreux spuns/textes seront ensuite générés. Pour vous donner un exemple rapide, le spin « Le {chat|chien|cheval} {courre|saute|joue|mange} dans la {prairie|forêt|montagne}. » va pouvoir donner les spuns suivant « Le chat saute dans forêt. », « Le cheval joue dans la prairie », « Le chien mange dans la montagne », etc. Pratique non ?
Le content spinning, une méthode vite limitée
Certes cette technique a été souvent utilisée mais une société a su vraiment pousser le content spinning au niveau le plus qualitatif qui soit : spinwave. Ce service de content spinning, fondé en 2007, a été le précurseur dans ce domaine et a investi beaucoup de ressources afin de produire des spins puissants, qui génèrent des textes d’une qualité irréprochable. Mais le content spinning a tout de même des limites, c’est pourquoi des évolutions ont vu le jour, jusqu’à l’arrivée de la Génération Automatique de Textes.
La Génération Automatique de Texte, une avancée technologique
Se basant sur la même idée que la précédente, la Génération Automatique de Texte (GAT) permet également de produire un grand nombre d’écrits en peu de temps. Dénommée Natural LanguageGeneration (NLG) en anglais, cette technique fait partie du Traitement Automatique des Langues (TAL). Beaucoup plus complète et complexe que la précédente, elle constitue un point de rencontre entre l’informatique et la linguistique. Accessible seulement aux spécialistes, il serait trop long et compliqué de vous expliquer en quoi elle consiste réellement. Notez seulement qu’elle permet l’obtention de textes de qualité, cohérents, compréhensibles et avec un degré de similitude très bas. Une belle avancée donc.
Deux prestataires sont particulièrement réputés dans ce domaine : Syllabs et GATWAVE. Ces 2 sociétés produisent chaque année des millions de textes pour des médias français, des acteurs du tourisme, de l’e-commerce ou de l’immobilier, pour n’en citer que quelques-uns.
L’intelligence artificielle est capable de véritables prouesses. L’idée d’automatiser la rédaction de textes a su séduire et depuis, les recherches ne font qu’avancer pour produire des textes toujours plus qualitatifs et personnalisés. Alors, peut-on s’attendre à une explosion de la GAT ces prochaines années ?