Nouvelle forme de journalisme assistée par ordinateur, les robots journalistes rédigent déjà des dépêches, des brèves et des comptes-rendus de séances boursières, d’événements sportifs et de résultats électoraux. Leur capacité à traiter un grand volume de données statistiques peut être un atout pour les journalistes. De plus, les intelligences artificielles gagnent en autonomie au fur et à mesure qu’elles intègrent les données qu’elles ont été programmées pour sélectionner sur Internet. Elles peuvent ainsi produire des contenus informatifs de plus en plus précis sur des thématiques ciblées. Mais qu’en est-il de leur capacité à reproduire les techniques journalistiques ?
Damien Desbordes, journaliste et écrivain, a fait le point sur les enjeux soulevés par ces nouvelles formes de production de contenus, lors de la conférence “Quel avenir pour le travail. Perspectives et utopies ?” organisée à la Bpi le 11 juin 2018.
Comment fonctionne un robot journaliste ?
Le robot journaliste est un algorithme de rédaction qui analyse un ensemble de données chiffrées et textuelles à la fois publiques et privées. Son utilisation actuelle est restreinte aux tâches journalistiques “routinières” : sélectionner, trier, hiérarchiser, synthétiser et diffuser des données statistiques. Il est programmé par des ingénieurs-linguistes pour traiter une grande quantité de données. Les données récupérées sont par la suite intégrées dans des “scénarios” d’écriture. Un robot journaliste produit des articles ou des descriptifs de manière automatique et factuelle avec un modèle de mise en forme fixe.
L’origine du robot journaliste remonte au début des années 2000 dans les rédactions des journaux américains. Les journalistes commencent à exploiter des données statistiques et à les mettre à disposition du public. Ce sont les prémices du journalisme de données ou data journalism. Le traitement de ces données s’automatise ensuite avec l’apparition des robots. On parle alors de data to content ou de transformation de données en contenus.
Quakebot est le premier robot journaliste à produire un article en 2014 pour leLos Angeles Times en analysant des données sismiques envoyées par l’institut géologique américain. D’autres robots comme News Tracer, développé par l’agence de presse Reuters, détecte les fausses informations journalistiques sur les réseaux sociaux. Dans une autre mesure, le site d’information Click-O-Tron génère automatiquement des sujets et des titres selon les mots-clés qui sont recherchés en priorité sur les moteurs de recherche.
Apprendre les techniques journalistiques aux algorithmes
Le robot journaliste gagne progressivement en pertinence dans le traitement de l’information grâce aux données qu’il est programmé pour assimiler. De ce fait, il acquiert aussi davantage d’autonomie dans la recherche de données et dans l’écriture. C’est le machine learning ou l’apprentissage automatique. Le robot est alors optimisé pour la réalisation d’une tâche fixe dans un cadre défini. Par exemple, il peut être programmé pour analyser les occurrences sémantiques et les enchaînements linguistiques dans un ensemble d’articles. Actuellement, le moteur de recherche Marlowe parvient à reproduire certaines tâches journalistiques comme la sélection et le recoupement d’informations pertinentes. Il fonctionne via deux logiciels : Tirésias et Prospéro. Le premier est programmé pour sélectionner des sujets sur des sites et des bases en fonction de leur niveau de controverse (le nucléaire, les OGM, le gaz de schiste…). Le deuxième travaille sur la sémantique des données en créant des liens et des comparaisons entre les sources d’information recueillies. Il structure automatiquement les données pour que Marlowe les interprète et rédige des contenus.
À long terme, les algorithmes de rédaction pourront permettre aux journalistes de se recentrer sur l’écriture de reportages et d’entretiens, des formes d’écriture qui impliquent davantage leur subjectivité. La production et la diffusion d’informations factuelles dans les domaines de la finance, de la politique et du sport pourra être automatisée pour libérer du temps éditorial aux journalistes. Aujourd’hui, les robots journalistes sont capables de reproduire les techniques de tri, de recherche et de sélection de l’information. Ils ne sont cependant pas suffisamment aboutis pour imiter le style d’écriture d’un journaliste ni ses capacités d’analyse, d’interview et de recoupement de l’information.
Les qualités, typiquement humaines, d’un bon journaliste devaient protéger ce métier de la rivalité des machines. Mais les robots peuvent désormais rédiger des chroniques et faire preuve d’humour tout en étant très productifs. Damien Desbordes fait le point sur les incursions des algorithmes dans le journalisme et leurs possibles progrès tout en proposant quelques clés pour cultiver cette humanité qui fera, à terme, la différence avec les machines.
Découvrez le blog de Marlowe, ce robot journaliste qui poste une chronique en français par jour depuis janvier 2012. Conçu à l’Ecole des hautes études en sciences sociales (EHESS) de Paris, en 1999, Marlowe est autonome dans sa rédaction de chronique.
Rédiger un commentaire
Les champs signalés avec une étoile (*) sont obligatoires
XÉtant un service public, nous ne faisons aucun usage commercial des données collectées lors de votre navigation. Nous utilisons les cookies ou technologies similaires pour accéder uniquement à des données personnelles non sensibles stockées sur votre terminal, que nous traitons afin de réaliser des statistiques, mesurer les performances du site, ou permettre des accès à des ressources externes.
Vous pouvez à tout moment revenir sur vos choix en utilisant le lien "Personnaliser". En savoir plusRefuserAccepterPersonnaliser
Politique de confidentialité & cookies
Gestion de vos préférences sur les cookies
Ce site utilise des cookies pour améliorer votre expérience de navigation. Ces cookies sont classés en trois catégories : fonctionnel, statistiques et marketing.
Veuillez retrouver notre politique de gestions de données personnelles et de cookies : page "Informations sur les cookies" et page "Politique de confidentialité"
Ces cookies nous permettent de réaliser des statistiques de mesures d’audiences et de performances en analysant le volume et la source du trafic sur notre site. Ces cookies permettent également d’analyser de façon anonyme le comportement des visiteurs de notre site afin de mesurer et d'améliorer les performances de notre site et de nos campagnes en ligne.
Le recueil de votre consentement n’est pas requis, nous utilisons un logiciel d’analyse d’audience (Matomo) configuré selon les recommandations de la CNIL pour bénéficier de l’exemption de consentement.
https://www.cnil.fr/fr/cookies-et-autres-traceurs/regles/cookies-solutions-pour-les-outils-de-mesure-daudience
Cookie
Type
Durée
Description
_pk_id.*
13 mois
Ce cookie est installé par l'outil d'analyse Web Matomo.
Le cookie _pk_id est utilisé pour stocker des détails sur l'utilisateur tels que l'identifiant unique (ID).
Les cookies créés par Matomo commencent par : _pk_ref, _pk_cvar, _pk_id, _pk_ses.
Pour plus d'informations sur les cookies de Matomo : https://fr.matomo.org/faq/general/faq_146/
_pk_ses.*
30 minutes
Ce cookie est installé par l'outil d'analyse Web Matomo.
Ce cookie _pk_ses de courte durée est utilisé pour stocker temporairement les données de la visite.
Les cookies créés par Matomo commencent par : _pk_ref, _pk_cvar, _pk_id, _pk_ses.
Pour plus d'informations sur les cookies de Matomo : https://fr.matomo.org/faq/general/faq_146/
Les cookies fonctionnels aide à améliorer les performances de certaines fonctionnalités comme partager le contenu du site sur les réseaux sociaux, collecter des retour d'expérience, et autres fonctionnalités.
Cookie
Type
Durée
Description
bcookie
0
2 years
Ce cookie est installé par LinkedIn pour activer les fonctions de LinkedIn sur ce site.
cookielawinfo-checkbox-necessary
0
11 months
Ce cookie est défini par le plugin GDPR Cookie Consent. Les cookies sont utilisés pour stocker le consentement de l'utilisateur pour les cookies dans la catégorie «Nécessaire».
cookielawinfo-checkbox-non-necessary
0
11 months
Ce cookie est défini par le plugin GDPR Cookie Consent. Les cookies sont utilisés pour stocker le consentement de l'utilisateur pour les cookies dans la catégorie «Non nécessaire».
csrftoken
0
11 months
Ce cookie est associé à la plateforme de développement Web Django pour python. Utilisé pour aider à protéger le site Web contre les attaques de falsification de requêtes intersites
lidc
0
1 day
Ce cookie est défini par LinkedIn et utilisé pour le routage.
viewed_cookie_policy
0
11 months
Le cookie est défini par le plugin GDPR Cookie Consent et est utilisé pour stocker si l'utilisateur a consenti ou non à l'utilisation de cookies. Il ne stocke aucune donnée personnelle.
Les cookies analytiques sont utilisés pour comprendre comment les visiteurs interagissent avec le site. Ces cookies génèrent des informations mesurables sur le nombre de visiteurs, le taux de rebond, la source du trafic etc.
Cookie
Type
Durée
Description
everest_g_v2
0
1 year
Le cookie est défini sous le domaine eversttech.net. Le but du cookie est de mapper les clics sur d'autres événements sur le site Web du client.
GPS
0
30 minutes
Ce cookie est défini par Youtube et enregistre un identifiant unique pour suivre les utilisateurs en fonction de leur emplacement géographique
mc
0
1 year
Ce cookie est associé à Quantserve pour suivre de manière anonyme comment un utilisateur interagit avec le site Web.
MR
0
1 week
Ce cookie est utilisé pour mesurer l'utilisation du site Web à des fins d'analyse.
VISITOR_INFO1_LIVE
1
5 months
Ce cookie est défini par Youtube. Utilisé pour suivre les informations des vidéos YouTube intégrées sur un site Web.
YSC
1
Ces cookies sont définis par Youtube et sont utilisés pour suivre les vues des vidéos intégrées.
Les cookies publicitaires sont utilisés pour procurer une expérience optimale aux visiteurs du site avec des publicités et des campagnes marketing pertinentes. Ces cookies traquent les visiteurs à travers les sites et collectent leurs informations pour générer des publicités personnalisées.
Cookie
Type
Durée
Description
ATN
1
2 years
Ce cookie est installé par atdmt.com et stockent des données sur le comportement de l'utilisateur sur plusieurs sites Web. Les données sont ensuite utilisées pour diffuser des publicités pertinentes aux utilisateurs du site Web.
bito
0
1 year
bitoIsSecure
0
1 year
bscookie
1
2 years
chkChromeAb67Sec
0
2 months
CMID
0
1 year
CMPRO
0
2 months
CMPS
0
2 months
CMST
0
1 day
cref
0
1 year
damd
0
1 year
dc
0
9 years
dmvk
0
dmxId
0
9 months
fr
1
2 months
Le cookie est installé par Facebook pour montrer des publicités pertinentes aux utilisateurs et mesurer et améliorer les publicités. Le cookie suit également le comportement de l'utilisateur sur le Web sur les sites dotés d'un pixel Facebook ou d'un plugin social Facebook.
GED_PLAYLIST_ACTIVITY
0
glassbox-session-id
0
30 minutes
IDE
1
2 years
Utilisé par Google DoubleClick, ce cookie stocke des informations sur la façon dont l'utilisateur utilise le site Web et toute autre publicité avant de visiter le site Web. Ceci est utilisé pour présenter aux utilisateurs des publicités qui les concernent en fonction du profil de l'utilisateur.
KADUSERCOOKIE
0
2 months
KTPCACOOKIE
0
1 day
lang
0
Ce cookie est utilisé pour stocker les préférences linguistiques d'un utilisateur afin de diffuser du contenu dans cette langue stockée lors de sa prochaine visite sur le site Web.
lissc
0
1 year
li_sugr
0
2 months
matchbidswitch
0
1 month
MUID
0
1 year
Utilisé par Microsoft comme identifiant unique. Le cookie est défini par des scripts Microsoft intégrés. Le but de ce cookie est de synchroniser l'ID sur de nombreux domaines Microsoft différents pour permettre le suivi des utilisateurs.
pardot
0
Le cookie est défini lorsque le visiteur est connecté en tant qu'utilisateur Pardot.
personalization_id
0
2 years
Ce cookie est utilisé par Twitter pour intégrer les fonctionnalités de partage de ce média social. Il stocke également des informations sur la manière dont l'utilisateur utilise le site Web pour le suivi et le ciblage.
PUBMDCID
0
2 months
Ce cookie est défini par pubmatic.com. Le cookie stocke un identifiant utilisé pour afficher des publicités sur le navigateur des utilisateurs.
ROUTEID
0
ss
1
9 years
SyncRTB3
0
2 months
TDCPM
0
1 year
Le cookie est défini par le service CloudFlare pour stocker un identifiant unique afin d'identifier un appareil d'utilisateurs qui reviennent, qui est ensuite utilisé pour la publicité ciblée.
TDID
0
1 year
Le cookie est défini par le service CloudFlare pour stocker un identifiant unique afin d'identifier un appareil d'utilisateurs qui reviennent, qui est ensuite utilisé pour la publicité ciblée.
test_cookie
0
11 months
ts
1
1 year
tuuid
0
9 years
Ce cookie est défini par .bidswitch.net. Les cookies stockent un identifiant unique dans le but de déterminer les publicités que les utilisateurs ont vues si vous avez visité l'un des sites Web des annonceurs. Les informations sont utilisées pour déterminer quand et à quelle fréquence les utilisateurs verront une certaine bannière.
u
0
2 months
UserMatchHistory
0
1 month
usprivacy
0
1 year
ut
0
9 years
v1st
0
1 year
viewer_token
0
1 month
wfivefivec
0
1 year
_fbp
0
2 months
Ce cookie est défini par Facebook pour diffuser des publicités lorsqu'ils sont sur Facebook ou sur une plate-forme numérique alimentée par la publicité Facebook après avoir visité ce site Web.
Les champs signalés avec une étoile (*) sont obligatoires