Le data journaliste ou « journaliste de données » se donne pour mission de collecter, classer et analyser des milliers de pages chiffrées puis de les rendre accessibles à ses lecteurs, sous des formes infographiques variées. Outil de démocratisation de l’accès à la donnée, cette forme de journalisme redéfinit les relations avec ses lecteurs. Karen Bastien, data journaliste depuis vingt ans et fondatrice de l’agence WeDoData répond aux questions de Balises sur son métier.
Quelle est la spécificité d’un data journaliste par rapport au journaliste classique ?
La donnée statistique est une matière première assez spécifique. Un data journaliste est avant tout un journaliste, avec tous les fondamentaux du métier, à savoir le recueil de sources, la vérification de l’information, son recoupement, l’angle et l’écriture d’un sujet. En plus de ces compétences, le data journaliste est capable d’analyser des tableurs assez imposants et des bases de données sous des formats techniques, comme les statistiques ou le croisement de données. C’est comme si nous procédions à une interview, sauf qu’à la place d’une personne, ce sont les données qui nous apportent des réponses. Cela ouvre des nouveaux champs d’investigation dans le journalisme.
Quels sont vos outils et vos méthodes ?
Les outils sont très variables mais le plus classique reste le tableur. Nous pouvons récupérer des données issues de PDF, car il existe des outils pour extraire les tableaux de ces fichiers. Nous repérons également les sites conçus à partir de bases de données et nous les aspirons. En effet, lorsqu’une page web est toujours structurée de la même manière, cela signifie que le site est branché à une base de données. Nous pouvons alors récupérer tout le tableur dans l’interface du site. Ensuite, nous commençons notre analyse. En fonction du format dans lequel va arriver la donnée, nous adaptons ainsi nos outils. Évidemment, comme n’importe quel journaliste, nous vérifions l’origine de la source. Par exemple, si la donnée vient d’un expert, nous enquêtons pour savoir s’il travaille dans une institution privée ou publique, la manière dont il est financé etc. Nous sommes extrêmement prudents sur ce sujet, même sur l’identité des lanceurs d’alerte. Quand tout cela est vérifié, des enquêtes d’ampleur mondiale peuvent démarrer, comme celle des Panama papers. Mais parfois, une information prétendument exclusive peut être manipulée.
Quel est l’apport de la datavisualisation ?
La datavisualisation (ou dataviz) est conçue pour rendre les données plus compréhensibles aux lecteurs. Lorsque nous recevons des gros tableurs, nous ne pouvons pas les livrer aux lecteurs sous forme de texte, ce serait illisible et indigeste. Le data journaliste est donc souvent celui qui va produire les graphiques de données issues de ses recherches. Cela lui demande des compétences créatives, et pas seulement techniques, pour sentir les bons visuels. La dataviz est aussi l’interface permettant aux lecteurs d’entrer activement dans nos enquêtes. Lorsqu’un graphique est interactif, le lecteur va passer sa souris sur l’information, ne pas être seulement passif et découvrir les différents modes d’exploration.
Quelles sont les limites de la datavisualisation ?
Le visuel peut être trompeur. Nous voyons régulièrement passer des graphiques erronés à la télévision, avec par exemple, des camemberts aux parts plus grandes que 100 %. Il existe de nombreuses astuces pour engager notre œil sur une mauvaise interprétation des faits, comme mettre du rouge partout pour rendre l’information plus anxiogène. Notre œil peut être plus facilement leurré par le visuel. C’est pourquoi, je préconise une meilleure éducation aux graphiques et à la statistique de données, qui est abondante et omniprésente. Nous n’en sommes pas toujours conscients, mais nous produisons tous les jours de la donnée via nos téléphones, qui est ensuite happée par les grands opérateurs. Il faudrait que nous ayons une meilleure conscience de ce que nous émettons et ce que nous consommons. C’est de la culture générale.
Quelles sont les dernières évolutions de votre métier ?
Nous disposons d’outils de plus en plus performants permettant de gérer une grande quantité de données. Par exemple, lorsque nous aurons à faire la carte des résultats de l’élection présidentielle en 2022, avec les 35 000 communes françaises, si nous voulons comparer ces résultats aux précédentes élections, les volumes de fichiers à traiter seront colossaux. Avant, notre temps de travail était très long mais aujourd’hui, nous disposons d’une meilleure réactivité sur l’actualité. L’autre évolution, c’est le nombre croissant de data journalistes. Il y a dix ans, nous étions très peu nombreux, alors qu’aujourd’hui nous sommes environ 200 dans les médias français, en incluant les étudiants. C’est une communauté très soudée qui se fonde sur le partage de l’open source.
Quel est l’enjeu de l’open data dans votre métier de journaliste ?
L’enjeu est central. L’open data représente une grande partie de nos données et sans cela, le temps de l’extraction serait beaucoup trop important. Ce sont des robinets de données bien documentées et sur lesquelles il n’y a pas de problème de déontologie. Lorsque j’ai commencé mon métier de journaliste il y a vingt ans, lorsque nous avions besoin d’un rapport du ministère, nous appelions le service de presse qui nous envoyait un courrier (ou un PDF au début d’internet). Maintenant, nous y avons accès en quelques clics. C’est un très bon exercice de transparence de la part des institutions publiques. En ce sens, la France va dans la bonne direction, même si tout n’est pas parfait.
Comment imaginez-vous l’avenir du data journalisme ?
En France, tout citoyen estimant qu’un document ou qu’une information devraient être en open data peut en faire la demande à la Commission d’accès aux documents administratifs (CADA). Il existe plusieurs leviers pour faire croître l’open data. Devenir acteur de la donnée change aussi le rapport à la citoyenneté. Grâce au Crowdsourcing (production participative), chaque citoyen peut aussi être producteur de données. Par ce biais, une plus grande collaboration des lecteurs avec les journalistes est en train de se construire. Ce n’est pas encore très développé en France mais ce mouvement est enthousiasmant pour les data journalistes. Par exemple, nous travaillons avec Mediacités, un journal en ligne d’enquête et de décryptage consacré aux principales métropoles françaises. Il rend notamment compte des délibérations municipales dans un objectif de transparence. Lors des élections municipales en 2020, avec l’arrivée au pouvoir de nouveaux élus locaux à Nantes, Lille, Lyon et Toulouse, nous avons développé l’opération Radar pour suivre l’action des élus locaux. Dans cette interface, les lecteurs remplissent un formulaire aux questions précises sur le nombre de personnes élues présentes ou absentes ou sur les montants cités lors des délibérations, par exemple. Ainsi, nous récupérons les délibérations municipales mensuelles. Grâce à cette production participative, une nouvelle relation entre les lecteurs et les journalistes se joue dans notre démocratie.
Cet ouvrage présente une centaine d’études de cas de datavisualisation dans divers secteurs (finance, sport, politique, loisirs et science) à travers le monde.
À la Bpi, niveau 3, 765.YIK
Rédiger un commentaire
Les champs signalés avec une étoile (*) sont obligatoires
XÉtant un service public, nous ne faisons aucun usage commercial des données collectées lors de votre navigation. Nous utilisons les cookies ou technologies similaires pour accéder uniquement à des données personnelles non sensibles stockées sur votre terminal, que nous traitons afin de réaliser des statistiques, mesurer les performances du site, ou permettre des accès à des ressources externes.
Vous pouvez à tout moment revenir sur vos choix en utilisant le lien "Personnaliser". En savoir plusRefuserAccepterPersonnaliser
Politique de confidentialité & cookies
Gestion de vos préférences sur les cookies
Ce site utilise des cookies pour améliorer votre expérience de navigation. Ces cookies sont classés en trois catégories : fonctionnel, statistiques et marketing.
Veuillez retrouver notre politique de gestions de données personnelles et de cookies : page "Informations sur les cookies" et page "Politique de confidentialité"
Ces cookies nous permettent de réaliser des statistiques de mesures d’audiences et de performances en analysant le volume et la source du trafic sur notre site. Ces cookies permettent également d’analyser de façon anonyme le comportement des visiteurs de notre site afin de mesurer et d'améliorer les performances de notre site et de nos campagnes en ligne.
Le recueil de votre consentement n’est pas requis, nous utilisons un logiciel d’analyse d’audience (Matomo) configuré selon les recommandations de la CNIL pour bénéficier de l’exemption de consentement.
https://www.cnil.fr/fr/cookies-et-autres-traceurs/regles/cookies-solutions-pour-les-outils-de-mesure-daudience
Cookie
Type
Durée
Description
_pk_id.*
13 mois
Ce cookie est installé par l'outil d'analyse Web Matomo.
Le cookie _pk_id est utilisé pour stocker des détails sur l'utilisateur tels que l'identifiant unique (ID).
Les cookies créés par Matomo commencent par : _pk_ref, _pk_cvar, _pk_id, _pk_ses.
Pour plus d'informations sur les cookies de Matomo : https://fr.matomo.org/faq/general/faq_146/
_pk_ses.*
30 minutes
Ce cookie est installé par l'outil d'analyse Web Matomo.
Ce cookie _pk_ses de courte durée est utilisé pour stocker temporairement les données de la visite.
Les cookies créés par Matomo commencent par : _pk_ref, _pk_cvar, _pk_id, _pk_ses.
Pour plus d'informations sur les cookies de Matomo : https://fr.matomo.org/faq/general/faq_146/
Les cookies fonctionnels aide à améliorer les performances de certaines fonctionnalités comme partager le contenu du site sur les réseaux sociaux, collecter des retour d'expérience, et autres fonctionnalités.
Cookie
Type
Durée
Description
bcookie
0
2 years
Ce cookie est installé par LinkedIn pour activer les fonctions de LinkedIn sur ce site.
cookielawinfo-checkbox-necessary
0
11 months
Ce cookie est défini par le plugin GDPR Cookie Consent. Les cookies sont utilisés pour stocker le consentement de l'utilisateur pour les cookies dans la catégorie «Nécessaire».
cookielawinfo-checkbox-non-necessary
0
11 months
Ce cookie est défini par le plugin GDPR Cookie Consent. Les cookies sont utilisés pour stocker le consentement de l'utilisateur pour les cookies dans la catégorie «Non nécessaire».
csrftoken
0
11 months
Ce cookie est associé à la plateforme de développement Web Django pour python. Utilisé pour aider à protéger le site Web contre les attaques de falsification de requêtes intersites
lidc
0
1 day
Ce cookie est défini par LinkedIn et utilisé pour le routage.
viewed_cookie_policy
0
11 months
Le cookie est défini par le plugin GDPR Cookie Consent et est utilisé pour stocker si l'utilisateur a consenti ou non à l'utilisation de cookies. Il ne stocke aucune donnée personnelle.
Les cookies analytiques sont utilisés pour comprendre comment les visiteurs interagissent avec le site. Ces cookies génèrent des informations mesurables sur le nombre de visiteurs, le taux de rebond, la source du trafic etc.
Cookie
Type
Durée
Description
everest_g_v2
0
1 year
Le cookie est défini sous le domaine eversttech.net. Le but du cookie est de mapper les clics sur d'autres événements sur le site Web du client.
GPS
0
30 minutes
Ce cookie est défini par Youtube et enregistre un identifiant unique pour suivre les utilisateurs en fonction de leur emplacement géographique
mc
0
1 year
Ce cookie est associé à Quantserve pour suivre de manière anonyme comment un utilisateur interagit avec le site Web.
MR
0
1 week
Ce cookie est utilisé pour mesurer l'utilisation du site Web à des fins d'analyse.
VISITOR_INFO1_LIVE
1
5 months
Ce cookie est défini par Youtube. Utilisé pour suivre les informations des vidéos YouTube intégrées sur un site Web.
YSC
1
Ces cookies sont définis par Youtube et sont utilisés pour suivre les vues des vidéos intégrées.
Les cookies publicitaires sont utilisés pour procurer une expérience optimale aux visiteurs du site avec des publicités et des campagnes marketing pertinentes. Ces cookies traquent les visiteurs à travers les sites et collectent leurs informations pour générer des publicités personnalisées.
Cookie
Type
Durée
Description
ATN
1
2 years
Ce cookie est installé par atdmt.com et stockent des données sur le comportement de l'utilisateur sur plusieurs sites Web. Les données sont ensuite utilisées pour diffuser des publicités pertinentes aux utilisateurs du site Web.
bito
0
1 year
bitoIsSecure
0
1 year
bscookie
1
2 years
chkChromeAb67Sec
0
2 months
CMID
0
1 year
CMPRO
0
2 months
CMPS
0
2 months
CMST
0
1 day
cref
0
1 year
damd
0
1 year
dc
0
9 years
dmvk
0
dmxId
0
9 months
fr
1
2 months
Le cookie est installé par Facebook pour montrer des publicités pertinentes aux utilisateurs et mesurer et améliorer les publicités. Le cookie suit également le comportement de l'utilisateur sur le Web sur les sites dotés d'un pixel Facebook ou d'un plugin social Facebook.
GED_PLAYLIST_ACTIVITY
0
glassbox-session-id
0
30 minutes
IDE
1
2 years
Utilisé par Google DoubleClick, ce cookie stocke des informations sur la façon dont l'utilisateur utilise le site Web et toute autre publicité avant de visiter le site Web. Ceci est utilisé pour présenter aux utilisateurs des publicités qui les concernent en fonction du profil de l'utilisateur.
KADUSERCOOKIE
0
2 months
KTPCACOOKIE
0
1 day
lang
0
Ce cookie est utilisé pour stocker les préférences linguistiques d'un utilisateur afin de diffuser du contenu dans cette langue stockée lors de sa prochaine visite sur le site Web.
lissc
0
1 year
li_sugr
0
2 months
matchbidswitch
0
1 month
MUID
0
1 year
Utilisé par Microsoft comme identifiant unique. Le cookie est défini par des scripts Microsoft intégrés. Le but de ce cookie est de synchroniser l'ID sur de nombreux domaines Microsoft différents pour permettre le suivi des utilisateurs.
pardot
0
Le cookie est défini lorsque le visiteur est connecté en tant qu'utilisateur Pardot.
personalization_id
0
2 years
Ce cookie est utilisé par Twitter pour intégrer les fonctionnalités de partage de ce média social. Il stocke également des informations sur la manière dont l'utilisateur utilise le site Web pour le suivi et le ciblage.
PUBMDCID
0
2 months
Ce cookie est défini par pubmatic.com. Le cookie stocke un identifiant utilisé pour afficher des publicités sur le navigateur des utilisateurs.
ROUTEID
0
ss
1
9 years
SyncRTB3
0
2 months
TDCPM
0
1 year
Le cookie est défini par le service CloudFlare pour stocker un identifiant unique afin d'identifier un appareil d'utilisateurs qui reviennent, qui est ensuite utilisé pour la publicité ciblée.
TDID
0
1 year
Le cookie est défini par le service CloudFlare pour stocker un identifiant unique afin d'identifier un appareil d'utilisateurs qui reviennent, qui est ensuite utilisé pour la publicité ciblée.
test_cookie
0
11 months
ts
1
1 year
tuuid
0
9 years
Ce cookie est défini par .bidswitch.net. Les cookies stockent un identifiant unique dans le but de déterminer les publicités que les utilisateurs ont vues si vous avez visité l'un des sites Web des annonceurs. Les informations sont utilisées pour déterminer quand et à quelle fréquence les utilisateurs verront une certaine bannière.
u
0
2 months
UserMatchHistory
0
1 month
usprivacy
0
1 year
ut
0
9 years
v1st
0
1 year
viewer_token
0
1 month
wfivefivec
0
1 year
_fbp
0
2 months
Ce cookie est défini par Facebook pour diffuser des publicités lorsqu'ils sont sur Facebook ou sur une plate-forme numérique alimentée par la publicité Facebook après avoir visité ce site Web.
Les champs signalés avec une étoile (*) sont obligatoires