Interview

Comment le data journalisme réinvente les relations avec le lecteur
Entretien avec Karen Bastien

Culture numérique

Karen Bastien fondatrice de l'agence wedodata, par Jean-Robert Dantou - PictureTank

Le data journaliste ou « journaliste de données » se donne pour mission de collecter, classer et analyser des milliers de pages chiffrées puis de les rendre accessibles à ses lecteurs, sous des formes infographiques variées. Outil de démocratisation de l’accès à la donnée, cette forme de journalisme redéfinit les relations avec ses lecteurs. Karen Bastien, data journaliste depuis vingt ans et fondatrice de l’agence WeDoData répond aux questions de Balises sur son métier.

Quelle est la spécificité d’un data journaliste par rapport au journaliste classique ?

La donnée statistique est une matière première assez spécifique. Un data journaliste est avant tout un journaliste, avec tous les fondamentaux du métier, à savoir le recueil de sources, la vérification de l’information, son recoupement, l’angle et l’écriture d’un sujet. En plus de ces compétences, le data journaliste est capable d’analyser des tableurs assez imposants et des bases de données sous des formats techniques, comme les statistiques ou le croisement de données. C’est comme si nous procédions à une interview, sauf qu’à la place d’une personne, ce sont les données qui nous apportent des réponses. Cela ouvre des nouveaux champs d’investigation dans le journalisme.

Quels sont vos outils et vos méthodes ?

Les outils sont très variables mais le plus classique reste le tableur. Nous pouvons récupérer des données issues de PDF, car il existe des outils pour extraire les tableaux de ces fichiers. Nous repérons également les sites conçus à partir de bases de données et nous les aspirons. En effet, lorsqu’une page web est toujours structurée de la même manière, cela signifie que le site est branché à une base de données. Nous pouvons alors récupérer tout le tableur dans l’interface du site. Ensuite, nous commençons notre analyse. En fonction du format dans lequel va arriver la donnée, nous adaptons ainsi nos outils. Évidemment, comme n’importe quel journaliste, nous vérifions l’origine de la source. Par exemple, si la donnée vient d’un expert, nous enquêtons pour savoir s’il travaille dans une institution privée ou publique, la manière dont il est financé etc. Nous sommes extrêmement prudents sur ce sujet, même sur l’identité des lanceurs d’alerte. Quand tout cela est vérifié, des enquêtes d’ampleur mondiale peuvent démarrer, comme celle des Panama papers. Mais parfois, une information prétendument exclusive peut être manipulée.

M+Le monde en données numériques
Image par Tumisu de Pixabay [CC0]

Quel est l’apport de la datavisualisation ?

La datavisualisation (ou dataviz) est conçue pour rendre les données plus compréhensibles aux lecteurs. Lorsque nous recevons des gros tableurs, nous ne pouvons pas les livrer aux lecteurs sous forme de texte, ce serait illisible et indigeste. Le data journaliste est donc souvent celui qui va produire les graphiques de données issues de ses recherches. Cela lui demande des compétences créatives, et pas seulement techniques, pour sentir les bons visuels. La dataviz est aussi l’interface permettant aux lecteurs d’entrer activement dans nos enquêtes. Lorsqu’un graphique est interactif, le lecteur va passer sa souris sur l’information, ne pas être seulement passif et découvrir les différents modes d’exploration.

Quelles sont les limites de la datavisualisation ?

Le visuel peut être trompeur. Nous voyons régulièrement passer des graphiques erronés à la télévision, avec par exemple, des camemberts aux parts plus grandes que 100 %. Il existe de nombreuses astuces pour engager notre œil sur une mauvaise interprétation des faits, comme mettre du rouge partout pour rendre l’information plus anxiogène. Notre œil peut être plus facilement leurré par le visuel. C’est pourquoi, je préconise une meilleure éducation aux graphiques et à la statistique de données, qui est abondante et omniprésente. Nous n’en sommes pas toujours conscients, mais nous produisons tous les jours de la donnée via nos téléphones, qui est ensuite happée par les grands opérateurs. Il faudrait que nous ayons une meilleure conscience de ce que nous émettons et ce que nous consommons. C’est de la culture générale.

Quelles sont les dernières évolutions de votre métier ?

Nous disposons d’outils de plus en plus performants permettant de gérer une grande quantité de données. Par exemple, lorsque nous aurons à faire la carte des résultats de l’élection présidentielle en 2022, avec les 35 000 communes françaises, si nous voulons comparer ces résultats aux précédentes élections, les volumes de fichiers à traiter seront colossaux. Avant, notre temps de travail était très long mais aujourd’hui, nous disposons d’une meilleure réactivité sur l’actualité. L’autre évolution, c’est le nombre croissant de data journalistes. Il y a dix ans, nous étions très peu nombreux, alors qu’aujourd’hui nous sommes environ 200 dans les médias français, en incluant les étudiants. C’est une communauté très soudée qui se fonde sur le partage de l’open source.

Quel est l’enjeu de l’open data dans votre métier de journaliste ?

L’enjeu est central. L’open data représente une grande partie de nos données et sans cela, le temps de l’extraction serait beaucoup trop important. Ce sont des robinets de données bien documentées et sur lesquelles il n’y a pas de problème de déontologie. Lorsque j’ai commencé mon métier de journaliste il y a vingt ans, lorsque nous avions besoin d’un rapport du ministère, nous appelions le service de presse qui nous envoyait un courrier (ou un PDF au début d’internet). Maintenant, nous y avons accès en quelques clics. C’est un très bon exercice de transparence de la part des institutions publiques. En ce sens, la France va dans la bonne direction, même si tout n’est pas parfait.

Comment imaginez-vous l’avenir du data journalisme ?

En France, tout citoyen estimant qu’un document ou qu’une information devraient être en open data peut en faire la demande à la Commission d’accès aux documents administratifs (CADA). Il existe plusieurs leviers pour faire croître l’open data. Devenir acteur de la donnée change aussi le rapport à la citoyenneté. Grâce au Crowdsourcing (production participative), chaque citoyen peut aussi être producteur de données. Par ce biais, une plus grande collaboration des lecteurs avec les journalistes est en train de se construire. Ce n’est pas encore très développé en France mais ce mouvement est enthousiasmant pour les data journalistes. Par exemple, nous travaillons avec Mediacités, un journal en ligne d’enquête et de décryptage consacré aux principales métropoles françaises. Il rend notamment compte des délibérations municipales dans un objectif de transparence. Lors des élections municipales en 2020, avec l’arrivée au pouvoir de nouveaux élus locaux à Nantes, Lille, Lyon et Toulouse, nous avons développé l’opération Radar pour suivre l’action des élus locaux. Dans cette interface, les lecteurs remplissent un formulaire aux questions précises sur le nombre de personnes élues présentes ou absentes ou sur les montants cités lors des délibérations, par exemple. Ainsi, nous récupérons les délibérations municipales mensuelles. Grâce à cette production participative, une nouvelle relation entre les lecteurs et les journalistes se joue dans notre démocratie.

Publié le 16/08/2021 - CC BY-SA 4.0

Pour aller plus loin

Accueil - data.gouv.fr

Plateforme ouverte des données publiques françaises.

La datavisualisation au service de l'information

Yikun, Liu
Pyramyd, 2016

Cet ouvrage présente une centaine d’études de cas de datavisualisation dans divers secteurs (finance, sport, politique, loisirs et science) à travers le monde.

À la Bpi, niveau 3, 765.YIK

Rédiger un commentaire

Les champs signalés avec une étoile (*) sont obligatoires

Réagissez sur le sujet