Article

Appartient au dossier : La datavisualisation en questions

L’open data, un stock de données pour produire de la connaissance

Les nouvelles technologies s’imposent dans notre quotidien et enregistrent des données sur tous les sujets et dans tous les domaines. Le suivi et le croisement de ces données produisent des informations nouvelles particulièrement utiles aux data journalistes pour interpréter le monde ou de prédire des événements.

La France, championne de l’open data ?

Accéder à une donnée de qualité, à faible coût ou gratuitement, est capital pour produire de la connaissance et rendre de nouveaux services. Les data journalistes ne sont pas les seuls intéressés par ces mines d’informations. Les gouvernements de nombreux pays sont conscients des enjeux de la donnée ouverte dans le domaine de l’innovation mais aussi de leur importance pour rendre compte de leurs actions et pour améliorer les services publics. Ils encouragent la démarche en faveur de l’ouverture des données depuis les années deux mille cinq.

Sur le sujet de l’open data, la France figure parmi les leaders. Elle est classée deuxième au classement OURdata Index 2019 de l’OCDE, juste derrière la Corée pour son action en faveur de l’ouverture des données. La même année, la Commission européenne lui a attribué un taux de maturité de 89 % pour la qualité des données et le cadre politique, ce qui la classe en troisième position, juste derrière l’Irlande (91 %) et l’Espagne (90 %).

La démarche française vers l’open data

Ces succès reposent en grande partie sur la qualité du portail centralisé data.gouv.fr, crée et géré en 2011 par Etalab, un département de la direction interministérielle du numérique (DINUM) en charge de coordonner la politique publique des données ouvertes. Data.gouv.fr propose non seulement de larges jeux de données mais encourage leur réutilisation en proposant des API (interfaces de programmation applicative) qui facilitent la connexion de logiciels tiers aux données. Il s’agit également de valoriser les services ou les datavisualisations qui ont exploité ces données. Pour atteindre ces objectifs, la France a adopté une loi pour la République numérique en octobre 2016, qui prévoit la mise à disposition gratuite de certaines données du secteur public dans des secteurs clés.

Cette démarche a été payante car, durant la pandémie de Covid-19, les données liées à la maladie ont pu être mises en ligne très vite pour faire progresser la connaissance et informer le citoyen. Elles ont été reprises et exploitées par la société civile. Ainsi, le site Covid tracker de Guillaume Rozier, qui s’appuie sur les données de Santé Publique France et de l’INSEE, et ses outils comme « Vite ma dose », qui analyse les différentes plateformes de réservation de rendez-vous pour la vaccination et proposent des créneaux disponibles, ont constitué des exemples de réutilisation très remarqués sur le plan national et international. 

graphiques sur le twitter de Covidtracker
Capture d’écran d’un tweet de Covid tracker, situation au 20 juin 2021.

L’open data à l’international

De nombreux États ouvrent leurs données, notamment les États européens qui y sont contraints par la directive européenne 2003/98/CE du Parlement européen et du Conseil de l’Union européenne du 17 novembre 2003, amendée en 2013 et en 2019. Les États, l’Europe et l’OCDE sont investis dans l’open data, mais l’ouverture des données est également soutenue par des militants et des acteurs de la société civile, dont les acteurs historiques anglophones Open Data Institute (2012) ou l’Open Knowledge Foundation (2004), ou encore OpenStreetMap (2004), mais aussi des entreprises privées, des acteurs du monde de la recherche, des journalistes, des financeurs, des organisations internationales…

Les opportunités de trouver des données sur un sujet sont donc nombreuses mais la qualité des données, leur pérennité et leur actualité sont des points importants pour leur utilisation. Or les données publiques ne correspondent pas toujours aux huit critères de l’open data énoncés. Les données doivent en effet être :

  • complètes (toutes les données publiques collectées dans les limites légales liées à la vie privée ou la sécurité),
  • primaires (brutes et non traitées),
  • fraîches, accessibles (en ligne,
  • gratuite (ou à un coût raisonnable),
  • non discriminatoires (par rapport à leur usage),
  • lisibles par les machines,
  • dans un format ouvert, 
  • avec une licence libre.

    Les efforts dans le domaine ne doivent donc pas faiblir, alertaient les signataires d’une tribune dans Les Échos en 2019.

Trouver les bases de données ouvertes

Les principales sources de données publiques ouvertes sont hébergées sur des sites dédiés. Le site data.gov héberge 300 602 jeux de données américaines, ouvert.canada.ca en propose 80 000 sur le Canada, data.gov.uk met à disposition 45 000 jeux de données du Royaume-Uni, le site data.gouv en propose 38 000 sur le service public français et data.europa.eu compile 13 000 jeux de données concernant l’Union Européenne.

Mais certains services publics ou collectivités locales peuvent proposer des données concernant leurs activités sur des sites dédiés comme : data.sncf.com et ses 224 jeux de données sur l’activité ferroviaire, opendata.paris.fr et ses 283 jeux de données concernant la Ville de Paris…

De même, les entreprises privées peuvent ouvrir leur dataset comme le font Amazon, Reddit ou Microsoft. Des initiatives citoyennes ont fondé leur propre base de données ouvertes comme openfoodfacts.org, une base collaborative exploitée par de nombreuses applications sur la nutrition et la qualité alimentaire.

Enfin, Google a développé un moteur de recherche dédié à la recherche de dataset : Google Dataset Search, et des portails comme opendatainception.io recensent des producteurs de données.

Publié le 19/07/2021 - CC BY-SA 4.0

Pour aller plus loin

L'Open data en Europe, 2020 │ data.europa.eu

Le classement des pays européens sur leur démarche open data. (Infographies en anglais)

Le portail data.gouv.fr

La plateforme ouverte des données publiques françaises qui propose des jeux de données dans différents domaines et valorise les réutilisations des données.

Open data : consommation, traitement, analyse et visualisation de la donnée publique

Jean-Philippe Gouigoux
Éditions ENI, 2016

Cet ouvrage présente le mouvement en faveur de l’ouverture des données et plusieurs moyens d’exploiter ces informations à l’aide de logiciels de traitement ou de visualisation.

À la Bpi, niveau 3, 681.51 GOU

Big, fast et open data. Décrire, décrypter et prédire le monde : l'avènement des données

Collectif, sous la direction de Yannick Lejeune
Fyp éditions, 2014

Vingt experts explorent et décryptent le nouvel écosystème de la data, la mutation des métiers actuels et ceux qui émergent.

À la Bpi, niveau 3, 681.51

Le gouvernement accélère l'ouverture des données sans bouleverser la gouvernance de l'open data │La Banque des territoire, 2021

Le comité interministériel de la transformation publique du 5 février 2021 a annoncé la mise en œuvre d’une « politique ambitieuse de la donnée » avec l’ouverture prochaine de nouveaux jeux et une gouvernance renouvelée. Des annonces bien en deçà des recommandations du rapport Bothorel.

Rédiger un commentaire

Les champs signalés avec une étoile (*) sont obligatoires

Réagissez sur le sujet