L’open data, un stock de données pour produire de la connaissance
Les nouvelles technologies s’imposent dans notre quotidien et enregistrent des données sur tous les sujets et dans tous les domaines. Le suivi et le croisement de ces données produisent des informations nouvelles particulièrement utiles aux data journalistes pour interpréter le monde ou de prédire des événements.
La France, championne de l’open data ?
Accéder à une donnée de qualité, à faible coût ou gratuitement, est capital pour produire de la connaissance et rendre de nouveaux services. Les data journalistes ne sont pas les seuls intéressés par ces mines d’informations. Les gouvernements de nombreux pays sont conscients des enjeux de la donnée ouverte dans le domaine de l’innovation mais aussi de leur importance pour rendre compte de leurs actions et pour améliorer les services publics. Ils encouragent la démarche en faveur de l’ouverture des données depuis les années deux mille cinq.
Sur le sujet de l’open data, la France figure parmi les leaders. Elle est classée deuxième au classement OURdata Index 2019 de l’OCDE, juste derrière la Corée pour son action en faveur de l’ouverture des données. La même année, la Commission européenne lui a attribué un taux de maturité de 89 % pour la qualité des données et le cadre politique, ce qui la classe en troisième position, juste derrière l’Irlande (91 %) et l’Espagne (90 %).
La démarche française vers l’open data
Ces succès reposent en grande partie sur la qualité du portail centralisé data.gouv.fr, crée et géré en 2011 par Etalab, un département de la direction interministérielle du numérique (DINUM) en charge de coordonner la politique publique des données ouvertes. Data.gouv.fr propose non seulement de larges jeux de données mais encourage leur réutilisation en proposant des API (interfaces de programmation applicative) qui facilitent la connexion de logiciels tiers aux données. Il s’agit également de valoriser les services ou les datavisualisations qui ont exploité ces données. Pour atteindre ces objectifs, la France a adopté une loi pour la République numérique en octobre 2016, qui prévoit la mise à disposition gratuite de certaines données du secteur public dans des secteurs clés.
Cette démarche a été payante car, durant la pandémie de Covid-19, les données liées à la maladie ont pu être mises en ligne très vite pour faire progresser la connaissance et informer le citoyen. Elles ont été reprises et exploitées par la société civile. Ainsi, le site Covid tracker de Guillaume Rozier, qui s’appuie sur les données de Santé Publique France et de l’INSEE, et ses outils comme « Vite ma dose », qui analyse les différentes plateformes de réservation de rendez-vous pour la vaccination et proposent des créneaux disponibles, ont constitué des exemples de réutilisation très remarqués sur le plan national et international.
L’open data à l’international
De nombreux États ouvrent leurs données, notamment les États européens qui y sont contraints par la directive européenne2003/98/CE du Parlement européen et du Conseil de l’Union européenne du 17 novembre 2003, amendée en 2013 et en 2019. Les États, l’Europe et l’OCDE sont investis dans l’open data, mais l’ouverture des données est également soutenue par des militants et des acteurs de la société civile, dont les acteurs historiques anglophones Open Data Institute (2012) ou l’Open Knowledge Foundation (2004), ou encore OpenStreetMap (2004), mais aussi des entreprises privées, des acteurs du monde de la recherche, des journalistes, des financeurs, des organisations internationales…
Les opportunités de trouver des données sur un sujet sont donc nombreuses mais la qualité des données, leur pérennité et leur actualité sont des points importants pour leur utilisation. Or les données publiques ne correspondent pas toujours aux huit critères de l’open data énoncés. Les données doivent en effet être :
complètes (toutes les données publiques collectées dans les limites légales liées à la vie privée ou la sécurité),
primaires (brutes et non traitées),
fraîches, accessibles (en ligne,
gratuite (ou à un coût raisonnable),
non discriminatoires (par rapport à leur usage),
lisibles par les machines,
dans un format ouvert,
avec une licence libre.
Les efforts dans le domaine ne doivent donc pas faiblir, alertaient les signataires d’une tribune dans Les Échos en 2019.
Trouver les bases de données ouvertes
Les principales sources de données publiques ouvertes sont hébergées sur des sites dédiés. Le site data.gov héberge300 602 jeux de données américaines, ouvert.canada.ca en propose 80 000 sur le Canada, data.gov.uk met à disposition 45 000 jeux de données du Royaume-Uni, le site data.gouv en propose 38 000 sur le service public français et data.europa.eu compile 13 000 jeux de données concernant l’Union Européenne.
Mais certains services publics ou collectivités locales peuvent proposer des données concernant leurs activités sur des sites dédiés comme : data.sncf.com et ses 224 jeux de données sur l’activité ferroviaire, opendata.paris.fr et ses 283 jeux de données concernant la Ville de Paris…
De même, les entreprises privées peuvent ouvrir leur dataset comme le font Amazon, Reddit ou Microsoft. Des initiatives citoyennes ont fondé leur propre base de données ouvertes comme openfoodfacts.org, une base collaborative exploitée par de nombreuses applications sur la nutrition et la qualité alimentaire.
Enfin, Google a développé un moteur de recherche dédié à la recherche de dataset : Google Dataset Search, et des portails comme opendatainception.io recensent des producteurs de données.
La plateforme ouverte des données publiques françaises qui propose des jeux de données dans différents domaines et valorise les réutilisations des données.
Cet ouvrage présente le mouvement en faveur de l’ouverture des données et plusieurs moyens d’exploiter ces informations à l’aide de logiciels de traitement ou de visualisation.
Le comité interministériel de la transformation publique du 5 février 2021 a annoncé la mise en œuvre d’une « politique ambitieuse de la donnée » avec l’ouverture prochaine de nouveaux jeux et une gouvernance renouvelée. Des annonces bien en deçà des recommandations du rapport Bothorel.
Rédiger un commentaire
Les champs signalés avec une étoile (*) sont obligatoires
XÉtant un service public, nous ne faisons aucun usage commercial des données collectées lors de votre navigation. Nous utilisons les cookies ou technologies similaires pour accéder uniquement à des données personnelles non sensibles stockées sur votre terminal, que nous traitons afin de réaliser des statistiques, mesurer les performances du site, ou permettre des accès à des ressources externes.
Vous pouvez à tout moment revenir sur vos choix en utilisant le lien "Personnaliser". En savoir plusRefuserAccepterPersonnaliser
Politique de confidentialité & cookies
Gestion de vos préférences sur les cookies
Ce site utilise des cookies pour améliorer votre expérience de navigation. Ces cookies sont classés en trois catégories : fonctionnel, statistiques et marketing.
Veuillez retrouver notre politique de gestions de données personnelles et de cookies : page "Informations sur les cookies" et page "Politique de confidentialité"
Ces cookies nous permettent de réaliser des statistiques de mesures d’audiences et de performances en analysant le volume et la source du trafic sur notre site. Ces cookies permettent également d’analyser de façon anonyme le comportement des visiteurs de notre site afin de mesurer et d'améliorer les performances de notre site et de nos campagnes en ligne.
Le recueil de votre consentement n’est pas requis, nous utilisons un logiciel d’analyse d’audience (Matomo) configuré selon les recommandations de la CNIL pour bénéficier de l’exemption de consentement.
https://www.cnil.fr/fr/cookies-et-autres-traceurs/regles/cookies-solutions-pour-les-outils-de-mesure-daudience
Cookie
Type
Durée
Description
_pk_id.*
13 mois
Ce cookie est installé par l'outil d'analyse Web Matomo.
Le cookie _pk_id est utilisé pour stocker des détails sur l'utilisateur tels que l'identifiant unique (ID).
Les cookies créés par Matomo commencent par : _pk_ref, _pk_cvar, _pk_id, _pk_ses.
Pour plus d'informations sur les cookies de Matomo : https://fr.matomo.org/faq/general/faq_146/
_pk_ses.*
30 minutes
Ce cookie est installé par l'outil d'analyse Web Matomo.
Ce cookie _pk_ses de courte durée est utilisé pour stocker temporairement les données de la visite.
Les cookies créés par Matomo commencent par : _pk_ref, _pk_cvar, _pk_id, _pk_ses.
Pour plus d'informations sur les cookies de Matomo : https://fr.matomo.org/faq/general/faq_146/
Les cookies fonctionnels aide à améliorer les performances de certaines fonctionnalités comme partager le contenu du site sur les réseaux sociaux, collecter des retour d'expérience, et autres fonctionnalités.
Cookie
Type
Durée
Description
bcookie
0
2 years
Ce cookie est installé par LinkedIn pour activer les fonctions de LinkedIn sur ce site.
cookielawinfo-checkbox-necessary
0
11 months
Ce cookie est défini par le plugin GDPR Cookie Consent. Les cookies sont utilisés pour stocker le consentement de l'utilisateur pour les cookies dans la catégorie «Nécessaire».
cookielawinfo-checkbox-non-necessary
0
11 months
Ce cookie est défini par le plugin GDPR Cookie Consent. Les cookies sont utilisés pour stocker le consentement de l'utilisateur pour les cookies dans la catégorie «Non nécessaire».
csrftoken
0
11 months
Ce cookie est associé à la plateforme de développement Web Django pour python. Utilisé pour aider à protéger le site Web contre les attaques de falsification de requêtes intersites
lidc
0
1 day
Ce cookie est défini par LinkedIn et utilisé pour le routage.
viewed_cookie_policy
0
11 months
Le cookie est défini par le plugin GDPR Cookie Consent et est utilisé pour stocker si l'utilisateur a consenti ou non à l'utilisation de cookies. Il ne stocke aucune donnée personnelle.
Les cookies analytiques sont utilisés pour comprendre comment les visiteurs interagissent avec le site. Ces cookies génèrent des informations mesurables sur le nombre de visiteurs, le taux de rebond, la source du trafic etc.
Cookie
Type
Durée
Description
everest_g_v2
0
1 year
Le cookie est défini sous le domaine eversttech.net. Le but du cookie est de mapper les clics sur d'autres événements sur le site Web du client.
GPS
0
30 minutes
Ce cookie est défini par Youtube et enregistre un identifiant unique pour suivre les utilisateurs en fonction de leur emplacement géographique
mc
0
1 year
Ce cookie est associé à Quantserve pour suivre de manière anonyme comment un utilisateur interagit avec le site Web.
MR
0
1 week
Ce cookie est utilisé pour mesurer l'utilisation du site Web à des fins d'analyse.
VISITOR_INFO1_LIVE
1
5 months
Ce cookie est défini par Youtube. Utilisé pour suivre les informations des vidéos YouTube intégrées sur un site Web.
YSC
1
Ces cookies sont définis par Youtube et sont utilisés pour suivre les vues des vidéos intégrées.
Les cookies publicitaires sont utilisés pour procurer une expérience optimale aux visiteurs du site avec des publicités et des campagnes marketing pertinentes. Ces cookies traquent les visiteurs à travers les sites et collectent leurs informations pour générer des publicités personnalisées.
Cookie
Type
Durée
Description
ATN
1
2 years
Ce cookie est installé par atdmt.com et stockent des données sur le comportement de l'utilisateur sur plusieurs sites Web. Les données sont ensuite utilisées pour diffuser des publicités pertinentes aux utilisateurs du site Web.
bito
0
1 year
bitoIsSecure
0
1 year
bscookie
1
2 years
chkChromeAb67Sec
0
2 months
CMID
0
1 year
CMPRO
0
2 months
CMPS
0
2 months
CMST
0
1 day
cref
0
1 year
damd
0
1 year
dc
0
9 years
dmvk
0
dmxId
0
9 months
fr
1
2 months
Le cookie est installé par Facebook pour montrer des publicités pertinentes aux utilisateurs et mesurer et améliorer les publicités. Le cookie suit également le comportement de l'utilisateur sur le Web sur les sites dotés d'un pixel Facebook ou d'un plugin social Facebook.
GED_PLAYLIST_ACTIVITY
0
glassbox-session-id
0
30 minutes
IDE
1
2 years
Utilisé par Google DoubleClick, ce cookie stocke des informations sur la façon dont l'utilisateur utilise le site Web et toute autre publicité avant de visiter le site Web. Ceci est utilisé pour présenter aux utilisateurs des publicités qui les concernent en fonction du profil de l'utilisateur.
KADUSERCOOKIE
0
2 months
KTPCACOOKIE
0
1 day
lang
0
Ce cookie est utilisé pour stocker les préférences linguistiques d'un utilisateur afin de diffuser du contenu dans cette langue stockée lors de sa prochaine visite sur le site Web.
lissc
0
1 year
li_sugr
0
2 months
matchbidswitch
0
1 month
MUID
0
1 year
Utilisé par Microsoft comme identifiant unique. Le cookie est défini par des scripts Microsoft intégrés. Le but de ce cookie est de synchroniser l'ID sur de nombreux domaines Microsoft différents pour permettre le suivi des utilisateurs.
pardot
0
Le cookie est défini lorsque le visiteur est connecté en tant qu'utilisateur Pardot.
personalization_id
0
2 years
Ce cookie est utilisé par Twitter pour intégrer les fonctionnalités de partage de ce média social. Il stocke également des informations sur la manière dont l'utilisateur utilise le site Web pour le suivi et le ciblage.
PUBMDCID
0
2 months
Ce cookie est défini par pubmatic.com. Le cookie stocke un identifiant utilisé pour afficher des publicités sur le navigateur des utilisateurs.
ROUTEID
0
ss
1
9 years
SyncRTB3
0
2 months
TDCPM
0
1 year
Le cookie est défini par le service CloudFlare pour stocker un identifiant unique afin d'identifier un appareil d'utilisateurs qui reviennent, qui est ensuite utilisé pour la publicité ciblée.
TDID
0
1 year
Le cookie est défini par le service CloudFlare pour stocker un identifiant unique afin d'identifier un appareil d'utilisateurs qui reviennent, qui est ensuite utilisé pour la publicité ciblée.
test_cookie
0
11 months
ts
1
1 year
tuuid
0
9 years
Ce cookie est défini par .bidswitch.net. Les cookies stockent un identifiant unique dans le but de déterminer les publicités que les utilisateurs ont vues si vous avez visité l'un des sites Web des annonceurs. Les informations sont utilisées pour déterminer quand et à quelle fréquence les utilisateurs verront une certaine bannière.
u
0
2 months
UserMatchHistory
0
1 month
usprivacy
0
1 year
ut
0
9 years
v1st
0
1 year
viewer_token
0
1 month
wfivefivec
0
1 year
_fbp
0
2 months
Ce cookie est défini par Facebook pour diffuser des publicités lorsqu'ils sont sur Facebook ou sur une plate-forme numérique alimentée par la publicité Facebook après avoir visité ce site Web.
Les champs signalés avec une étoile (*) sont obligatoires