Le passage des données à l'information se fait en cinq étapes : 1) la collecte des données, 2) l'organisation des données, 3) le nettoyage des données, 4) l'analyse des données et 5) la visualisation des données. Si vous utilisez des outils technologiques pour faciliter la collecte de données, il est important de fonder votre approche en tenant compte des besoins, des motivations et des limites de vos collecteurs de données et du public cible. Les exercices de conception axés sur l'humain de la boîte à outils Co/Act21 peuvent vous y aider. Les outils de suivi que vous utilisez et les enquêtes que vous mettez au point détermineront la manière dont l'initiative de suivi s'adresse à son public cible, et influenceront non seulement les indicateurs d'analyse des données mais aussi la stratégie de communication autour des résultats.

La collecte de données est ce que votre équipe de suivi fera régulièrement, en utilisant l'outil de suivi que vous avez conçu. Après avoir défini l'objectif et les paramètres de la collecte de données et conçu les outils de recherche, tel qu'indiqué dans le chapitre relatif à la préparation du suivi ci-dessus, l'équipe de suivi utilisera ces outils et les sources de données déterminées pour enregistrer les informations et les saisir dans un logiciel. Il peut s'agir d'une simple solution de feuille de calcul comme Google Sheets22 ou d'un logiciel plus sophistiqué, notamment SPSS Statistics.23 Cependant, pour la plupart des initiatives de suivi, du moins dans les premières étapes, des programmes sophistiqués comme SPSS ne sont pas nécessaires.

Astuce : les groupes de suivi utilisent parfois des enquêtes nationales, des enquêtes locales plus simples ou des discussions de groupe pour collecter des données. Les OSC et les législateurs peuvent utiliser ces informations pour façonner les politiques et encourager l'engagement direct des citoyens. Cependant, ces outils comportent certains risques ; voir le chapitre Enquêtes et biais de sélection dans les types de suivi des processus politiques ci-dessus.

En adoptant un outil de suivi, vous devez comprendre la différence entre les informations qualitatives et les informations quantitatives. Avec les données qualitatives, vous suivez les comportements et les pratiques. Dans les données quantitatives, vous suivez la satisfaction, la fréquence et la disponibilité. L'analyse des données qualitatives est plus somatique, tandis que l'analyse des données quantitatives est plus statistique.

Les outils de suivi qui permettent de recueillir des informations qualitatives sont constitués de questions ouvertes plutôt que de simples questions de type oui/non ou de classement. Ces outils peuvent vous fournir des réponses plus longues et plus subjectives. Les groupes de discussion ou les guides d'entretien, qui présentent les questions prévues avec un espace pour que les enquêteurs puissent prendre des notes, sont utiles pour faciliter la collecte de données qualitatives. En particulier, l'entretien non directif peut être une technique utile de collecte de données qualitatives. Dans l'entretien non directif, l'enquêteur ne formule pas les questions en termes de bonnes ou de mauvaises réponses ou d'ensembles limités d'options et évite d'amener la personne interrogée à répondre d'une manière particulière ou dans le cadre de systèmes de valeurs particuliers. L'enquêteur utilise plutôt une approche ouverte pour explorer les pensées, les attitudes et les croyances de la personne interrogée. Les outils de suivi qui permettent de recueillir des données quantitatives sont constitués de questions fermées, généralement celles dont la réponse est oui, non ou peut-être, ainsi que de classements.

Vous devez également comprendre la différence entre les sources de données primaires et les sources de données secondaires. Les données primaires comprennent les observations directes, tandis que les données secondaires comprennent les études de recherche menées précédemment. Vous devez recueillir vous-même les données primaires à l'aide de questionnaires et d'entretiens, tandis que les données secondaires peuvent être recueillies auprès de sources telles que des rapports produits par le gouvernement, des organisations internationales ou d'autres organisations non gouvernementales, des statistiques officielles ou des articles de presse.

Votre approche de la collecte de données sera fonction du type de données que vous recueillez et de la manière dont elles sont collectées. Ce n'est qu'après avoir défini ce qui précède qu'il sera judicieux d'examiner quelles technologies peuvent être utilisées pour faciliter la saisie, la gestion et l'analyse des données. Certains outils sont plus pertinents pour la collecte de données structurées, mais ne le seraient pas pour des données libres que vous pourriez recueillir dans le cadre d'entretiens qualitatifs. D'autres outils - tels que les outils d'extraction de données - sont plus utiles pour l'obtention des informations à partir de sources secondaires. Dans certains cas, les outils numériques ne seraient pas du tout nécessaires.

Les outils de collecte de données peuvent être scindés en trois catégories : les référentiels de données, les formulaires en ligne et les outils d'extraction de données. Tout d'abord, des référentiels de données comme Airtable24 ou Google Sheets25 - qui sont en gros des feuilles de calcul - sont utilisés pour organiser les données structurées. Les informations peuvent être saisies directement dans les référentiels de données sous forme de tableaux. Cependant, cette méthode n'est pas très conviviale et peut conduire à des jeux de données confus, en particulier si plusieurs personnes travaillent sur la base de données ou s'il n'existe pas de format standardisé.

Deuxièmement, les formulaires en ligne facilitent la saisie des données dans le référentiel dans un format structuré. Des données plus structurées facilitent l'analyse et la visualisation. Des formulaires en ligne simples, tels que Survey Monkey26 ou Google Forms27 peuvent être utilisés pour limiter l'erreur humaine en validant les entrées, en n'autorisant, par exemple, que les adresses électroniques valides à être saisies dans un champ de courrier électronique. Les outils d'enquête avancés qui tirent parti des technologies modernes tels que les smartphones, peuvent même collecter des données de manière passive pour valider les données ou simplement recueillir des données supplémentaires à des fins d'analyse. Par exemple, les smartphones dotés de services de géolocalisation peuvent recueillir des données sur l'emplacement de la personne qui collecte les données et l'heure à laquelle elle les a recueillies, d'une manière qui serait difficile à falsifier.

Il est parfois nécessaire pour les personnes assurant le suivi des processus politiques de collecter des informations directement auprès de leurs sujets de recherche, par exemple au moyen d'enquêtes d'opinion, de crowdsourcing ou production participative ou du travail d'observateurs formés sur le terrain. Les outils de Crowdsourcing ou de crowdmapping tels que Fix My Community28 peuvent contribuer à améliorer la prestation des services du gouvernement grâce aux rapports des citoyens. Les efforts de suivi qui nécessitent l'intervention des observateurs sur le terrain peuvent tirer parti d'outils de collecte de données structurées tels que Apollo29 pour recueillir les rapports d'observation en temps réel. Dans les deux cas, il est important d'examiner comment le support peut avoir un impact sur les données collectées. Par exemple, une enquête en ligne auprès d'une communauté sera biaisée en faveur des personnes ayant accès à Internet (voir Enquêtes et biais de sélection dans la section Types de suivi des processus politiques pour plus d'informations). Si les observateurs sur le terrain se trouvent dans des zones sans accès à l'Internet, les appels téléphoniques ou les SMS peuvent être préférables aux formulaires en ligne.

Troisièmement, les outils d'extraction de données prennent des données accessibles dans le domaine public et les utilisent à des fins d'analyse. Certaines plateformes et sites web permettent de télécharger directement des données structurées via des interfaces de programmation d'applications (API) ou des flux RSS (really simple syndication). L'extraction de données à partir d'API est dans la plupart des cas légale et éthique, puisque les données des API sont délibérément réglementées par les plateformes et structurées de manière à ne pas violer les droits des utilisateurs. Lorsque les données ne sont disponibles que sous des formats qui ne peuvent pas être facilement téléchargés et analysés, comme des informations sur des sites web ou dans des PDF, vous devrez peut-être utiliser des outils d'extraction de données. Les outils d'extraction web comme 0https://dem.tools/guides-and-tools/0archiverchive,30 par exemple, peuvent être utilisés pour extraire des données de sites web ou de plateformes de médias sociaux et les convertir en jeux de données structurées. L'extraction des données de sites web n'est pas réglementée par les plateformes et peut violer leurs conditions de service, voire s'avérer illégal dans certains contextes. Des outils tels que DocumentCloud31 ou Adobe Acrobat32 peuvent aider à extraire les données des PDF ou des fichiers image. Amazon Textract33 peut également extraire les relations ou les structures, ce qui peut aider à automatiser le processus d'organisation des données extraites des PDF en un jeu de données structurées. Si ces outils sont utiles lorsqu'il s'agit de traiter des quantités massives de données, pour les projets de suivi plus modestes, la saisie manuelle des données pourrait s'avérer plus efficace.

Astuce : Prenez des précautions pour garantir la sécurité de l'outil de collecte de données et la confidentialité des données, en particulier lorsque vous utilisez des outils en ligne pour collecter des données qui ont trait à des informations sensibles ou des données personnelles identifiables. Dans certains contextes, tels que dans le cas du Règlement général sur la protection des données de l'Union européenne, la collecte et le traitement de ces données personnelles doivent respecter les lois sur la protection ou la localisation des données.34 Examinez le cadre juridique applicable et ne collectez que les données minimales nécessaires à vos efforts de suivi. Indépendamment de votre plan de suivi, prenez le temps d'évaluer et d'atténuer les risques physiques, numériques et informationnels potentiels qui pourraient découler de votre travail, et référez-vous à des ressources telles que le Manuel de cybersécurité pour les organisations de la société civile du NDI en son chapitre sur « Créer votre plan de sécurité organisationnel35pour travailler sur un processus d'évaluation des risques et accéder à des ressources et des conseils de sécurité si nécessaire.

La plupart des plateformes de logiciels en tant que service ont des pages de conditions de service et de politique de confidentialité qui expliquent les droits des utilisateurs et la manière dont l'entreprise traite les informations personnelles. La section sur la communication et le stockage sécurisé des données36 du Manuel de cybersécurité du NDI pour les organisations de la société civile contient des informations supplémentaires sur ce sujet.

L'organisation et le nettoyage des données vont de pair et consistent à catégoriser et à structurer vos informations, par exemple pour classer ou comparer les données, etc. Après avoir adopté votre outil de suivi et collecté des données par observation et d'autres moyens, vous devez organiser et nettoyer ces données pour les transformer en informations utiles. Pour ce faire, il faut trouver et mettre en évidence des modèles qui sont analysés d'un point de vue contextuel. En particulier lorsque vous travaillez avec des données secondaires, il peut être nécessaire de collecter plusieurs jeux de données auprès de plusieurs sources afin de vous faire une compréhension complète du processus politique qui fait l'objet de votre suivi. La fusion de ces jeux de données implique la mise en correspondance et le rapprochement des champs connexes et le rapprochement des références en double. Il est fortement recommandé de travailler avec un scientifique de données qui a de l'expérience avec le type de données que vous collectez. La façon dont vous organisez et nettoyez les données aura un impact sur les types de questions auxquelles vous serez en mesure de répondre au cours du processus d'analyse des données.

Des centaines ou des milliers d'éléments d'information recueillis grâce aux outils de suivi et à l'accès aux données existantes peuvent être nécessaires pour produire des informations utiles qui permettent de déterminer si un processus politique fonctionne comme prévu. Les données peuvent provenir des institutions, des actions et des comportements, ainsi que des perceptions des citoyens. Vous pouvez disposer de données à la fois quantitatives et qualitatives. Ces données doivent être organisées et nettoyées pour produire des informations utiles à vos objectifs.

Si les données quantitatives ont cette caractéristique propre à savoir être structurées et se prêter à l'analyse, l'organisation des données qualitatives se fait mieux par le biais du codage : il s'agit de parcourir les données, de créer des thèmes, puis d'analyser ces données à travers les thèmes, sans préjugés.

L'analyse des données ne consiste pas seulement à agréger des informations et à produire des statistiques. L'analyse est plus utile lorsque vous interprétez le message que véhiculent les informations et que vous tirez des conclusions susceptibles de déboucher sur des recommandations exploitables et fondées sur des preuves. Par exemple, l'analyse fait-elle preuve d'une certaine transparence ? Cela est-t-il révélateur d'un manque de volonté ou de capacités de la part d'une institution ? La voix de la population est-elle prise en compte dans le processus politique, et les institutions ont-elles créé un espace politique pour la participation des citoyens ? Existe-t-il une obligation de rendre des comptes aux citoyens et aux autres institutions ?

La visualisation des données est importante dans le suivi des processus politiques, tout comme dans la recherche, en ce sens qu'elle facilite la compréhension des informations et permet de présenter un grand nombre d'informations de manière visuelle et concise. En outre, une bonne visualisation peut être un outil de narration efficace pour communiquer sur la signification de vos données de manière convaincante. Les graphiques, les infographies, les tableaux de bord avec analyses et les clips vidéo avec illustrations sont tous des types de techniques de visualisation des données. Cependant, les visualisations de données mal réalisées peuvent en fait faire plus de mal que de bien, en présentant les données de manière trompeuse. Pour des jeux de données plus complexes, il peut être nécessaire de faire appel à des infographes et à des scientifiques de données pour représenter les données de manière à la fois précise et intelligible. Pour des visualisations plus simples, les outils disponibles permettent de créer des graphiques simples pour des personnes qui n'ont pas d'expertise particulière. Tableau37, Carto38 et Mapbox39 sont particulièrement adaptés aux jeux de données qui contiennent des données de localisation. Les outils de création d'infographies tels que Infogram40, Canva41 et Piktochart42 font de la création de visualisations simples un jeu d'enfant. Google Sheets43 et AirTable44 (à l'aide d'extensions) disposent même de quelques fonctions de visualisation de base pour créer des diagrammes et des graphiques à partir de l'outil de référentiels de données.

Recommandations

  • La collecte des données peut prendre plus de temps que prévu. Prévoyez donc suffisamment de temps pour mettre en place de bons systèmes et processus de collecte, de saisie, de stockage, de gestion, de l'analyse et de rapport des données.
  • Prévoyez de faire connaître toute hypothèse concernant le public cible, ses besoins et ses motivations, et la manière dont il s'engagera dans les conclusions de votre suivi. À partir de là, élaborez des questions de recherche pour évaluer ces hypothèses et pour ancrer la conception de l'initiative de suivi et le plan de communication dans une approche qui aura le plus d'impact sur le public cible.
  • Envisagez de procéder à un examen indépendant de votre méthodologie pour vous assurer que votre outil peut fournir des données de qualité et pour vérifier que les informations que vous recueillez seront essentielles à votre objectif.
  • Fournissez à votre public cible un retour d'information rapide sur les premières conclusions et offrez-lui la possibilité de discuter de ces résultats. Vous pouvez toujours affiner et réviser votre processus de suivi au fur et à mesure si cela renforce votre initiative.
  • Le suivi est souvent un processus à long terme, et les personnes impliquées peuvent changer au fil du temps, notamment dans la sphère politique. Le processus doit par conséquent être documenté et classé dans un endroit accessible aux personnes compétentes de votre organisation.

Footnotes

21 Matt Bailey, Priyal Bhatt et Caroline Sinders, "Co/Act: Human-Centered Design for Activists".

22 "Google Sheets", DemTools, mis à jour le 28 juillet 2021, https://dem.tools/guides-and-tools/google-sheets.

23 "IBM SPSS Statistics", IBM, consulté le 29 octobre 2022, https://www.ibm.com/products/spss-statistics.

24 "Airtable" DemTools, mis à jour le 14 juillet 2022, https://dem.tools/guides-and-tools/airtable.

25 "Google Sheets".

26 "Survey Monkey".

27 "Google Forms".

28 "Fix My Community".

29 "Apollo", DemTools, mis à jour le 9 décembre 2021, https://dem.tools/guides-and-tools/apollo.

30 "Oarchive", DemTools, mis à jour le 22 septembre 2021, https://dem.tools/guides-and-tools/0archive.

31 "Document Cloud", DemTools, mis à jour le 30 août 2021, https://dem.tools/guides-and-tools/document-cloud.

32 "Adobe Acrobat", Adobe, consulté le 27 octobre 2022, https://www.adobe.com/acrobat.html.

33 "Amazon Textract", Amazon Web Services, consulté le 27 octobre 2022, https://aws.amazon.com/textract/.

34 “General Data Protection Regulation (GDPR),” National Democratic Institute, mis à jour le 17 juillet 2018, https://www.ndi.org/gdpr.

35 "Creating Your Organizational Security Plan", dans Manuel de cybersécurité pour les organisations de la société civile, National Democratic Institute, consulté le 5 octobre 2022, https://cso.cyberhandbook.org/topics.

36 "Communicating and Storing Data Securely", dans Manuel de cybersécurité pour les organisations de la société civile, National Democratic Institute, dernière mise à jour en juillet 2022, https://cso.cyberhandbook.org/topics/storing-data/communications-and-sharing-data.

37 "Tableau", DemTools, mis à jour le 28 juillet 2021, https://dem.tools/guides-and-tools/tableau.

38 "Carto", DemTools, mis à jour le 28 juillet 2021, https://dem.tools/guides-and-tools/carto.

39 "Mapbox", DemTools, mis à jour le 28 octobre 2021, https://dem.tools/guides-and-tools/mapbox.

40 "Infogram", DemTools, mis à jour le 28 juillet 2021, https://dem.tools/guides-and-tools/infogram.

41 "Canva", DemTools, mis à jour le 28 juillet 2021, https://dem.tools/guides-and-tools/canva.

42 "Piktochart", DemTools, mis à jour le 28 juillet 2021, https://dem.tools/guides-and-tools/piktochart.

43 "Google Sheets".

44 "AirTable."