Hay cinco pasos para convertir datos en información: 1) recopilación de datos, 2) organización de datos, 3) limpieza de datos, 4) análisis de datos y 5) visualización de datos. Si se utilizan herramientas tecnológicas para agilizar la recopilación de datos, es importante tomar en consideración las necesidades, motivaciones y limitaciones de los encargados de recabar los datos y del público objetivo. Los ejercicios de diseño centrados en el humano del Co/Act toolkit21 pueden ayudarlo a lograr esto. Las herramientas de supervisión que utilice y las encuestas que elabore definirán cómo la iniciativa de supervisión se relaciona con su público objetivo, y sustentarán no sólo de los indicadores del análisis de datos, sino también la estrategia de comunicación en torno a las conclusiones.

Su equipo de supervisión se encargará de recopilar datos periódicamente, utilizando la herramienta de supervisión que haya diseñado. Tras definir el objetivo y los parámetros de la recopilación de datos y diseñar las herramientas de investigación, como se indica en el capítulo anterior sobre la preparación para la supervisión, el equipo de supervisión utilizará esas herramientas y las fuentes de datos determinadas para registrar la información e introducirla en un programa informático. Puede tratarse de una simple hoja de cálculo como Google Sheets22, o de un software más sofisticado, como SPSS Statistics.23 Sin embargo, para la mayoría de las iniciativas de supervisión, al menos en las primeras fases, no se necesitan programas sofisticados como el SPSS.

Consejo: los grupos de supervisión a veces utilizan encuestas nacionales, encuestas locales más sencillas o debates de grupos focales para recabar datos. Las OSC y los órganos legislativos pueden utilizar esa información para definir políticas y fomentar la participación directa de los ciudadanos. Sin embargo, estas herramientas entrañan cierto riesgo; véanse las Encuestas y el Sesgo de selección en el capítulo anterior Tipos de supervisión del proceso político.

Al utilizar una herramienta de supervisión, debe comprender la diferencia entre información cualitativa e información cuantitativa. Con los datos cualitativos, se hace un seguimiento del comportamiento y las prácticas. Con los datos cuantitativos, se hace un seguimiento de la satisfacción, la frecuencia y la disponibilidad. El análisis de los datos cualitativos es más subjetivo, mientras que el de los cuantitativos es más estadístico.

Las herramientas de supervisión para recopilar información cualitativa se componen de preguntas abiertas en lugar de preguntas de tipo “sí/no” o de clasificación. Estas herramientas pueden ofrecer respuestas más largas y subjetivas. Los grupos focales o las guías para entrevistas, que plantean preguntas planificadas con espacio para que los entrevistadores tomen notas, son útiles para recabar datos cualitativos. En la entrevista no dirigida, el entrevistador no plantea las preguntas de forma que haya respuestas correctas o incorrectas, ni conjuntos limitados de opciones y evita inducir al entrevistado a responder de determinadas maneras o en base a determinados sistemas de valores. En su lugar, el entrevistador utiliza una metodología abierta para explorar los pensamientos, actitudes y creencias del entrevistado. Las herramientas de supervisión para recopilar datos cuantitativos se componen de preguntas cerradas, normalmente aquellas con respuestas de sí, no o tal vez, así como de clasificaciones.

También hay que entender la diferencia entre fuentes de datos primarios y fuentes de datos secundarios. Los datos primarios incluyen observaciones directas, mientras que los datos secundarios incluyen estudios de investigación realizados con anterioridad. Los datos primarios deben recabarlos usted mismo con cuestionarios y entrevistas, mientras que los datos secundarios pueden obtenerse de fuentes como informes elaborados por el gobierno, organizaciones internacionales u otras organizaciones no gubernamentales; estadísticas oficiales; o artículos de prensa.

Su metodología para recopilar datos dependerá del tipo de datos que recoja y de cómo se recojan. Sólo una vez determinado esto tendrá sentido evaluar qué tecnologías pueden utilizarse para facilitar la introducción, gestión y análisis de los datos. Algunas herramientas son más útiles para recabar datos estructurados, pero no lo serían para los datos no estructurados que se recogen mediante entrevistas cualitativas. Otras herramientas, como las de minería de datos, son más útiles para obtener información de fuentes secundarias. En algunos casos, las herramientas digitales puede que no sean necesarias en absoluto.

Las herramientas de recopilación de datos pueden dividirse en tres categorías: repositorios de datos, formularios en línea y herramientas de minería de datos. En primer lugar, los repositorios de datos como Airtable24 o Google Sheets25básicamente, hojas de cálculo- se utilizan para organizar datos estructurados. La información puede introducirse directamente en los repositorios de datos en formato tabular. Sin embargo, esto no es muy fácil de usar y puede generar conjuntos de datos desordenados, especialmente si más de una persona está trabajando en la base de datos o no hay un formato estandarizado.

En segundo lugar, los formularios en línea facilitan la introducción de datos en el repositorio en un formato estructurado. Tener datos más estructurados agilizan el análisis y la visualización. Se pueden usar formularios en línea sencillos, como Survey Monkey26 o Google Forms27 para limitar el error humano mediante la validación de las entradas, por ejemplo, permitiendo únicamente la introducción de direcciones de correo electrónico válidas en un campo de correo electrónico. Las herramientas avanzadas para encuestas que aprovechan las tecnologías modernas, como los teléfonos inteligentes, pueden incluso recoger datos de forma pasiva para validar los datos o simplemente recopilar datos adicionales para su análisis. Por ejemplo, los teléfonos inteligentes con servicios de geolocalización pueden recoger datos sobre la ubicación de la persona que recoge los datos y la hora a la que los recoge, de una forma que sería difícil de falsificar.

A veces es necesario que los observadores de procesos políticos recojan información directamente de los sujetos de su investigación, por ejemplo, con encuestas de opinión, crowdsourcing o mediante el trabajo de observadores formados en la práctica. Herramientas de crowdsourcing o crowdmapping como Fix My Community28 pueden ayudar a mejorar la prestación de servicios públicos a través de las denuncias ciudadanas. Los esfuerzos de supervisión que involucran a observadores en campo pueden aprovechar herramientas estructuradas de recopilación de datos como Apollo29 para recabar informes de observación en tiempo real. En ambos casos, es importante tener en cuenta cómo puede afectar el medio a los datos recopilados. Por ejemplo, una encuesta por Internet en una comunidad tendrá un sesgo a favor de las personas con acceso a Internet (para mayor información, véase Encuestas y sesgo de selección en la sección Tipos de supervisión del proceso político). Si los observadores de campo se encuentran en zonas sin acceso a Internet, las llamadas telefónicas o los SMS puede que sean más adecuados que los formularios en línea.

En tercer lugar, las herramientas de minería de datos toman los datos disponibles públicamente y los utilizan para el análisis. Algunas plataformas y sitios web permiten la descarga directa de datos estructurados a través de interfaces de programación de aplicaciones (API) o canales RSS (Really Simple Syndication). En la mayoría de los casos, extraer datos de las API es legal y ético, ya que los datos de las API están deliberadamente regulados por las plataformas y estructurados para no violar los derechos de los usuarios. En los casos en que los datos sólo están disponibles en formatos que no se pueden descargar y analizar fácilmente, como la información en sitios web o en archivos PDF, es posible que tenga que hacer uso de herramientas de scraping (“raspado”) de datos. Herramientas como 0archive30, por ejemplo, pueden utilizarse para extraer datos de sitios web o redes sociales y convertirlos en conjuntos de datos estructurados. El web scraping (raspado web) no está regulado por las plataformas y puede infringir sus condiciones de servicio o incluso ser ilegal en algunos contextos. Herramientas como DocumentCloud31 o Adobe Acrobat32 pueden ayudar a extraer datos de archivos PDF o de imágenes. Amazon Textract33 también puede extraer relaciones o estructuras, lo que puede ayudar a automatizar el proceso de organizar los datos extraídos de los PDF en un conjunto de datos estructurados. Aunque estas herramientas son útiles cuando se trata de cantidades masivas de datos, para proyectos de supervisión más pequeños, la introducción manual de datos puede ser lo más conveniente

Consejo: tome precauciones para garantizar la seguridad de la herramienta de recopilación de datos y la privacidad de los mismos, especialmente cuando utilice herramientas en línea para recoger datos que involucren información confidencial o personal identificable. En algunos contextos, como en el del Reglamento General de Protección de Datos34 de la Unión Europea deben respetarse las leyes de protección de datos o de localización a la hora de recopilar y procesar estos datos personales. Siempre investigue el marco legal vigente y recopile sólo los datos mínimos necesarios para su labor de supervisión. Independientemente de su plan de supervisión, dedique algún tiempo a evaluar y mitigar los posibles riesgos físicos, digitales y de información que podrían surgir como resultado de su trabajo, y consulte recursos como el capítulo del Manual de ciberseguridad para organizaciones de la sociedad civil del NDI relativo a cómo “Crear su plan de seguridad organizativa35 con el fin de hacer una evaluación de riesgos y acceder a recursos y consejos de seguridad según sea necesario.

La mayoría de las plataformas de software como servicio cuentan con páginas de Condiciones de servicio y Política de privacidad que explican los derechos de los usuarios y cómo administra la empresa la información personal. La sección sobre cómo Comunicar y almacenar los datos de manera segura36 en el Manual de ciberseguridad para organizaciones de la sociedad civil del NDI tiene información adicional sobre este tema

.

La organización y depuración de los datos van de la mano y consisten en categorizar y estructurar la información para, por ejemplo, clasificar o comparar los datos, etc. Una vez adoptada la herramienta de supervisión y recopilados los datos mediante la observación y otros medios, hay que organizar y depurar los datos para convertirlos en información útil. Esto se hace encontrando y resaltando patrones que se analizan desde una perspectiva contextualmente relevante. Especialmente cuando se trabaja con datos secundarios, puede ser necesario recopilar múltiples conjuntos de datos de más de una fuente para comprender a fondo el proceso político que se está supervisando. Fusionar estos conjuntos de datos implica cotejar y conciliar campos relacionados y conciliar referencias duplicadas. Es muy recomendable trabajar con un científico de datos que tenga experiencia en el tipo de datos que se recopilan. La forma en que organice y depure los datos influirá en el tipo de preguntas que podrá responder durante el proceso de análisis de datos.

Pueden ser necesarios cientos o miles de datos recopilados mediante herramientas de supervisión y acceso a los datos existentes para generar información que sea útil como prueba de si un proceso político está funcionando como se esperaba. Los datos pueden proceder de instituciones, acciones y comportamientos, así como de las percepciones de los ciudadanos. Es posible que se disponga de datos cuantitativos y cualitativos. Esos datos deben organizarse y depurarse para generar información que pueda ser útil para sus fines.

Mientras que los datos cuantitativos están intrínsecamente estructurados y se prestan al análisis, la organización de los datos cualitativos se realiza mejor mediante la codificación: repasar los datos, crear temas y luego analizar esos datos a través de los temas, sin sesgos preconcebidos.

El análisis de datos no consiste únicamente en agregar información y elaborar estadísticas. El análisis es más útil cuando se interpreta el significado de la información y se extraen conclusiones que pueden conducir a recomendaciones prácticas basadas en evidencia. Por ejemplo, ¿muestra el análisis cierta transparencia? ¿Indica la falta de voluntad o capacidad de una institución? ¿Se incluye la opinión pública en el proceso político y han creado las instituciones un espacio político para la participación ciudadana? ¿Se rinden cuentas a los ciudadanos y a otras instituciones?

La visualización de datos es importante en la supervisión de los procesos políticos, al igual que en la investigación, porque facilita la comprensión de la información y puede presentar mucha información de forma visual y concisa. Además, una buena visualización puede ser una herramienta eficaz para relatar el significado de los datos de forma convincente. Gráficos, infografías, cuadros de mando con análisis y vídeos con ilustraciones son tipos de técnicas de visualización de datos. Sin embargo, las visualizaciones de datos mal hechas pueden hacer más mal que bien, presentando los datos de forma engañosa. En el caso de conjuntos de datos más complejos, puede que sea necesario recurrir a diseñadores gráficos y científicos de datos para representar los datos de forma precisa e inteligible. Para visualizaciones más sencillas, existen herramientas que permiten a personas sin conocimientos especializados crear gráficos simples. Tableau37, Carto38 y Mapbox39 son especialmente adecuadas para conjuntos con datos de localización. Herramientas para crear infografías como Infogram40, Canva41 y Piktochart42 permiten crear visualizaciones sencillas en un abrir y cerrar de ojos. Google Sheets43 y AirTable44 (mediante extensiones) disponen incluso de algunas funciones básicas de visualización para crear tablas y gráficos desde la herramienta de repositorio de datos

Recomendaciones

  • La recopilación de datos puede llevar más tiempo del previsto, por lo que hay que prever tiempo suficiente para crear buenos sistemas y procesos de recopilación, introducción, almacenamiento, gestión, análisis y elaboración de informes.
  • Considere la posibilidad de identificar todo supuesto que se haga sobre el público objetivo, sus necesidades y motivaciones, y cómo interactuarán con los resultados de la supervisión. A partir de ahí, elabore preguntas de investigación para valorar estos supuestos y basar el diseño de la iniciativa y el plan de comunicación en un método que tenga el mayor impacto en el público objetivo.
  • Considere la posibilidad de realizar una revisión independiente de su metodología para comprobar si su herramienta puede generar datos de calidad y verificar que la información que está recopilando será esencial para lograr su objetivo.
  • Proporcione a su público destinatario información anticipada sobre los hallazgos iniciales y ofrezca la oportunidad de debatir estos resultados. Siempre es posible modificar y adaptar el proceso de supervisión a medida que se avanza, si con ello se fortalece la iniciativa.
  • La supervisión suele ser un proceso a largo plazo, y es posible que las personas involucradas cambien con el tiempo, especialmente en el campo político. Por lo tanto, el proceso debe documentarse y archivarse en un lugar accesible al personal adecuado de su organización.

Footnotes

21 Matt Bailey, Priyal Bhatt and Caroline Sinders, “Co/Act: diseño centrado en el humano para activistas.”

22 “Google Sheets,” DemTools, actualizado el 28 de julio de 2021, https://dem.tools/guides-and-tools/google-sheets.

23IBM SPSS Statistics", IBM, consultado el 29 de octubre de 2022, https://www.ibm.com/products/spss-statistics.

24 “Airtable" DemTools, actualizado el 14 julio de 2022, https://dem.tools/guides-and-tools/airtable.

25 “Google Sheets.”

26 “Survey Monkey.”

27 “Google Forms.”

28 “Fix My Community.”

29 “Apollo,” DemTools, actualizado el 9 de diciembre de 2021, https://dem.tools/guides-and-tools/apollo.

30 “Oarchive,” DemTools, actualizado el 22 de setiembre de 2021, https://dem.tools/guides-and-tools/0archive.

31 “Document Cloud,” DemTools, actualizado el 30 de agosto de 2021, https://dem.tools/guides-and-tools/document-cloud.

32 “Adobe Acrobat,” Adobe, consultado el 27 de octubre de 2022, https://www.adobe.com/acrobat.html.

33 “Amazon Textract,” Amazon Web Services, consultado el 27 de octubre de 2022, https://aws.amazon.com/textract/.

34 “General Data Protection Regulation (GDPR),” National Democratic Institute, actualizado el 17 de julio de 2018, https://www.ndi.org/gdpr.

35Crear su plan de seguridad organizativa", en Manual de ciberseguridad para organizaciones de la sociedad civil, Instituto Nacional Demócrata, consultado el 5 de octubre de 2022, https://cso.cyberhandbook.org/topics.

36 Comunicar y almacenar los datos de manera segura", en Manual de ciberseguridad para organizaciones de la sociedad civil, Instituto Nacional Demócrata, actualizado en julio de 2022 https://cso.cyberhandbook.org/topics/storing- data/communications-and-sharing-data.

37 “Tableau,” DemTools, actualizado el 28 de julio de 2021, https://dem.tools/guides-and-tools/tableau.

38 “Carto,” DemTools, actualizado el 28 de julio de 2021, https://dem.tools/guides-and-tools/carto.

39 “Mapbox,” DemTools, actualizado el 28 de julio de 2021, https://dem.tools/guides-and-tools/mapbox.

40 “Infogram,” DemTools, actualizado el 28 de julio de 2021, https://dem.tools/guides-and-tools/infogram.

41 “Canva,” DemTools, actualizado el 28 de julio de 2021, https://dem.tools/guides-and-tools/canva.

42 “Piktochart,” `DemTools, actualizado el 28 de julio de 2021, https://dem.tools/guides-and-tools/piktochart.

43 “Google Sheets.”

44 “AirTable.”