Abridor de datos

El proceso de abertura de datos involucra dos grandes etapas:

  • Publicacion: identificacion, colecta, almacenamiento
  • Consumo: aplicaciones, visualizaciones para el uso  y re-uso de datos que involucre uno o varios conjuntos de datos

Gerenciamento do ciclo de abertura de Dados

Principales desafíos del proceso de abertura

Superar los miedos:

  • “Soltar” los datos: los datos no son “míos”, son de todos
  • Exponer datos: la gente va a ver que los datos no son de buena calidad, que son incompletos, etc. Es una oportunidad de mejorar el sistema y los procesos internos. La calidad de los datos es fundamental para poder hacer análisis y previsiones.
  • Aumentar del trabajo: cambiar los procesos y sistemas existentes. Es una actividad más. El mismo proceso que antes terminaba en un archivo pdf, ahora termina en un archivo pdf y un archivo csv, los datos ya estaban en un formato procesable para poder analizarlos y llegar al pdf, no es tan grave!
  • Vencer trabas políticas: vender la idea y generar aliados
  • Involucrar a los consumidores de los datos: que desarrolladores hagan aplicaciones, visualizaciones, mashups, para transformar ese dato en un servicio de utilidad
  • Mantener al proyecto “vivo”: nuevos conjuntos de datos, datos actualizados, aplicaciones, feedback

¿Por donde comenzar?

  1. ¿Qué datos publicar?
  2. ¿En que formato
  3. ¿Donde están?
  4. ¿Como extraerlos?
  5. ¿Como mantenerlos actualizados?
  6. ¿Como disponibilizar?
  7. ¿Como usar?

1. ¿Qué datos publicar?

  • Datos publicos que ya deberian estar expuestos
  • Datos que tienen el potencial de ser abiertos garantizando su reutilizacion en nuevos proyectos

¿Cual es la prioridad?

  • Interactuar con la comunidad y los principales interesados
  • Canal de comunicación con usuarios actuales y potenciales: ciudadanos, empresas, organizaciones no gubernamentales y desarrolladores
  • Para dar el primer paso lo principal es considerar la viabilidad de la publicación de los datos y el interés de las personas

Simplicidad

  • Comenzar con un pequeño paso simple y rápido
  • No se tienen que publicar todos los datos inmediatamente

Estrategias para definir la lista de prioridades

  • Brainstorming
  • Empezar por lo más fácil
  • Lo que la ley exige
  • Lo que ya esta disponible

En el caso del Municipio de Maldonado, se empezó con el trabajo en software libre e informarse en la legislación de transparencia. Reconocen la facilidad al ser una institución pequeña, por lo que los pasos eran pocos. Además crearon un software que se conecta a una base de datos, se seleccionan los datos que no se pueden publicar (por ejemplo datos personales) y los restantes se transforman a formato CSV para ser publicados.

De Brasil de reconoce la utilidad de la ley de transparencia activa que ya establecía los datos que el Estado tenia obligación de publicar, por lo que fue un primer paso natural. Se le dio valor conectando datos de todo el proceso del gasto del Estado desde la planificación hasta la ejecución del gasto.

AGESIC empezó por los datos que ya estaban publicados en otros formatos, así como los datos crudos que utilizaron para la realización de informes publicados.  AGESIC provee el catálogo de Datos Abiertos, se le brinda acceso a los Organismos para que ingresen y cataloguen conjuntos de datos. Por ahora la mayoría de los datos están en formato CSV porque es lo más sencillo de llevar a cabo, el objetivo es llegar a publicar en RDF.

Se repiten los mismos desafíos en la mayoría de los equipos que empiezan a trabajar con Datos Abiertos.

2. ¿En qué formato publicar?

  • Debe ser procesable por máquina
  • Deben ser publicados los datos y los metadatos: ejemplo, archivo CSV y diccionario de datos

Mapa de ruta: 5 estrellas de Datos Abiertos

Es fundamental la planificación: se deben definir procesos internos, documentar esos procesos para que pueda ser repetido.

El proceso de abertura de datos es incremental: aprender de los errores y mejorar en cada iteración

3. ¿Donde están?

En general están en bases de datos y planillas, por lo que ya están estructurados. Solamente hay que adaptarlos para su publicación: XML, RDF, CSV

4. ¿Como extraerlos?

Es fundamental facilitar lo máximo posible con herramientas automatizadas para generar los datos abiertos.

Existe un proceso independiente de las herramientas de análisis de datos, tiene que ser alguien que conozca el dominio y sepa lo que es relevante para estar en el conjunto de datos a publicar, no es un tema técnico.

Analizar como están organizados los datos, si existe una jerarquía, si hay una conexión natural entre los datos.

Analizar si existen metadatos documentados, sino será necesario crearlos, documentar.

Es necesario conocer el proceso de generación de los datos y cual es la frecuencia de actualización de la base de datos,  para definir en el proceso de apertura de datos, cada cuanto tiempo voy a actualizar mi conjunto de datos publicados.

También es importante conocer y analizar la infraestructura de almacenamiento y distribución de datos, son datos centralizados o distribuidos?

5. ¿Como mantenerlos actualizados?

Incluir la publicación de datos como parte de los procesos existentes.

6. ¿Como disponibilizar?

Tienen que estar disponibles para bajar en formato abierto y procesable por máquina.

Una práctica interesante es transformar los datos abiertos mas fáciles de encontrar y generar catálogos de datos

Datos actualizados muy frecuentemente puede ser disponibilizados via API

Datos mas estables, se publican integralmente para bajar y cada cierto tiempo definido se actualizan, es fundamental no olvidar la actualización de ese dato.

Aunque se publiquen parcialmente los datos, ya es posible que agreguen valor. No es necesario esperar a tener absolutamente todos los datos.

7. ¿Como usar?

  • Aplicaciones para análisis de datos
  • Visualizaciones de datos
  • Planes de divulgación y participación: es necesario divulgar la iniciativa y garantizar la colaboración y la participación de la sociedad de una menar general y de los órganos de gobierno.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

w

Conectando a %s