Las 5 estrellas de los datos abiertos son un sistema de puntuación propuesto por Tim Berners-Lee, inventor de la web, para puntuar la calidad de los datos que se abren al público con el objetivo de que puedan ser reutilizables para estos fines.
La característica principal que determina la puntuación
Lo que marca que estos datos abiertos tengan mejor o menos puntuación sobre esta clasificación es la facilidad con la que se puedan reutilizar, es decir, la forma en la que estos son presentados, y si el formato es mejor o peor en este sentido.
Puntuación de los datos abiertos
A continuación enumeramos de peor a mejor, la puntuación que se pueden dar a los datos abiertos en función de su facilidad de reutilización. (De 1 estrella a 5 estrellas)
1 estrella
Es la forma más primitiva con la que unos datos abiertos se publican en la web. Su único requisito precisamente es este, que esté publicado en alguna web sin importar el formato. Puede ser desde una hoja borrosa medio mal escaneada, un PDF o una foto que alguien sacó con un móvil y la colgó en JPG.
Como podrás imaginar, liberar unos datos en una web con este formato, lo hace efectivamente que sean datos abiertos, pero se necesitará de mucho trabajo y constancia para que un gran volumen de datos presentados de este modo puedan ser reutilizados.
Por lo tanto, a datos abiertos con una estrella, solo se les pide que estén accesibles en la web.
2 estrellas
En el siguiente nivel, nos encontramos con un formato estructurado de datos abiertos en la web. Son datos abiertos que están estructurados de algún modo que sea más fácil de manipular, como hojas de cálculo con columnas que tengan campos agrupados en función de determinadas características.
Los datos abiertos con 2 estrellas por lo tanto, son datos abiertos presentados en un formato estructurado con un software propietario, como es el ejemplo más conocido, una hoja de Excel.
3 estrellas
En el ecuador de la puntuación de los datos abiertos, nos encontramos con datos estructurados de la misma forma que en el nivel anterior, pero con la diferencia de que estos datos están estructurados en un software libre y no en un software propietario. Los ejemplos más conocidos de software no propietarios en los cuales se pueden presentar datos estructurados, son hojas de cálculo de OpenOffice, o ficheros CSV.
En definitiva, podemos decir que los datos abiertos con 3 estrellas, son aquellos que están presentados en un formato estructurado a través de un software libre y no un software propietario.
4 estrellas
Los datos abiertos con 4 estrellas son un salto cuantitativo. Y es que en este caso, los datos abiertos en lugar de presentarse en ficheros, se presentan directamente en la web, a través de herramientas que proporciona la W3C.
Un método a seguir es que cada proyecto de una empresa o una administración pública con datos abiertos que quiera liberar para su reutilización, tengan una dirección web determinada, donde se pueden encontrar los datos perfectamente estructurados, con campos apropiadamente identificados.
Por lo tanto, los datos abiertos con 4 estrellas, son datos estructurados adecuadamente en URIs para tal efecto y presentados directamente en una página web, con unos estándares recomendados por el W3C.
5 estrellas
Los datos abiertos con 5 estrellas son la culminación de unos datos perfectamente reutilizables, donde entra en juego la colaboración y el bien hacer no de una organización en concreto (la que libera los datos en primera instancia), sino también de la otra organización que libera datos similares.
Para obtener las 5 estrellas, acorde con esta clasificación, las organizaciones, instituciones o empresas deberán seguir unos estándares predefinidos de organismos superiores, de modo que sean presentados del mismo modo, con la finalidad de que se puedan realizar consultas comunes.
Si una base de datos presenta los mismos datos, pero con por ejemplo nombres de columnas o definiciones diferentes, será más difícil para aplicaciones o personas que quieran reutilizar estos datos, ponerlas en conjunto. Es por ello, que debe existir estos estándares, como una guía a seguir predefinida que puedan seguir todas las organizaciones.
Como conclusión, la puntuación máxima de datos abiertos con 5 estrellas son un conjunto de datos estructurados adecuadamente en URIs para tal efecto presentados directamente en una página web, con los estándares recomendados por el W3C combinados y aunados con otros datos similares de otras organizaciones o similares que han seguido los mismos estándares de categorización de los datos abiertos.
En definitiva
El movimiento de los datos abiertos tiene mucho camino por recorrer y aún se están estandarizando las pautas que permitan categorizar la ingente información que cada vez más se va a obtener día a día y cuya reutilización puede proveer de enormes beneficios tanto económicos como sociales.
Esta clasificación y puntuación de los datos abiertos es una base sobre la cual pueden trabajar aquellas instituciones, organizaciones, administraciones y empresas que están empezando a liberar datos, y es un pilar básico para conocer cuáles son las mejores prácticas a la hora de proveer a las personas de esta información que puede ser tan valiosa tanto para personas individuales como para empresas.