Wiki

Este apartado muestra contenidos de tipo wiki que permiten explicar terminología de Open Data, Data science, etc.

 

Datos abiertos (Open Data): Los datos abiertos son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en que aparecen.

 
Conjunto de datos (Dataset): Un conjunto de datos es una colección de datos habitualmente tabulada. 

En general, y en su versión más simple, un conjunto de datos corresponde a los contenidos de una única tabla de base de datos o una única matriz de datos estadística, donde cada columna de la tabla representa una variable en particular, y cada fila representa a un miembro determinado del conjunto de datos en cuestión.

Un conjunto de datos contiene los valores para cada una de las variables, como por ejemplo la altura y el peso de un objeto, que corresponden a cada miembro del conjunto de datos. Cada uno de estos valores se conoce con el nombre de dato. El conjunto de datos puede incluir datos para uno o más miembros en función de su número de filas.

 
Distribución de datos: 
la distribución de estos datos debe ser universal, en el sentido más amplio de la palabra. Es decir, que no pueden existir restricciones a personas o instituciones para acceder a dichos datos, ni límites impuestos por los programas informáticos empleados, ni usos limitados (educación o investigación sólo).


Licencias de datos abiertas: cada portal de datos abiertos en España determina un tipo de licencia que acompañe a la publicación de los conjuntos de datos, pudiendo otorgar libertad para compartir, distribuir, adaptar o utilizar los datos así como para crear obras derivadas.


Datos abiertos enlazados (Linked Open Data): los datos enlazados o datos vinculados describe un método de publicación de datos estructurados para que puedan ser interconectados y más útiles. Se basa en tecnologías Web estándar, tales como HTTP, RDF y los URI, pero en vez de utilizarlos para servir páginas web para los lectores humanos, las extiende para compartir información de una manera que puede ser leída automáticamente por ordenadores. Esto permite que sean conectados y consultados datos de diferentes fuentes.