Formatos de datasets Volver


Conoceremos conceptos básicos sobre formatos de datasets:


Tabular

Dispuesto en filas y columnas como puede ser cualquier archivo Excel o Google Spreadsheet. Propietario: se requiere un programa especial para abrirlo.

Indetificamos las siguientes partes:

  • Cabecera: Primera fila que describe las propiedades.
  • Fila: Valores de las propiedades de una observación. Entidad: película
  • Columna: Valores para todas las observaciones de una determinada propiedad. Ej: Año
  • Dato: Intersección entre fila y columna.
Película Año Oscars
Ben-Hur195911
Titanic199711
El Señor de los Anillos: el retorno del Rey200311
Lo que el viento se llevó193910
West Side Story106110

CSV , TSV

CSV: Comma Separated Value. Archivos de texto con información tabular. Formato libre, liviano y abierto. Puede ser leído usando un editor de texto. Información en forma de tabla. Las columnas se separa con "," y las filas con "Enter".

"Película","Año","Oscars"
"Ben-Hur",1959,11
"Titanic",1997,11
"El Señor de los Anillos: el retorno del Rey",2003,11
"Lo que el viento se llevó",1939,10
"West Side Story",1061,10

TSV: Tab Separated Value. Misma estructura que CSV pero las columnas se separan con "TAB".

"Película"  "Año" "Oscars"
"Ben-Hur" 1959  11
"Titanic" 1997  11
"El Señor de los Anillos: el retorno del Rey" 2003  11
"Lo que el viento se llevó" 1939  10
"West Side Story" 1061  10

XML

XML: eXtensible Markup Language. Se define estructura mediante el uso de tags. El lenguaje HTML de la web está basado en XML.

<pelicula>
  <nombre>Ben-Hur</nombre>
  <anio>1959</anio>
  <oscars>11</oscars>
</pelicula>

XML nos permite crear colecciones:

<peliculas>
  <pelicula>
    <nombre>Ben-Hur</nombre>
    <anio>1959</anio>
    <oscars>11</oscars>
  </pelicula>
  <pelicula>
    <nombre>Titanic</nombre>
    <anio>1997</anio>
    <oscars>11</oscars>
  </pelicula>
  <pelicula>
    ...
  </pelicula>
  <pelicula>
    ...
  </pelicula>
</peliculas>

XML nos permite también crear estructuras de datos anidadas.

<pelicula>
  <nombre>Titanic</nombre>
  <anio>1997</anio>
  <oscars>11</oscars>
  <director>
    <nombre>James</nombre>
    <apellido>Cameron</apellido>
  </director>
</pelicula>

XML nos permite también combinar estructuras de datos anidadas con colecciones.

<peliculas>
  <pelicula>
    <nombre>Titanic</nombre>
    <anio>1997</anio>
    <oscars>11</oscars>
    <director>
      <nombre>James</nombre>
      <apellido>Cameron</apellido>
    </director>
    <protagonistas>
      <persona>
        <nombre>Leonardo</nombre>
        <apellido>Di Caprio</apellido>
      </persona>
      <persona>
        <nombre>Kate</nombre>
        <apellido>Winslet</apellido>
      </persona>
    </protagonistas>
  </pelicula>
  <pelicula>
    ...
  </pelicula>
  <pelicula>
    ...
  </pelicula>
</peliculas>

Ver además: XML validator

JSON

JSON: JavaScript Object Notation. Se define estructura mediante el uso llaves, corchetes y comas usados en el lenguaje Javascript.

{
  "nombre":"Ben-Hur",
  "anio":1959,
  "oscars":11
}

JSON nos permite crear colecciones:

[
  {
    "nombre":"Ben-Hur",
    "anio":1959,
    "oscars":11
  },
  {
    "nombre":"Titanic",
    "anio":1997,
    "oscars":11
  },
  {
  ...
  },
  {
  ...
  }
]

JSON nos permite también crear estructuras de datos anidadas.

{
  "nombre":"Titanic",
  "anio":1997,
  "oscars":11,
  "director": {
    "nombre": "James",
    "apellido": "Cameron"
  }
}

JSON nos permite también combinar estructuras de datos anidadas con colecciones.

[
  {
    "nombre":"Titanic",
    "anio":1997,
    "oscars":11,
    "director": {
      "nombre": "James",
      "apellido": "Cameron"
    },
    "protagonistas":[
      {
        "nombre": "Leonardo",
        "apellido": "Di Caprio"
      },
      {
        "nombre": "Kate",
        "apellido": "Winslet"
      }
    ]
  },
  {
  ...
  },
  {
  ...
  }
]

Ver además: JSON validator


Volver