Cómo trabajar con texto delimitado por tabulaciones (tsv)

El texto delimitado por tabulaciones, también conocido como valores separados por tabulaciones (TSV), es un formato que se puede crear o visualizar en la mayor parte de los programas de hojas de cálculos y editores de texto. El formato TSV sigue estas reglas:
  • Cada entrada del archivo contiene una única línea.
  • La primera línea del archivo es el encabezado y etiqueta cada campo.
  • Un campo contiene datos, como un número o texto.
  • Los campos están separados por tabulaciones.
  • Cada línea contiene el mismo número de campos.
El siguiente ejemplo muestra el contenido de un archivo de texto simple delimitado por tabulaciones.

Título<tabulación>Autor<tabulación>Estado<tabulación>Tapa
Orgullo y prejuicio<tabulación>Jane Austen<tabulación>usado<tabulación>en pasta blanda
Las aventuras de Huckleberry Finn<tabulación>Mark Twain<tabulación>nuevo<tabulación>tapa dura
El arte de la guerra<tabulación>Sun Tzu<tabulación>usado<tabulación>tapa dura

La línea en negrita es el encabezado y determina el orden de la información en las líneas siguientes. El primer campo de cada línea debería corresponder siempre al primer encabezado (por ejemplo, "Título" se corresponde con Orgullo y prejuicio). Los otros encabezados y campos deberían corresponderse de manera similar.

Es importante tener en cuenta que los caracteres de tabulación normalmente sólo son visibles como un espacio en blanco. Debido a que los campos tienen longitudes diferentes, el archivo de texto delimitado por tabulaciones en un editor de texto tendrá probablemente un aspecto similar a éste:

Título    Autor    Tapa   Estado
Orgullo y prejuicio     Jane Austen    usado tapa blanda
Las aventuras de Huckleberry Finn     Mark Twain     nuevo  tapa dura
El arte de la guerra     Sun Tzu   usado tapa dura

Sin columnas o tabulaciones es difícil ver qué texto se corresponde con cada encabezado. Resulta mucho más sencillo visualizarlo en columnas:

Título <tabulación> Autor <tabulación> Estado <tabulación> Tapa
Orgullo y prejuicio <tabulación> Jane Austen <tabulación> usado <tabulación> tapa blanda
Las aventuras de Huckleberry Finn <tabulación> Mark Twain <tabulación> nuevo <tabulación> tapa dura
El arte de la guerra <tabulación> Sun Tzu <tabulación> usado <tabulación> tapa dura
 
Los programas de hoja de cálculo ayudan a crear archivos de texto claros delimitados por tabulaciones, en donde cada línea de información contiene una fila y cada campo ocupa una columna:

      A B C D
1 Título Autor Estado Tapa
2 Orgullo y prejuicio Jane Austen usado tapa blanda
3 Las aventuras de Huckleberry Finn Mark Twain nuevo tapa dura
4 El arte de la guerra Sun Tzu usado tapa dura
 
Microsoft Excel y Google Docs son aplicaciones que te permiten convertir hojas de cálculo en archivos de texto delimitados por tabulaciones.