los cat
y tac
Los comandos muestran el contenido de los archivos de texto, pero hay más en ellos de lo que parece. Sumérjase un poco más y aprenda algunos trucos productivos de la línea de comandos de Linux.
Estos son dos pequeños comandos sencillos, que a menudo se descartan por ser solo eso: demasiado simples para ser de utilidad real. Pero una vez que conozca las diferentes formas en que puede usarlos, verá que son estupendamente capaces de hacer su parte justa del trabajo pesado cuando se trata de trabajar con archivos.
El comando del gato
cat
se utiliza para examinar el contenido de los archivos de textoy unir partes de archivos para formar un archivo más grande.
En un momento, en la era del acceso telefónico módem: Los archivos binarios a menudo se dividían en varios archivos más pequeños para facilitar la descarga. En lugar de descargar un archivo grande, retiró cada archivo más pequeño. Si un solo archivo no se descargó correctamente, simplemente recuperaría ese archivo nuevamente.
Desde luego, entonces necesitaba una forma de reconstituir la colección de archivos más pequeños en un solo archivo binario de trabajo. Ese procedimiento se llamó concatenación. Y ahí es donde cat
entró y de dónde toma su nombre.
Las conexiones de banda ancha y fibra han causado que esa necesidad particular se desvanezca, del mismo modo que los sonidos chirriantes de las llamadas telefónicas, por lo tanto, ¿qué queda para cat
¿hacer hoy? Mucho en realidad.
Visualización de un archivo de texto
Tener cat
listar el contenido de un archivo de texto en una ventana de terminal, use el siguiente comando.
Asegúrese de que el archivo sea un archivo de texto. Si intenta listar el contenido de un archivo binario en la ventana del terminal, los resultados serán impredecibles. Puede terminar con una sesión de terminal bloqueada o algo peor.
cat poem1.txt
El contenido del archivo poem1.txt se muestra en la ventana de terminal.
Eso es solo la mitad del famoso poema. ¿Dónde está el resto? Aquí hay otro archivo llamado poem2.txt. Podemos hacer cat
enumere el contenido de varios archivos con un comando. Todo lo que haremos es listar los archivos en orden en la línea de comando.
cat poem1.txt poem2.txt
Eso se ve mejor; ahora tenemos el poema completo.
Utilizar gato con menos
El poema está todo allí, pero pasó por la ventana demasiado rápido para leer los primeros versos. Podemos canalizar la salida desde cat
dentro less
y desplácese hacia abajo por el texto a nuestro propio ritmo.
cat poem1.txt poem2.txt | less
Ahora podemos avanzar y retroceder por el texto en una secuencia, aún cuando se encuentre en dos archivos de texto separados.
Numeración de líneas en un archivo
Podemos hacer que cat numere las líneas en el archivo a medida que se muestra. Para hacer esto, usamos el -n
opción (número).
cat -n poem1.txt
Las líneas están numeradas a medida que se muestran en la ventana del terminal.
No numere las líneas en blanco
Logramos tener las líneas numeradas por cat
, pero además se están contando las líneas en blanco entre los versículos. Para tener las líneas de texto numeradas pero para ignorar las líneas en blanco, use el -b
Opción (número no en blanco).
cat -b poem1.txt
Ahora las líneas de texto están numeradas y las líneas en blanco se saltan.
No muestre varias líneas en blanco
Si hay secciones de líneas consecutivas en blanco en un archivo, podemos preguntar cat
para ignorar todas las líneas en blanco menos una. Mira este archivo.
El siguiente comando causará cat
para mostrar solo una línea en blanco de cada grupo de líneas en blanco. La opción que necesitamos para lograr esto es la -s
(espacio en blanco).
cat -s poem1.txt
Esto no afecta el contenido del archivo de ninguna manera; simplemente cambia la forma cat
muestra el archivo.
Pestañas de visualización
Si desea saber si los espacios en blanco son causados por espacios o tabulaciones, puede averiguarlo usando el -T
opción (mostrar-pestañas).
cat -T poem1.txt
Las pestañas están representadas por los caracteres “^ I”.
Visualización de los extremos de las líneas
Puede chequear si hay espacios en blanco finales usando el -E
Opción (show-ends).
cat -E poem1.txt
Los finales de las líneas están representados por el carácter «$».
Concatenar archivos
No tiene sentido tener un poema guardado en dos archivos, con la mitad en cada uno. Unámoslos y creemos un nuevo archivo con el poema completo.
cat poem1.txt poem2.txt > jabberwocky.txt
usemos cat
para chequear nuestro nuevo archivo:
cat jabberwocky.txt
Nuestro nuevo archivo contiene el contenido de los otros dos archivos.
Agregar texto a un archivo existente
Eso es mejor, pero en realidad, no es el poema completo. Falta el último verso. El último verso de Jabberwocky es el mismo que el primer verso.
Si tenemos el primer verso en un archivo, podemos agregarlo al final del archivo jabberwocky.txt y tendremos el poema completo.
En este siguiente comando, tenemos que utilizar >>
, No solo >
. Si usamos un solo >
bien Sobrescribir jabberwocky.txt. No queremos hacer eso. Queremos adjuntar texto al final.
cat first_verse.txt >> jabberwocky.txt
Revisemos el contenido del archivo jabberwocky.txt:
cat jabberwocky.txt
Y para terminar, todas las partes del poema están juntas.
Redirigir stdin
Puede redirigir la entrada desde el teclado a un archivo usando cat
. Todo lo que escribe se redirige al archivo hasta que presione Ctrl + D. Tenga en cuenta que usamos un solo >
debido a que queremos crear el archivo (o sobrescribirlo, si existe).
cat > my_poem.txt
Podemos comenzar a escribir tan pronto como emitamos el comando. Pulsamos Ctrl + D cuando hayamos terminado. Posteriormente podemos verificar el contenido del nuevo archivo con:
cat my-poem.txt
Ese sonido como una turbina lejana probablemente sea Lewis Carroll girando en su tumba a gran velocidad.
El comando tac
tac
es parecido a cat
, pero enumera el contenido de los archivos en orden inverso.
Veamos eso:
tac my_poem.txt
Y el archivo se muestra en la ventana de terminal en orden inverso. En esta circunstancia, no tiene ningún efecto sobre sus méritos literarios.
Usando tac con stdin
Usando tac
sin un nombre de archivo hará que opere en la entrada del teclado. Al presionar Ctrl + D se detendrá la etapa de entrada, y tac enumerará en orden inverso lo que haya escrito.
tac
Cuando se presiona Ctrl + D, la entrada se invierte y se muestra en la ventana de terminal.
Uso de tac con archivos de registro
Aparte de los trucos de salón de baja calidad, puede tac
hacer algo útil? Sí puede. Muchos archivos de registro añaden sus entradas más recientes al final del archivo. Usando tac
(y, contraintuitivamente, head
) podemos mostrar la última entrada en la ventana de la terminal.
Usamos tac
para enumerar el archivo syslog al revés y canalizarlo a head
. Contando head
para imprimir solo la primera línea que recibe (que gracias a tac
es la última línea del archivo), vemos la última entrada en el archivo syslog.
tac /var/log/syslog | head -1
head
imprime la última entrada del archivo syslog y posteriormente sale.
Tenga en cuenta que head
sólo está imprimiendo una línea, como solicitamos, pero la línea es tan larga que se envuelve dos veces. Es es por esto que que se ven como tres líneas de salida en la ventana de la terminal.
Utilizar tac con registros de texto
El ultimo truco tac
tiene bajo la manga es una belleza.
De forma general, tac
opera en archivos de texto trabajando a través de ellos línea por línea, de abajo hacia arriba. Una línea es una secuencia de caracteres terminada por un carácter de nueva línea. Pero podemos decir tac
para trabajar con otros delimitadores. Esto nos posibilita tratar «fragmentos» de datos dentro del archivo de texto como registros de datos.
Digamos que tenemos un archivo de registro de algún programa que necesitamos revisar o analizar. Echemos un vistazo a su formato con less
.
less logfile.dat
Como podemos ver, hay un formato repetido para el archivo. Hay secuencias de tres líneas de hexadecimal valores. Cada conjunto de tres líneas hexadecimales cuenta con una línea de etiqueta que comienza con “= SEQ”, seguida de una secuencia de dígitos.
Si nos desplazamos hasta el final del archivo, podemos ver que hay muchos de estos registros. El último tiene el número 865.
Supongamos que, por cualquier razón, necesitamos trabajar con este archivo en orden inverso, registro de datos por registro de datos. Debe conservarse el orden de las tres líneas hexadecimales de cada registro de datos.
Tomaremos nota de que las últimas tres líneas del archivo comienzan con los valores hexadecimales 93, E7 y B8, en ese orden.
Usemos tac
para invertir el archivo. Es un archivo muy largo, por lo tanto lo canalizaremos a less
.
tac logfile.dat | less
Eso invierte el archivo, pero no es el resultado que queremos. Queremos que el archivo se invierta, pero las líneas de cada registro de datos deben estar en su orden original.
Registramos previamente que las últimas tres líneas del archivo comienzan con los valores hexadecimales 93, E7 y B8, en ese orden. El orden de esas líneas se ha invertido. Al mismo tiempo, las líneas «= SEQ» ahora son debajo cada conjunto de tres líneas hexadecimales.
tac
al rescate.
tac -b -r -s ^=SEQ.+[0-9]+*$ logfile.dat | less
Analicemos eso.
los -s
La opción (separador) informa tac
lo que queremos utilizar como delimitador entre nuestros registros. Dice tac
no utilizar su carácter de nueva línea frecuente, sino utilizar nuestro separador en su lugar.
los -r
(regex) la opción dice tac
para tratar la cadena de separación como un expresión regular.
los -b
(antes) causas de la opción tac
para listar el separador antes de cada registro en lugar de después de él (que es la posición frecuente de su separador predeterminado, el carácter de nueva línea).
los -s
(separador) cadena ^=SEQ.+[0-9]+*$
se descifra de la próxima manera:
los ^
carácter representa el comienzo de la línea. A esto le sigue =SEQ.+[0-9]+*$
. Esto instruye tac
para buscar cada aparición de «= SEQ». al comienzo de una línea, seguido de cualquier secuencia de dígitos (indicado por [0-9]
), y seguido de cualquier otro conjunto de caracteres (indicado por *$
).
Estamos canalizando todo en less
, como siempre.
Nuestro archivo ahora se presenta en orden inverso con cada línea de etiqueta «= SEQ» listada antes de sus tres líneas de datos hexadecimales. Las tres líneas de valores hexadecimales están en su original orden dentro de cada registro de datos.
Podemos chequear esto simplemente. El primer valor de las primeras tres líneas de hexadecimal (que eran las últimas tres líneas antes de que se invirtiera el archivo) coincide con los valores de los que tomamos un registro anterior: 93, E7 y B8, en ese orden.
Eso es todo un truco para una ventana de terminal de una sola línea.
Todo tiene un propósito
En el mundo de Linux, inclusive los comandos y utilidades aparentemente más simples pueden tener propiedades sorprendentes y poderosas.
La filosofía de diseño de utilidades simples que hacen una cosa bien, y que interactúan fácilmente con otras utilidades, ha dado lugar a algunos pequeños comandos extraños, como tac
. A primera vista, parece un poco extraño. Pero cuando miras debajo de la superficie, hay un poder inesperado que puedes aprovechar para tu ventaja.
O, como dice otra filosofía, «No desprecies a la serpiente por no tener cuernos, debido a que ¿quién puede decir que no se convertirá en dragón?»
setTimeout(function(){
!function(f,b,e,v,n,t,s)
{if(f.fbq)return;n=f.fbq=function(){n.callMethod?
n.callMethod.apply(n,arguments):n.queue.push(arguments)};
if(!f._fbq)f._fbq=n;n.push=n;n.loaded=!0;n.version=’2.0′;
n.queue=[];t=b.createElement(e);t.async=!0;
t.src=v;s=b.getElementsByTagName(e)[0];
s.parentNode.insertBefore(t,s) } (window, document,’script’,
‘https://connect.facebook.net/en_US/fbevents.js’);
fbq(‘init’, ‘335401813750447’);
fbq(‘track’, ‘PageView’);
},3000);