¿Qué es la base de datos TrID?
La base de datos TrID contiene firmas de archivos de más de 10000 tipos de archivos. Se puede usar una firma de archivo para determinar el formato del archivo, ya sea un archivo .DOC o un archivo .TXT.
La base de datos se actualiza y amplía constantemente. Debido a la gran base de datos, un archivo desconocido se puede analizar con mucha precisión. Para esto también está disponible un 'Identificador de archivo en línea TrID', que lee el archivo a analizar y lo compara con la base de datos. Los resultados se presentan en el orden de mayor probabilidad.
TrID fue lanzado en 2004 por Marco Pontello (Italia).
La identificación del tipo de archivo por la firma del archivo es más precisa que por la extensión del archivo. Lea también el siguiente párrafo:
Cómo determinar el formato de archivo
El formato de un archivo, es decir, el tipo de archivo se puede determinar por las siguientes tres características:
- Nombre de archivo (extensión de archivo)
La mayoría de las veces, el formato de archivo está determinado por la extensión de archivo. El identificador de formato de archivo se encuentra después del último punto del nombre del archivo. Dado que estas extensiones de nombre de archivo estaban limitadas a tres caracteres en los sistemas operativos antiguos, incluso hoy en día, la mayoría de los formatos de archivo se identifican con un identificador de uno a tres dígitos, p. .H o .DOC.
Determinar el tipo de archivo por medio de la extensión de archivo no siempre es preciso, ya que diferentes formatos usan la misma extensión de archivo, el usuario puede cambiar accidentalmente el nombre de una extensión de archivo y las versiones actuales de Windows enmascaran la extensión de archivo y los virus (por ejemplo, 'photo.jpg.exe') pueden ocultarse debajo de 'photo.jpg'. - Contenido del archivo (firma del archivo)
A menudo, el contenido de un archivo siempre comienza con la misma cadena. Si abre, p. un archivo PDF con un editor de texto, el archivo comienza con '% PDF-1'. Los primeros caracteres en un archivo PNG, por otro lado, son 'â° PNG'. Dado que uno puede diagnosticar el tipo de archivo con mucha más precisión que con la extensión de archivo sobre la base de tales cadenas de caracteres definidas, estas cadenas también se denominan firmas de archivo o 'números mágicos'.
El TrID la base de datos contiene firmas de archivos y tipos de archivos asociados. - Metadatos (tipo MIME)
La determinación del tipo de archivo mediante Mmultipropósito Iinternet Mail Exstentions es de hecho más preciso, pero los metadatos deben transmitirse por separado en el encabezado.
¿De qué manera se pueden mostrar las firmas de los archivos?
Las firmas de archivos son datos que se utilizan para identificar o verificar un tipo de archivo. Estas firmas también se conocen como números mágicos y se pueden representar en uno de los siguientes formatos:
- HEX: Un byte (8 bits) se representa como un número de dos dígitos con 16 dígitos (0, ..., 9, A, ..., F) (sistema hexadecimal )
Si abre un archivo PDF en un editor HEX, comienza con la cadena 25 50 44 46 2D 31 2E. - ISO 8859-1: texto en codificación de caracteres de 8 bits
Si abre un archivo PDF en un editor de texto normal, comienza con la cadena % PDF-1. - ASCII: codificación de caracteres de 7 bits que se asigna exactamente al rango inferior de ISO 8859-1 (de 32 a 126).
Si abre un archivo PDF en un editor de texto ASCII , comienza con la cadena % PDF-1.