O que é o banco de dados TrID?
O banco de dados TrID contém assinaturas de arquivos de mais de 10.000 tipos de arquivos. Uma assinatura de arquivo pode ser usada para determinar o formato do arquivo, seja um arquivo .DOC ou um arquivo .TXT.
A base de dados é constantemente atualizada e expandida. Devido ao grande banco de dados, um arquivo desconhecido pode ser analisado com muita precisão. Um 'Identificador de Arquivo TrID Online' também está disponível para isso, que lê o arquivo a ser analisado e o compara com o banco de dados. Os resultados são apresentados na ordem de maior probabilidade.
TrID foi lançado em 2004 por Marco Pontello (Itália).
Identificar o tipo de arquivo por assinatura de arquivo é mais preciso do que por extensão de arquivo. Leia também o próximo parágrafo:
Como determinar o formato do arquivo
O formato de um arquivo, ou seja, o tipo de arquivo pode ser determinado pelas três características a seguir:
- Nome do arquivo (extensão do arquivo)
Na maioria das vezes, o formato do arquivo é determinado pela extensão do arquivo. O identificador de formato de arquivo está após o último ponto do nome do arquivo. Como essas extensões de nome de arquivo eram limitadas a três caracteres em sistemas operacionais antigos, ainda hoje a maioria dos formatos de arquivo é identificada por um identificador de um a três dígitos, por exemplo, .H ou .DOC.
Determinar o tipo de arquivo por meio da extensão de arquivo nem sempre é preciso, pois formatos diferentes usam a mesma extensão de arquivo, o usuário pode renomear acidentalmente uma extensão de arquivo e as versões atuais do Windows mascaram a extensão do arquivo e vírus (por exemplo, 'photo.jpg.exe') podem se esconder em 'photo.jpg'. - Conteúdo do arquivo (assinatura do arquivo)
Muitas vezes, o conteúdo de um arquivo sempre começa com a mesma string. Se você abrir, por exemplo, um arquivo PDF com um editor de texto, o arquivo começa com '% PDF-1'. Os primeiros caracteres em um arquivo PNG, por outro lado, são 'â° PNG'. Como é possível diagnosticar o tipo de arquivo com muito mais precisão do que com a extensão do arquivo com base nessas sequências de caracteres definidas, essas sequências também são chamadas de assinaturas de arquivo ou 'números mágicos'.
O TrID banco de dados contém assinaturas de arquivos e tipos de arquivos associados. - Metadados (tipo MIME)
A determinação do tipo de arquivo por meio de MInternet Mail Exstentions é realmente mais preciso, mas os metadados devem ser transmitidos separadamente no cabeçalho.
De que forma as assinaturas de arquivos podem ser exibidas?
Assinaturas de arquivo são dados usados para identificar ou verificar um tipo de arquivo. Essas assinaturas também são conhecidas como números mágicos e podem ser representadas em um dos seguintes formatos:
- HEX: um byte (8 bits) é representado como um número de dois dígitos com 16 dígitos (0, ..., 9, A, ..., F) (sistema hexadecimal )
Se você abrir um arquivo PDF em um editor HEX, ele começará com a string 25 50 44 46 2D 31 2E. - ISO 8859-1: texto em codificação de caracteres de 8 bits
Se você abrir um arquivo PDF em um editor de texto normal, ele começará com a string % PDF-1. - ASCII: codificação de caracteres de 7 bits que mapeia exatamente para o intervalo inferior da ISO 8859-1 (de 32 a 126).
Se você abrir um arquivo PDF em um editor de texto ASCII , ele começa com a string % PDF-1.