Qu'est-ce que la base de données TrID ?
La base de données TrID contient des signatures de fichiers de plus de 10 000 types de fichiers. Une signature de fichier peut être utilisée pour déterminer le format de fichier, qu'il s'agisse d'un fichier .DOC ou d'un fichier .TXT.
La base de données est constamment mise à jour et élargie. En raison de la grande base de données, un fichier inconnu peut être analysé de manière très précise. Un 'Online TrID File Identifier' est également disponible pour cela, qui lit le fichier à analyser et le compare avec la base de données. Les résultats sont présentés dans l'ordre de probabilité la plus élevée.
TrID a été lancé en 2004 par Marco Pontello (Italie).
L'identification du type de fichier par signature de fichier est plus précise que par extension de fichier. Veuillez également lire le paragraphe suivant :
Comment déterminer le format de fichier
Le format d'un fichier, c'est-à-dire le type de fichier, peut être déterminé par les trois caractéristiques suivantes :
- Nom de fichier (extension de fichier)
Le plus souvent, le format de fichier est déterminé par l'extension de fichier. L'identificateur de format de fichier se trouve après le dernier point du nom de fichier. Étant donné que ces extensions de nom de fichier étaient limitées à trois caractères dans les anciens systèmes d'exploitation, même aujourd'hui, la plupart des formats de fichiers sont identifiés par un identifiant à un à trois chiffres, par ex. .H ou .DOC.
Déterminer le type de fichier au moyen de l'extension de fichier n'est pas toujours précis, car différents formats utilisent la même extension de fichier, l'utilisateur peut accidentellement renommer une extension de fichier et les versions actuelles de Windows masquent l'extension de fichier et les virus (par exemple 'photo.jpg.exe') peuvent se cacher sous 'photo.jpg'. - Contenu du fichier (signature du fichier)
Souvent, le contenu d'un fichier commence toujours par la même chaîne. Si vous ouvrez par ex. un fichier PDF avec un éditeur de texte, le fichier commence par '% PDF-1'. Les premiers caractères d'un fichier PNG, en revanche, sont 'â° PNG'. Étant donné que l'on peut diagnostiquer le type de fichier beaucoup plus précisément qu'avec l'extension de fichier sur la base de ces chaînes de caractères définies, ces chaînes sont également appelées signatures de fichier ou "nombres magiques".
Le TrID la base de données contient les signatures de fichiers et les types de fichiers associés. - Métadonnées (type MIME)
La détermination du type de fichier au moyen de Multime Internet Mail Exstentions est en effet plus précis, mais les métadonnées doivent être transmises séparément dans l'en-tête.
De quelle manière les signatures de fichiers peuvent-elles être affichées ?
Les signatures de fichier sont des données utilisées pour identifier ou vérifier un type de fichier. Ces signatures sont également appelées nombres magiques et peuvent être représentées dans l'un des formats suivants :
- HEX : un octet (8 bits) est représenté par un nombre à deux chiffres avec 16 chiffres (0, ..., 9, A, ..., F) (système hexadécimal )
Si vous ouvrez un fichier PDF dans un éditeur HEX, il commence par la chaîne 25 50 44 46 2D 31 2E. - ISO 8859-1 : texte en codage de caractères 8 bits
Si vous ouvrez un fichier PDF dans un éditeur de texte normal, il commence par la chaîne % PDF-1. - ASCII : codage de caractères 7 bits correspondant exactement à la plage inférieure de la norme ISO 8859-1 (de 32 à 126).
Si vous ouvrez un fichier PDF dans un éditeur de texte ASCII , il commence par la chaîne % PDF-1.