Che cos'è il database TrID?
Il database TrID contiene firme di file di oltre 10000 tipi di file. È possibile utilizzare una firma del file per determinare il formato del file, sia esso un file .DOC o un file .TXT.
Il database è costantemente aggiornato e ampliato. A causa dell'ampio database, un file sconosciuto può essere analizzato in modo molto accurato. Per questo è disponibile anche un 'Identificatore di file TrID online', che legge il file da analizzare e lo confronta con il database. I risultati sono presentati nell'ordine di probabilità più alta.
TrID è stato lanciato nel 2004 da Marco Pontello (Italia).
L'identificazione del tipo di file in base alla firma del file è più accurata rispetto all'estensione del file. Si prega di leggere anche il paragrafo successivo:
Come determinare il formato del file
Il formato di un file, ovvero il tipo di file, può essere determinato dalle seguenti tre caratteristiche:
- Nome file (estensione file)
Molto spesso, il formato del file è determinato dall'estensione del file. L'identificatore del formato del file è dopo l'ultimo punto del nome del file. Poiché queste estensioni dei nomi di file erano limitate a tre caratteri nei vecchi sistemi operativi, anche oggi la maggior parte dei formati di file sono identificati da un identificatore da una a tre cifre, ad es. .H o .DOC.
La determinazione del tipo di file tramite l'estensione del file non è sempre precisa, poiché formati diversi utilizzano la stessa estensione del file, l'utente può rinominare accidentalmente un'estensione del file e le versioni correnti di Windows mascherano l'estensione del file e i virus (ad es. 'photo.jpg.exe') possono nascondersi sotto 'photo.jpg'. - Contenuto del file (firma del file)
Spesso il contenuto di un file inizia sempre con la stessa stringa. Se apri ad es. un file PDF con un editor di testo, il file inizia con '% PDF-1'. I primi caratteri in un file PNG, invece, sono 'â° PNG'. Poiché è possibile diagnosticare il tipo di file in modo molto più accurato rispetto all'estensione del file sulla base di tali stringhe di caratteri definite, queste stringhe sono anche chiamate firme di file o "numeri magici".
Il TrID il database contiene firme di file e tipi di file associati. - Metadati (tipo MIME)
La determinazione del tipo di file per mezzo di Mmultiuso Iinternet Mail Exstentions è effettivamente più accurato, ma i metadati devono essere trasmessi separatamente nell'intestazione.
In che modo possono essere visualizzate le firme dei file?
Le firme dei file sono dati utilizzati per identificare o verificare un tipo di file. Tali firme sono anche note come numeri magici e possono essere rappresentate in uno dei seguenti formati:
- HEX: un byte (8 bit) è rappresentato come un numero a due cifre con 16 cifre (0, ..., 9, A, ..., F) (sistema esadecimale )
Se apri un file PDF in un editor HEX, inizia con la stringa 25 50 44 46 2D 31 2E. - ISO 8859-1: testo con codifica dei caratteri a 8 bit
Se apri un file PDF in un normale editor di testo, inizia con la stringa % PDF-1. - ASCII: codifica dei caratteri a 7 bit che corrisponde esattamente all'intervallo inferiore di ISO 8859-1 (da 32 a 126).
Se apri un file PDF in un editor di testo ASCII , inizia con la stringa % PDF-1.