Co to jest baza danych TrID?
Baza danych TrID zawiera sygnatury plików ponad 10000 typów plików. Do określenia formatu pliku można użyć podpisu pliku, niezależnie od tego, czy jest to plik .DOC, czy .TXT.
Baza jest stale aktualizowana i rozbudowywana. Ze względu na dużą bazę danych, nieznany plik można bardzo dokładnie przeanalizować. W tym celu dostępny jest również „Identyfikator pliku TrID online, który odczytuje analizowany plik i porównuje go z bazą danych. Wyniki przedstawiono w kolejności największego prawdopodobieństwa.
TrID został wprowadzony na rynek w 2004 roku przez Marco Pontello (Włochy).
Identyfikacja typu pliku na podstawie podpisu pliku jest dokładniejsza niż na podstawie rozszerzenia pliku. Przeczytaj także następny akapit:
Jak określić format pliku?
Format pliku, tj. typ pliku można określić za pomocą następujących trzech cech:
- Nazwa pliku (rozszerzenie pliku)
Najczęściej format pliku zależy od rozszerzenia pliku. Identyfikator formatu pliku znajduje się po ostatniej kropce w nazwie pliku. Ponieważ te rozszerzenia nazw plików były ograniczone do trzech znaków w starych systemach operacyjnych, nawet dzisiaj większość formatów plików jest identyfikowana za pomocą identyfikatora od jednej do trzech cyfr, np. .H lub .DOC.
Określanie typu pliku za pomocą rozszerzenia pliku nie zawsze jest dokładne, ponieważ różne formaty używają tego samego rozszerzenia pliku, użytkownik może przypadkowo zmienić rozszerzenie pliku, a obecne wersje systemu Windows maskują rozszerzenie pliku i wirusy (np. „photo.jpg.exe”) mogą ukrywać się pod „photo.jpg”. - Zawartość pliku (podpis pliku)
Często zawartość pliku zawsze zaczyna się od tego samego ciągu. Jeśli otworzysz m.in. plik PDF z edytorem tekstu, plik zaczyna się od „% PDF-1”. Z drugiej strony, pierwsze znaki w pliku PNG to „° PNG”. Ponieważ można znacznie dokładniej zdiagnozować typ pliku niż rozszerzenie pliku na podstawie tak zdefiniowanych ciągów znaków, ciągi te są również nazywane sygnaturami plików lub „magicznymi liczbami”.
TrID baza danych zawiera sygnatury plików i powiązane typy plików. - Metadane (typ MIME)
Określenie typu pliku za pomocą Muniwersalnego Iinternetu Mail Exstentions jest rzeczywiście najdokładniejsze, ale metadane muszą być przesyłane osobno w nagłówku.
W jaki sposób można wyświetlać podpisy plików?
Podpisy plików to dane używane do identyfikacji lub weryfikacji typu pliku. Takie podpisy są również znane jako magiczne liczby i mogą być reprezentowane w jednym z następujących formatów:
- HEX: Jeden bajt (8-bitowy) jest reprezentowany jako dwucyfrowa liczba z 16 cyframi (0, ..., 9, A, ..., F) (system szesnastkowy )
Jeśli otworzysz plik PDF w edytorze HEX, zaczyna się on od ciągu 25 50 44 46 2D 31 2E. - ISO 8859-1: tekst w 8-bitowym kodowaniu znaków
Jeśli otworzysz plik PDF w normalnym edytorze tekstu, zaczyna się on od ciągu % PDF-1. - ASCII: 7-bitowe kodowanie znaków, które dokładnie odwzorowuje dolny zakres ISO 8859-1 (od 32 do 126).
Jeśli otworzysz plik PDF w edytorze tekstu ASCII , zaczyna się od ciągu % PDF-1.