TrID veritabanı nedir?
TrID veritabanı, 10000'den fazla dosya türünün dosya imzalarını içerir. Bir .DOC dosyası mı yoksa bir .TXT dosyası mı olduğu, dosya biçimini belirlemek için bir dosya imzası kullanılabilir.
Veritabanı sürekli güncellenir ve genişletilir. Büyük veri tabanı nedeniyle bilinmeyen bir dosya çok doğru bir şekilde analiz edilebilir. Bunun için, analiz edilecek dosyayı okuyan ve veritabanıyla karşılaştıran bir 'Çevrimiçi TrID Dosya Tanımlayıcısı' da mevcuttur. Sonuçlar en yüksek olasılık sırasına göre sunulur.
TrID 2004 yılında Marco Pontello (İtalya) tarafından piyasaya sürüldü.
Dosya türünün dosya imzasına göre belirlenmesi, dosya uzantısına göre daha doğrudur. Lütfen bir sonraki paragrafı da okuyun:
Dosya formatı nasıl belirlenir
Bir dosyanın formatı, yani dosya türü aşağıdaki üç özellik ile belirlenebilir:
- Dosya adı (dosya uzantısı)
Çoğu zaman, dosya biçimi dosya uzantısına göre belirlenir. Dosya biçimi tanımlayıcısı, dosya adının son noktasından sonradır. Bu dosya adı uzantıları eski işletim sistemlerinde üç karakterle sınırlı olduğundan, bugün bile çoğu dosya formatı bir ila üç basamaklı bir tanımlayıcı ile tanımlanır, örn. .H veya .DOC.
Dosya uzantısı aracılığıyla dosya türünü belirlemek her zaman doğru değildir, çünkü farklı biçimler aynı dosya uzantısını kullandığından, kullanıcı yanlışlıkla bir dosya uzantısını yeniden adlandırabilir ve Windows'un mevcut sürümleri dosya uzantısını maskeleyebilir ve virüsler (ör. 'photo.jpg.exe') 'photo.jpg' altında gizlenebilir. - Dosya içeriği (dosya imzası)
Genellikle bir dosyanın içeriği her zaman aynı dizeyle başlar. örneğini açarsanız metin düzenleyicili bir PDF dosyası, dosya '% PDF-1' ile başlar. PNG dosyasındaki ilk karakterler ise 'â° PNG'dir. Dosya türü, bu tür tanımlanmış karakter dizileri temelinde dosya uzantısından çok daha doğru bir şekilde teşhis edilebildiğinden, bu dizilere dosya imzaları veya 'sihirli sayılar' da denir.
TrID veritabanı, dosya imzalarını ve ilişkili dosya türlerini içerir. - Meta veriler (MIME türü)
Dosya türünün Mçok amaçlı Iinternet Mail Exstentions gerçekten de en doğrudur, ancak meta veriler başlıkta ayrı olarak iletilmelidir.
Dosya imzaları hangi yolla görüntülenebilir?
Dosya imzaları, bir dosya türünü tanımlamak veya doğrulamak için kullanılan verilerdir. Bu tür imzalar aynı zamanda sihirli sayılar olarak da bilinir ve aşağıdaki biçimlerden birinde gösterilebilir:
- HEX: Bir bayt (8 bit), 16 basamaklı (0, ..., 9, A, ..., F) (onaltılık sistem) iki basamaklı bir sayı olarak temsil edilir. )
Bir HEX düzenleyicide bir PDF dosyasını açarsanız, 25 50 44 46 2D 31 2E dizesiyle başlar. - ISO 8859-1: 8 bit karakter kodlamalı metin
Bir PDF dosyasını normal bir metin düzenleyicide açarsanız, %PDF-1. - ASCII: ISO 8859-1'in alt aralığına (32'den 126'ya kadar) tam olarak eşleşen 7 bit karakter kodlaması.
PDF dosyasını bir ASCII metin düzenleyicide açarsanız , % PDF-1 dizesiyle başlar.