2000年運営開始
TrID データベースとは?
TrID データベースには、10000 を超えるファイル タイプのファイル シグネチャが含まれています。ファイル署名を使用して、ファイル形式が .DOC ファイルであるか .TXT ファイルであるかを判別できます。
データベースは常に更新され、拡張されています。データベースが大きいため、未知のファイルを非常に正確に分析できます。これには「オンライン TrID ファイル識別子」も利用できます。これは、分析対象のファイルを読み取り、それをデータベースと比較します。結果は、確率の高い順に表示されます。
TrID は、2004 年にマルコ ポンテッロ (イタリア) によって立ち上げられました。
ファイルの署名によってファイルの種類を識別する方が、ファイルの拡張子によって識別するよりも正確です。次の段落もお読みください。
ファイル形式の判別方法
ファイルの形式、つまりファイルの種類は、次の 3 つの特性によって決定できます。
- ファイル名 (ファイル拡張子)
ほとんどの場合、ファイル形式はファイル拡張子によって決まります。ファイル形式識別子は、ファイル名の最後のドットの後にあります。これらのファイル名の拡張子は古いオペレーティング システムでは 3 文字に制限されていたため、今日でもほとんどのファイル形式は 1 ~ 3 桁の識別子で識別されます。 .H または .DOC.
ファイル拡張子によるファイル タイプの判別は常に正確であるとは限りません。異なる形式でも同じファイル拡張子が使用されているため、ユーザーが誤ってファイル拡張子の名前を変更したり、現在のバージョンの Windows でファイル拡張子がマスクされたり、ウイルス (例: 「photo.jpg.exe」) は「photo.jpg」の下に隠れる可能性があります。 - ファイル コンテンツ (ファイル シグネチャ)
多くの場合、ファイルのコンテンツは常に同じ文字列で始まります。あなたが開いた場合。テキスト エディタで PDF ファイルを作成すると、ファイルは「% PDF-1」で始まります。一方、PNG ファイルの最初の文字は「â° PNG」です。このように定義された文字列に基づいて、ファイル拡張子よりもはるかに正確にファイルの種類を診断できるため、これらの文字列はファイル署名または「マジック ナンバー」とも呼ばれます。
TrID データベースには、ファイルの署名と関連するファイルの種類が含まれています。 - メタデータ (MIME タイプ)
M多目的 Iインターネット Mail E確かに最も正確ですが、メタデータはヘッダーで個別に送信する必要があります。
ファイルの署名はどのように表示できますか?
ファイル署名は、ファイルの種類を識別または検証するために使用されるデータです。このような署名は マジック ナンバーとも呼ばれ、次のいずれかの形式で表すことができます。
- HEX: 1 バイト (8 ビット) は、16 桁 (0、...、9、A、...、F) の 2 桁の数字として表されます (16 進法) )
HEX エディタで PDF ファイルを開くと、文字列 25 50 44 46 2D 31 2E で始まります。 - ISO 8859-1: 8 ビット文字エンコーディングのテキスト
通常のテキスト エディタで PDF ファイルを開くと、% PDF-1<という文字列で始まります。 /b>. - ASCII: ISO 8859-1 の下位範囲 (32 から 126) に正確に対応する 7 ビット文字エンコーディング。
PDF ファイルを ASCII テキスト エディタで開いた場合、文字列 % PDF-1 で始まります。