自 2000 年
TrID 数据库是什么?
TrID 数据库包含超过 10000 种文件类型的文件签名。文件签名可用于确定文件格式,无论是 .DOC 文件还是 .TXT 文件。
该数据库不断更新和扩展。由于数据库很大,可以非常准确地分析未知文件。 '在线TrID文件标识符'也可用于此,它读入要分析的文件并将其与数据库进行比较。结果按概率最高的顺序显示。
TrID 由 Marco Pontello(意大利)于 2004 年推出。
通过文件签名识别文件类型比通过文件扩展名更准确。另请阅读下一段:
如何确定文件格式
文件的格式,即文件类型,可以通过以下三个特征来确定:
- 文件名(文件扩展名)
大多数情况下,文件格式由文件扩展名决定。文件格式标识符位于文件名的最后一个点之后。由于这些文件扩展名在旧操作系统中仅限于三个字符,即使在今天,大多数文件格式也由一到三位数的标识符标识,例如.H 或 .DOC。
通过文件扩展名确定文件类型并不总是准确的,因为不同的格式使用相同的文件扩展名,用户可能会意外重命名文件扩展名,并且当前版本的 Windows 会屏蔽文件扩展名和病毒(例如“photo.jpg.exe”)可以隐藏在“photo.jpg”下。 - 文件内容(文件签名)
文件的内容通常总是以相同的字符串开头。如果你打开例如带有文本编辑器的 PDF 文件,文件以“% PDF-1”开头。另一方面,PNG 文件中的第一个字符是 'â° PNG'。由于基于此类定义的字符串可以比使用文件扩展名更准确地诊断文件类型,因此这些字符串也称为文件签名或“幻数”。
TrID 数据库包含文件签名和相关文件类型。 - 元数据(MIME类型)
通过M多用途I互联网M<的方式确定文件类型/b>ail Exstentions确实是最准确的,但是元数据必须在header中单独传输。
文件签名可以通过什么方式显示?
文件签名是用于识别或验证文件类型的数据。此类签名也称为 幻数,可以用以下格式之一表示:
- HEX: 一个字节(8 位)表示为 16 位(0、...、9、A、...、F)的两位数(十六进制)
如果您在 HEX 编辑器中打开 PDF 文件,它以字符串 25 50 44 46 2D 31 2E 开头。 - ISO 8859-1: 8 位字符编码的文本
如果您在普通文本编辑器中打开 PDF 文件,它会以字符串 % PDF-1. - ASCII: 7 位字符编码,精确映射到 ISO 8859-1 的较低范围(从 32 到 126)。
如果您在 ASCII 文本编辑器中打开 PDF 文件, 它以字符串 % PDF-1. 开头