ما هي قاعدة بيانات TrID ؟
تحتوي قاعدة البيانات TrID على توقيعات الملفات لأكثر من 10000 نوع ملف. يمكن استخدام توقيع الملف لتحديد تنسيق الملف ، سواء كان ملف DOC. أو ملف TXT.
يتم تحديث قاعدة البيانات وتوسيعها باستمرار. نظرًا لقاعدة البيانات الكبيرة ، يمكن تحليل ملف غير معروف بدقة شديدة. يتوفر أيضًا "Online TrID معرّف الملف" لهذا الغرض ، والذي يقرأ في الملف المراد تحليله ويقارنه بقاعدة البيانات. يتم عرض النتائج بترتيب أعلى احتمالية.
تم إطلاق TrID في عام 2004 بواسطة ماركو بونتيلو (إيطاليا).
يعد تحديد نوع الملف عن طريق توقيع الملف أكثر دقة من تحديد امتداد الملف. يرجى أيضًا قراءة الفقرة التالية:
كيفية تحديد تنسيق الملف
يمكن تحديد تنسيق الملف ، أي نوع الملف بالخصائص الثلاث التالية:
- اسم الملف (امتداد الملف)
في أغلب الأحيان ، يتم تحديد تنسيق الملف بواسطة امتداد الملف. يكون معرف تنسيق الملف بعد آخر نقطة من اسم الملف. نظرًا لأن امتدادات أسماء الملفات هذه كانت تقتصر على ثلاثة أحرف في أنظمة التشغيل القديمة ، فحتى اليوم يتم تحديد معظم تنسيقات الملفات من خلال معرف مكون من واحد إلى ثلاثة أرقام ، على سبيل المثال H أو .DOC.
تحديد نوع الملف عن طريق امتداد الملف ليس دقيقًا دائمًا ، نظرًا لأن التنسيقات المختلفة تستخدم نفس امتداد الملف ، يمكن للمستخدم إعادة تسمية امتداد الملف بطريق الخطأ والإصدارات الحالية من Windows تخفي امتداد الملف و يمكن أن تختفي الفيروسات (مثل "photo.jpg.exe") ضمن "photo.jpg". - محتوى الملف (توقيع الملف)
غالبًا ما يبدأ محتوى الملف بالسلسلة نفسها دائمًا. إذا فتحت على سبيل المثال ملف PDF مع محرر نصوص ، يبدأ الملف بـ "٪ PDF-1". من ناحية أخرى ، فإن الأحرف الأولى في ملف PNG هي "â ° PNG". نظرًا لأنه يمكن للمرء تشخيص نوع الملف بدقة أكبر بكثير من امتداد الملف على أساس سلاسل الأحرف المحددة ، فإن هذه السلاسل تسمى أيضًا توقيعات الملف أو "الأرقام السحرية".
TrID قاعدة بيانات تحتوي على توقيعات الملفات وأنواع الملفات المرتبطة بها. - البيانات الوصفية (نوع MIME)
تحديد نوع الملف عن طريق M فائقة الغرض أنا الإنترنت M ail E xstentions هي بالفعل أكثر دقة ، ولكن يجب نقل البيانات الوصفية بشكل منفصل في الرأس.
بأي طريقة يمكن عرض توقيعات الملفات؟
توقيعات الملف هي البيانات المستخدمة لتحديد نوع الملف أو التحقق منه. تُعرف هذه التوقيعات أيضًا باسم الأرقام السحرية ويمكن تمثيلها بأحد التنسيقات التالية:
- HEX: يتم تمثيل البايت الواحد (8 بت) كرقم مكون من رقمين يتكون من 16 رقمًا (0 ، ... ، 9 ، A ، ... ، F) (نظام سداسي عشري )
إذا فتحت ملف PDF في محرر HEX ، فإنه يبدأ بالسلسلة 25 50 44 46 2D 31 2E . - ISO 8859-1: نص بترميز أحرف 8 بت
إذا فتحت ملف PDF في محرر نص عادي ، فإنه يبدأ بالسلسلة ٪ PDF-1 ب>. - ASCII: ترميز أحرف 7 بت الذي يعين تمامًا النطاق الأدنى من ISO 8859-1 (من 32 إلى 126).
إذا فتحت ملف PDF في محرر نصوص ASCII ، يبدأ بالسلسلة ٪ PDF-1 .