Xác định tập tin khi không có đuôi mở rộng

08:15, 14/09/2012

Có 1 số tập tin bạn tải từ Internet về mà không có đuôi mở rộng hoặc copy đâu đó về 1 số tài liệu không xác định được định dạng của nó….Vậy làm cách nào để xác định và mở được những tài liệu này. Bạn có thể suy đoán và xác định nếu bạn tải tài liệu đó từ 1 người bạn khi người đó gửi email cho bạn 1 tài liệu dạng Word hoặc vì lý do nào đó không có phần mở rộng, bạn có thể đoán và tự thêm 1 phần mở rộng nào đó như *.doc hoặc *.docx  và thử mở chúng.
 
 
 
Nhưng nếu bạn không thể suy đoán được định dạng của nó là gì, thử nhiều loại phần mở rộng vẫn không có kết quả thì quá tốn thời gian để làm điều này. Ngoài ra, cũng không có chương trình nào đọc được các tài liệu không có phần mở rộng được xác định. Ví dụ như bạn có 1 tập tin có phần mở rộng là PSD thì chắc chắn đó là của Photoshop, tuy nhiên bạn cũng không thể mở được nếu máy bạn chưa cài đặt Photoshop hoặc không thể xác định được đó có phải là phần mở rộng đã suy đoán hay không?
 

Bài viết này sẽ hướng dẫn cho các bạn 1 cách nhanh chóng và chính xác hơn để xác định tập tin mà bạn đang gặp rắc rối. Để làm được điều này, người viết đã tự tạo ra 1 số tập tin để thử nghiệm và sau đó loại bỏ phần mở rộng của tập tin đó. Gồm có 1 tài liệu Word, PDF và file hình ảnh cho mục địch thử nghiệm. Tuy nhiên, tập tin của bạn đang gặp khó khăn không giống của người viết, tuy nhiên phương thức xác định sẽ giống nhau cho bất kỳ loại tập tin nào.

 

Sử dụng 1 công cụ soạn thảo “HEX Editor”

 
 
Đây là 1 chương trình miễn phí có tên là XVI32 (download), bạn không cần cài đặt. Bạn chỉ cần tải về và chạy tập tin EXE trong đó, giao diện của nó như hình dưới đây.


  Ở bản bên trái là bản thông tin xem mã HEX, và bên phải là thanh ghi dữ liệu. Về cơ bản các giá trị được chuyển sang chế độ HEX vào trong các giá trị dự liệu thực. Khá nhiều điều không thể hiểu được bất cứ điều gì khi nhìn vào bên trong 1 bảng mã HEX, do đó bạn không cần quan tâm nhiều. Hầu hết các dữ liệu trong này không có ý nghĩa, nhưng tuy nhiên có 1 vài phần quan trọng của tài liệu sẽ cho bạn biết những gì mà tập tin bạn đã kiểm tra.

 

Trong ví dụ đầu tiên của người viết, tôi sử dụng 1 tài liệu Word mà đã loại bỏ phần mở rộng *.doc. Và bạn hãy xem dưới hình, và đây là những gì mà trong phần mềm phân tích này cho thấy.

 

Từ bảng thanh ghi dữ liệu bên phải bạn sẽ thấy có 1 định dạng với đuôi *.DOTM, đây có nghĩa là 1 tập tin dotm, nhưng theo những gì bạn có thể biết thì các tập tin tài liệu từ các đuôi dotm là đều của bộ OFFICE 2007.  Tất cả các nội dung của 1 tài liệu Word đều được lưu trữ bên trong 1 tập tin cơ bản DOTM, và đó là lý do tại sao bạn thấy được điều này từ ứng dụng này. Tuy nhiên nếu bạn di chuyển xuống trong bảng này, bạn sẽ thấy thông tin cụ thể hơn, được hiện rõ ra như thế. Vì đây là OFFICE 2007 được lưu ở chế độ Word 97-2003. Và cuối cùng bạn chỉ cần thêm phần mở rộng cho tài liệu Word là *.DOC (theo ví dụ).


Ví dụ tiếp theo cho tập tin PDF, và ngay trên dòng đầu tiên bạn có thể xác định được tập tin này là gì. Và việc làm con lại là thêm phần mở rộng cho tập tin này.

 

Và tiếp theo là cho tập tin hình ảnh PNG, rất dễ dàng. Và việc làm tương tự như 2 ví dụ trên là thêm phần mở rộng vào. Rất dễ dàng để tìm ra từ PNG được xuất hiện ngay ở đầu tập tin được phân tích.

 

Và thêm 1 ví dụ cuối cùng, tôi cũng đã thử nghiệm cho 1 tập tin âm thanh MP3 để xem nó có hoạt động tốt như những ví dụ trên hay không. Điều này sẽ xảy ra 1 chút khó khăn, nhưng nếu bạn nhìn vào phần đầu sẽ thấy “ID3”. Mặc dù nó không thể hiện rõ là định dạng MP3, nhưng khi tìm kiếm tại Google thì bạn sẽ biết được ID3 là 1 siêu dữ liệu lưu trữ tất cả các thông tin về 1 tập tin âm nhạc như tiêu đề, nghệ sĩ, năm, album…Vì vậy, nếu bạn thấy ID3 thì bạn có thể suy luận ra đó là 1 tập tin MP3.

 
 Tóm lại, đây là 1 cách tốt nhất mà khả thi hơn để tìm ra cách mở 1 tập tin không có phần mở rộng xác định, chứ không phải là lựa chọn ngẫu nhiên tự thêm các phần mở rộng khác nhau mà không có 1 chút tìm hiểu.
 
 
 
Tuy nhiên trong bài viết sẽ không tránh khỏi sự thiếu sót, độc giả có thể để lại bình luận để người viết rút kinh nghiệm về sau.


 
 
Anh 5 Côn