UTF-8 Nên hay không nên? |
Trong mục Đọc điện thư chữ Việt, người viết có đề cập đến các bảng mã (encoding) có thể dùng để đọc chữ Việt trên mạng và điện thư. Trong bài này, người viết xin nhấn mạnh việc dùng bảng mã Unicode (utf-8) làm tiêu chuẩn, đảm bảo chúng ta có được chữ Việt toàn hảo trong việc trao đổi điện thư. Người viết xin đưa vài hình ảnh sau để đây minh chứng tại sao ta nên và chỉ nên dùng Unicode (utf-8) trong lúc thông tin, trao đổi email với nhau trực tiếp hay qua các egroups như Yahoo, Google. |
![]() Hình 1: Dùng bảng mã WE (Windows) để đọc |
Hình 1 cho chúng ta thấy khi dùng bảng mã WE để đọc, chúng ta sẽ không đọc được rõ ràng các điện thư Việt ngữ, đặc biệt các đề tài (subjects) của các bức điện thư. |
![]() Hình 2: Dùng bảng mã WE (ISO) để đọc |
Không lấy gì làm lạ với Westerne European (ISO). Hình 2 cho ta thấy kết quả giống hệt như khi dùng bảng mã Westerne European (Windows) |
![]() Hình 2: Dùng bảng mã Vietnamese (Windows) để đọc |
Bảng mã Vietnamese (Windows) hay còn có tên Windows CP 1258 là bảng mã được Microsoft phát triển đặc biệt đưa vào Việt nam. Trong khi đó Việt Nam lại đưa ra vài bảng mã tiêu chuẩn khác như TCVNx, BK HCMx ... cùng lúc các nhà viết nhu liệu lại đưa ra thêm các bảng mã khác. Như thấy trong Hình 3, chúng ta cũng không thể đọc được rõ ràng khi dùng Vietnames (Windows). |
![]() Hình 4: Dùng bảng mã Unicode (utf-8) để đọc |
Đành rằng nếu người viết và người đọc xử dụng cùng một bảng mã thì chúng ta có thể đoan chắc là người đọc sẽ đọc được. Tuy nhiên, 3 hình trên đã cho thấy: ngay cả lúc dùng cùng bảng mã chúng ta cũng không đọc được các bưc điện thư như đã thấy, đặc biệt là các tiêu đề của điện thư. Trong Hình 4, khi xử dụng utf-8 chúng ta có thể đọc thoải mái các bức điện thư và các tiêu đề một khi người viết dùng bảng mã này. Hiện nay, Firefox, Mozilla, Netscape cho phép chúng ta chọn Unicode (utf-8) làm bảng mã mặc định (default). Với Internet Explorer, chúng ta có thể chọn bảng mã Unicode (utf-8). Tiếc thay Microsoft lại "thích" dùng mọi thứ với Windows nên chuyển sang Windows(xx) ngay sau đó. Bản thân người viết xử dụng cả 2 loại browsers, chủ yếu là Firefox, chỉ khi cần mới chuyển sang Internet Explorer như đền cập trong Vài nhận xét về IE và Firefox. Tóm lại, hãy dùng Unicode (utf-8) là bảng mã mặc định. Với bảng mã này chúng ta còn có thể đọc được nhiều chữ khác trên thế giới mà không cần chuyển qua, chuyển lại. Nhất là không bao giờ phải đọc chữ Phạn. |
Bạn Hiền Tháng Bảy, 2006 |
Copyright ©2006-2009 hoctapnet - Nếu trích dẫn, xin ghi nguồn từ hoctronet. |