Unicode tổ hợp chính là phương án tối ưu

Ông Nguyễn An Quế,
chuyên gia kỹ thuật của Microsoft

Itoday -  Trước những dư luận trái ngược nhau về sử dụng Unicode dựng sẵn hay tổ hợp, hãng Microsoft đã ủng hộ cho Unicode tổ hợp một cách mạnh mẽ. Ông Nguyễn An Quế, chuyên gia kỹ thuật của Microsoft đã khẳng định rằng Unicode tổ hợp sẽ là sự lựa chọn tối ưu. i-today@vasc.com.vn

Gần đây, có hai luồng dư luận trái ngược hẳn nhau về việc áp dụng bộ mã Unicode trên phạm vi toàn quốc. Một bênh vực cho Unicode dựng sẵn và bên kia thì ủng hộ Unicode tổ hợp. Xin ông cho biết ý kiến của Microsoft về vấn đề này?

Đúng là Unicode đang được tranh luận rất sôi nổi cả trong và ngoài nước. Unicode tổ hợp và dựng sẵn đều có những ưu và nhược điểm riêng. Về vấn đề này, theo quan điểm của tôi, thứ nhất, chúng ta nên tách bộ gõ ra khỏi bộ mã. Bởi vì hiện nay chúng ta có thể gõ tiếng Việt (Unicode tổ hợp) trực tiếp từ Windows mà không cần đến bất kỳ một bộ gõ nào. Bộ gõ chỉ giúp tăng tốc độ gõ chứ nó không đóng vai trò quan trọng như bộ mã. Một sinh viên trình độ khá nếu có tài liệu trong tay hoàn toàn có thể tự viết được bộ gõ Unicode. Bộ gõ không phải là bản chất của vấn đề.

Thứ hai, chúng ta không nên chỉ bó hẹp trong việc gõ tiếng Việt mà nên nhìn rộng ra các ngôn ngữ thuộc họ mã phức tạp (complex script) như Trung Quốc, Hàn Quốc, Nhật Bản, Thái Lan, A rập, Hindi. Nếu sử dụng Unicode tổ hợp thì chúng ta có thể xử lý được các văn bản đa ngữ. Giả sử, trong một văn bản chúng ta gõ chữ to tiếng Việt và tiếng Anh. Nếu gõ bằng bộ mã tổ hợp thì khi ta đặt con trỏ vào chữ to tiếng Việt, trên thanh trạng thái sẽ hiển thị Vietnamese, còn nếu đặt con trỏ vào chữ to tiếng Anh, thanh trạng thái sẽ hiển thị English. Điều này có nghĩa là chương trình đã nhận biết được đâu là tiếng Anh, đâu là tiếng Việt trên cùng một văn bản. Nếu gõ bằng mã Unicode dựng sẵn thì chương trình sẽ nhận dạng cả hai chữ to đều là tiếng Anh. Vì vậy, khi thực hiện chức năng kiểm tra chính tả trong Word sẽ thu được một kết quả không chính xác.

Hiện nay, đối với các ngôn ngữ thuộc họ mã phức tạp người ta thường sử dụng bộ mã Unicode tổ hợp vì nó có khả năng xử lý, sắp xếp ngày tháng, chữ hoa, chữ thường, tiền tệ rất tốt mặc dù phải cài đặt thêm phần hỗ trợ. Mã dựng sẵn có ưu điểm là gõ và hiển thị rất dễ dàng nhưng có hạn chế trong việc xử lý, sắp xếp. Bắt đầu từ Windows 2000, mã tổ hợp cho kết quả hiển thị đẹp không kém gì mã dựng sẵn.

Nhưng theo tôi được biết thì hệ điều hành Windows XP đã bắt đầu hỗ trợ mã dựng sẵn. Vậy thì tại sao chúng ta lại không ủng hộ mã dựng sẵn?

Chúng ta nên có cái nhìn tổng thể hơn. Nếu muốn tiến xa, muốn hội nhập với thế giới thì không nên dừng lại ở gõ, hiển thị và in ấn với bộ mã dựng sẵn. Người sử dụng thường rất khó tính, họ không chỉ muốn văn bản hiển thị đẹp mà việc sắp xếp, tìm kiếm còn phải thuận lợi. Nếu sử dụng bộ mã dựng sẵn thì việc nhận biết tiếng Việt, tiếng Anh, tiếng Trung trong cùng một văn bản là khó khăn. Bộ mã tổ hợp đã được các hãng phần mềm hàng đầu thế giới hỗ trợ. Vì vậy, tôi cho rằng Unicode tổ hợp chính là phương án tối ưu.

Nhưng một chuyên gia phần mềm của Việt Nam đã viết một thư viện hỗ trợ cho việc sắp xếp, tìm kiếm với mã dựng sẵn. Như vậy không có lý do gì để từ chối dựng sẵn?

Đó là thủ thuật chọc vào hệ điều hành để làm cho việc sắp xếp, thay đổi chữ hoa chữ thường trở nên đúng đắn. Nhưng công việc này đòi hỏi một kỹ năng rất cao, không phải ai cũng làm được. Nếu đồng ý với mã dựng sẵn thì có nghĩa là cả nước sẽ phải phụ thuộc vào vị chuyên gia đó. Liệu vị chuyên gia đó có đủ sức để hỗ trợ cho thị trường tin học của cả nước không? Anh ấy đã nghĩ ra một bộ thư viện, điều đó là tốt. Nhưng giả sử ở TP.HCM cũng có một nhóm nghĩ ra một bộ thư viện khác thì sao? Chúng ta sẽ áp dụng bộ thư viện nào? Ta nên sử dụng chuẩn Unicode tổ hợp đã được hệ điều hành cung cấp. Tất cả các hãng lớn như Microsoft, IBM, Oracle hay Linux đều hỗ trợ chuẩn này.

Xin cảm ơn ông

Hồng Ngọc           


PcLeHoan 1996 - 2002
Mirror : http://www.pclehoan.com
Mirror : http://www.lehoanpc.net

Mirror : http://www.ktlehoan.com