|
Đặng Minh Tuấn: "'Điều quan trọng là chữ Việt phải hiển thị đúng" |
Itoday - I-today vừa
nhận được bài của ông Đặng Minh Tuấn liên
quan đến những vấn đề ứng dụng Unicode. Tại bài
viết này, ông Tuấn đã đưa ra cái nhìn về
Unicode ở góc độ thực tiễn từ những ứng dụng hiện
đang có và đang được các cơ quan Việt Nam sử dụng.
Mời các bạn tham khảo bài viết. Trước tiên xin nêu về mặt quan điểm, rất may các ký tự tiếng Việt (Quốc Ngữ) của chúng ta được người Pháp phát triển từ thế kỷ XIX, nên từ đó tiếng Việt được xếp vào họ La-tinh. Nếu chúng ta xem trong bảng mã Unicode sẽ thấy tiếng Việt được nằm ở các vùng Latin-1, Latin-A, Latin-B và Latin-mở rộng. Xử lý ngôn ngữ cho các ngôn ngữ Latin rất đơn giản và trong họ Latin đa phần người ta dùng dựng sẵn, ngay cả Microsoft cũng dùng giải pháp dựng sẵn cho các ngôn ngữ thuộc họ Latin: Pháp, Đức, Rumani... Theo chúng tôi thật là sai lầm khi xếp tiếng Việt vào họ ký tự phức (complex scripts) như chữ Ả rập, Lào, Thái... Với họ complex scripts này thì bắt buộc phải xử lý ngôn ngữ theo kiểu tổ hợp. Và từ đó dẫn đến một loạt các vấn đề phức tạp khi xử lý ở dạng tổ hợp, đặc biệt tính tương thích sẽ kém đi rất nhiều. Thực tế là phiên bản Windows 95 tiếng Việt của Microsoft đã không được thành công ở Việt Nam (hầu như chẳng có ai dùng nó) do tính tương thích kém của nó, các văn bản soạn ra ở hệ điều hành này thường chỉ đọc được đúng trên hệ điều hành đó, khi chuyển sang môi trường khác thường không thể đọc được. Thực tế là hiện nay ở Việt Nam các Website lớn như Vnexpress, VASC Orient, ngay cả Website này http://www.i-today.com.cn/ cũng đều dùng Unicode dựng sẵn (các site này hàng ngày có hàng triệu click) trong khi chưa có một website lớn nào dùng tổ hợp. Các sản phẩm của các công ty lớn của Việt Nam như Vnexpress, Search Engine của FPT, (dùng SQL Server), iLib của CMC (dùng Oracle), eDocument của CMC (Lotus Notes - IBM), Libol của Tinh Vân (Oracle, SQL Server), http://www.xvmart.net/ (siêu thị điện tử của Vietkey Group dùng Oracle+Jrun+Apache) đều dùng Unicode dựng sẵn hoàn toàn chạy trơn chu không hề có chuyện lỗi với Unicode dựng sẵn như một số chuyên gia thuộc hãng MS tuyên bố về sản phẩm của các hãng khác. Thực tế là hệ điều hành phổ biến nhất ở Việt Nam trong thời điểm này là Windows 98 SE, hệ điều hành này chỉ hỗ trợ tốt cho Unicode dựng sẵn mà thôi, tổ hợp không thể chấp nhận được, xin xem hình minh hoạ dưới bài viết. Theo khuyến cáo của một số chuyên gia thuộc MS thì để dùng Unicode tổ hợp cần phải cài Windows XP, Windows2000, MS Office South Asia (không phải bản tiếng Anh phổ biến trên thị trường), như vậy để thực hiện Quyết định 72 của Thủ tướng Chính phủ và nếu đi theo hướng tổ hợp thì tất cả các máy tính ở Việt Nam phải nâng cấp phần cứng thành máy tính rất mạnh để có thể chạy được Windows XP hoặc Windows 2000, rồi lại phải bỏ hết bộ MS Office đang có để dùng bản MS Office châu Á thì tiếng Việt tổ hợp mới khả dĩ, như thế thì kinh phí sẽ cực kỳ tốn kém và sẽ tốn kém gấp nhiều lần so với Y2K ngày xưa. Nên nhớ cấu hình, tài nguyên của Windows XP lớn gấp 5 lần so với cấu hình cho Windows 98 (ổ cứng cho Win XP là 1G, trong khi Win98 chỉ cần 200M). Thực tế là tính tương thích của tổ hợp kém hơn nhiều so với dựng sẵn, ngay đối với hệ điều hành Windows các phiên bản còn chẳng tương thích (không đọc được, không hiển thị đúng) về tổ hợp (Win98 <> Win XP, Office Eng <> Office SA...), huống chi với các hệ điều hành khác như MacOS, Be OS, Unix... Từ đó dẫn đến hệ quả là chúng ta sẽ bị lệ thuộc vào 1 dòng sản phẩm duy nhất mà mất đi tính hội nhập với các hệ khác, mất đi khả năng Multiplatform. Thực tế là điều quan trọng đầu tiên là chữ Việt phải hiển thị đúng, không bị sai nghĩa, rồi mới nói đến những hỗ trợ khác như sắp xếp, chuyển chữ hoa/thường...Nhưng ngay cả yêu cầu sơ đẳng đó tiếng Việt tổ hợp trong nhiều trường hợp còn không đáp ứng nổi. Không cần nói đến các hệ cũ như Windows 98 (“sắp không được MS hỗ trợ nữa''), chữ hiển thị rất bị sai lệch, thì với hệ điều hành mới nhất bây giờ là Windows XP cùng với bộ soạn thảo văn phòng MS Office 2000 Eng mà ứng dụng khá phổ biến là PowerPoint còn thể hiện tiếng Việt không thể chấp nhận được (còn thua xa các font 8-Bit ngày xưa như VNI hay ABC). Có chuyên gia nói lý do của sự không hiển thị đúng này là do MS ''quên'', xin thưa là không quên, vì trong ứng dụng này cũng có phần chọn ngôn ngữ Vietnamese rồi (và chúng tôi cũng đã làm đúng hướng dẫn: đặt Locale=Vi...), trong khi đó thì Unicode dựng sẵn hiển thị đúng trong mọi trường hợp, đấy là chưa kể đến việc nếu co-kéo chữ là dấu và chữ của tổ hợp sẽ tách xa nhau ngay. Có thể nào chấp nhận được dấu nặng trong chữ ‘tịnh’, lại nằm dưới chữ ‘t’ được không?, hay các dấu thanh bị lùi về sau 1 ký tự (trong WordArt2000 - 2 dòng dưới) được không?. Nếu Unicode mà như thế này thì thà rằng dùng nguyên Font ABC hay VNI còn khả dĩ hơn! Có thể coi đây là một tiến bộ được chăng? Cũng chuyên gia đó nói: chúng ta hãy chờ các bản chắp vá của MS: Service Pack, Patch..., vấn đề là chờ đến bao giờ? và cần bao nhiêu kinh phí? trong khi Unicode dựng sẵn đã đi vào cuộc sống từ 3 năm qua, chạy được trên nhiều môi trường, không cần phải mua máy mới, lại hiển thị đẹp đẽ hơn nhiều lần, không bị lệ thuộc vào 1 họ sản phẩm duy nhất, và đặc biệt có tính tương thích cao. Xin hãy giữ gìn sự trong sáng, giản dị của tiếng Việt, xin đừng xếp tiếng Việt với tiếng Ả-rập, tiếng Lào, vì đơn giản tiếng Việt của chúng ta là thuộc họ La-tinh.
|
PcLeHoan
1996 - 2002
Mirror :
http://www.pclehoan.com
Mirror :
http://www.lehoanpc.net
Mirror :
http://www.ktlehoan.com