Tiếng Việt trong tin học

Xin giới thiệu đến các bạn bài phỏng vấn anh Đặng Minh Tuấn - tác giả chương trình gõ tiếng Việt Vietkey - về đề tài tiếng Việt trong tin học, một đề tài tuy không có gì là mới mẻ nhưng vẫn được nhiều người quan tâm
 

Thưa anh Tuấn, được biết anh hiện đang công tác ở công ty CAPIT. Như vậy thì liệu chương trình Vietkey có phải là "nghề tay trái" của anh hay không?
Đúng vậy, Vietkey là sàn phẩm tay trái của tôi với nhiều nghĩa:
- Trước kia tôi học về Cơ học kết cấu, một ngành rất xa với tin học, cho đến bây giờ tôi vẫn chưa qua bất kỳ trường lớp nào về tin học.
- Công việc chính và toàn bộ thời gian của tôi không phải chỉ cho Vietkey, tuy rằng tôi phát triển Vietkey đã 7 năm rồi. Nếu chỉ trông chờ vài Vietkey để sống thì có lẽ tôi đã không sống nổi đến bây giờ :-(. Tuy nhiên Vietkey là đứa con tinh thần của tôi nên tôi không thể bỏ nó được. Công việc chính của tôi là phụ trách bộ phận phần mềm của công ty CAPIT và của 1 Viện nghiên cứu về security (tôi đang làm luận án tiến sĩ về security), Gis và một số dự án khác

Hiện nay có rất nhiều chương trình gõ tiếng Việt khác nhau, cũ thì có ABC, Vietware, mới thì có Vietkey, VietSpell, VNI Tân kỳ, và chắc rằng sẽ còn có nhiều chương trình gõ tiếng Việt nữa trong tương lai. Vậy anh đã có kế hoạch gì nâng cấp Vietkey để "cạnh tranh" với các chương trình gõ tiếng Việt khác?
Tất nhiên là tôi đã có kế hoạch từ lâu, chỉ tiếc là thời gian của các công việc khác chưa cho phép tôi tập trung vài Vietkey.
Tuy vậy trong 1 thời gian rất ngắn nữa thôi tôi sẽ cho ra đời Vietkey2k Pro với các tính năng chính:
- Chuyển mã cho cá văn bản DOC, HTML, RTF và các văn bản, dữ liệu soạn bằng Excel, PowerPoint, Access, Fox...,
- Kiểm tra chính tả trong Word, Excel... và tất cả các ứng dụng khác trong Windows,
- Xây dựng thư viện xử tiếng Việt cho programmer: tìm kiếm, chuyển mã...,
- Thêm một số tính năng nâng cao nữa,
- Đặc biệt tôi đã có phiên bản Vietkey2000 for Linux, có giao diện và chức năng giống hệt phiên bản cho Windows,
- Kế hoạch tiếp theo là hoàn tất phiên bản cho MAC,
- Xúc tiến phát triển Vietkey2000 for Windows CE,
- Và còn một số kế hoạch khác nữa...:-)

Lỗi chữ ư là lỗi rất khó chịu của bảng mã TCVN. Trong các chương trình chạy trên Windows thì chữ ư thể hiện rất chính xác, chỉ có trên IE và OE là không thể hiện được (trên Netscape chữ ư vẫn được thể hiện rất tốt). Anh có thể giải thích vấn đề này một chút được không, lỗi là do bảng mã TCVN hay là do IE? Hiện nay đã có rất nhiều chương trình sửa lỗi này nhưng chưa có chương trình nào giải quyết được trọn vẹn, chẳng lẽ giới tin học Việt Nam cứ để tình trạng này tiếp tục mãi hay sao?
Về lỗi chữ ư tôi đã có 1 bài đăng trên tạp chí PC World Việt Nam số tháng 10-2000. Nói tóm tắt đó là do mã 173 - chữ ư - bị trùng vào mã ngắt từ mềm của bảng mã ÍO 8859-1 vì thế chữ ư này sẽ có vấn đề trong rất nhiều ứng dụng không chỉ có IE và OE và cũng bị lỗi trong các hệ điều hành khác như Linux, Windows CE.

Bảng mã Unicode hiện ngày càng được sử dụng rộng rãi. Thế nhưng giới tin học Việt Nam xem đây cũng là một "gáo nước lạnh vào mặt" vì người ta đã đưa các ký tự tiếng Việt vào bảng mã Unicode mà không hề có sự bàn bạc hợp tác với phía Việt Nam. Và quả thật sự sắp xếp các ký tự tiếng Việt trong bảng mã Unicode hiện nay vẫn còn chưa thuận tiện trong việc  sắp xếp thứ tự ABC của các tên tiếng Việt. Xin cho biết ý kiến của anh về vấn đề này?
Ý kiến trên chưa hoàn toàn chính xác, bởi lẽ Cơ quan về chuẩn vủa Việt Nam đã biểu quyết và thông qua bảng mã Unicode, đúng hơn là ISO 10646 từ năm 1993. Nói thêm là nhờ có thêm 1 lá phiếu của Việt Nam mà tiêu chuẩn này mới được thông qua, vì nhờ có là phiếu này mà tỷ lệ số phiếu ủng hộ mới được chấp thuận. Còn về việc sắp xếp chưa thuận tiện thì cũng chưa hoàn toàn đúng lắm (về Unicode tôi đã đăng tải 2 bài cho đề tài này: Tin học & đời sống số 9-2000 và PC World VN số 9-2000). Do tính tráng dư thừa nên các bảng mã không nhất thiết phải được xếp liên tục liền nhau, ví dụ chữ é, có trong rất nhiều ngôn ngữ: Việt, Pháp, Tiệp...trong  Unicode nó sẽ chỉ có 1 mã chứ không  có nhiều chữ é cho từng ngôn ngữ được. Vì lý do đó, có nhiều chữ cái sẽ không được xếp liền nhau, điều này cũng xảy ra cho các ngôn ngữ khác nữa chứ không chỉ riêng cho tiếng Việt. Thứ hai, đằng nào tiếng Việt cung không thể sắp xếp theo vị trí của chữ cái được mà phải dùng hàm thuật toán để xử lý (vì sắp xếp tiếng Việt phụ thuộc vào dấu), do đó khi đã phải viết hàm rồi thì việc để các chữ cái ở đâu cũng không là vấn đề lớn đối với các lập trình viên phải không?

Theo xu hướng như hiện nay thì Unicode sẽ dần thay thế các bảng mã khác. Anh có nghĩ rằng Việt Nam nên chuyển sang dùng Unicode thay vì dùng TCVN, VNI hay các bảng mã khác như hiện nay?
Tôi cho rằng trong tương lai không xa Unicode sẽ thay thế cho các bảng mã khác vì đó là xu thế tất yếu của thế giới, và hơn nữa Unicode khắc phục được tất cả các nhược điểm đang hiện hành trong các bảng mã đang được sử dụng. Tuy nhiên chúng ta không thể chuyển ngay sang Unicode được mà sẽ phải có 1 giai đoạn trung chuyển vì hiện nay các ứng dụng hỗ trợ Unicode chưa nhiều, nhiều ứng dụng chưa dùng được Unicode. Tuy nhiên theo tôi chúng ta hiện nay đang ở phần đầu trong giai đoạn trung chuyển đó. Từ tháng 4 năm 2000 tôi đã đề nghị Trung tâm Đo lường, Tiêu chuẩn Quốc gia sớm ban hành bộ mã tiếng Việt 16 bit trên cơ sở bảng mã Unicode/ISO 10646. Tôi hiện đang là thành viên của tiểu bang Kỹ thuật trong tiểu ban Chuẩn công nghệ thông tin của Trung tâm tiêu chuẩn Quốc gia và tôi đã soạn ra dự thảo tiêu chuẩn này. Ngày 8-12-2000 vừa qua trong Hội thảo về Linux Việt Nam, giáo sư Chu Hảo cũng đã hứa sẽ thúc đẩy để Việt Nam sớm có tiêu chuẩn tiếng Việt 16 bit.

Và cuối cùng, anh có điều gì muốn nói thêm với các nhà làm tin học trẻ Việt Nam về vấn đề tiếng Việt trong tin học?
Tôi nghĩ rằng chúng ta có rất nhiều việc cần làm và cũng có rất nhiều lĩnh vực cũng như nhiều thách thức rất hay và có ích cho các bạn trẻ làm tin học ở Việt Nam có thể tham gia. Tôi hy vọng chúng ta sẽ đoàn kết lại để cùng nhau phát triển, tránh những hiện tượng "gà nhà đá nhau", người làm, kẻ phá. Chúng ta cứ quanh quẩn crack sản phẩm của nhau, hại nhau trong khi thế giới thì tiến lên không ngừng. Biết đến khi nào thì mới đuổi kịp họ đây? Điều tôi muốn nói thêm là các bạn trẻ làm tin học Việt Nam cần phải có đam mê và phải biến cái đam mê đó thành những điều có ích cho bản thân và cộng đồng.

Xin cảm ơn anh Tuấn!.

Admin thực hiện ngày 11-12-2000
http://diendantinhoc.hypermart.net/


PcLeHoan 1996 - 2002
Mirror : http://www.pclehoan.com
Mirror : http://www.lehoanpc.net

Mirror : http://www.ktlehoan.com