Trang chủ Hiệp sĩ CNTT Tin tức Hiệp Sĩ CNTT Chân dung Hiệp Sĩ CNTT H́nh ảnh Hiệp Sĩ CNTT

Ngô Trung Việt: Điện tử hoá chữ Nôm, tám vấn đề kỹ thuật
Hữu Thiện ghi

Việc chọn ra các chữ Nôm để xây dựng bộ mă đă được tiến hành từ năm 1992 cả trong lẫn ngoài nước. Dựa trên hai từ điển chính là "Từ điển chữ Nôm" của Vũ Văn Kính và "Bảng tra chữ Nôm" của Viện Ngôn ngữ học, chúng ta đă rút ra đợt đầu 2.355 chữ Nôm, trong đó có 1.773 chữ thuần Nôm, đưa vào Bộ mă chuẩn 16 bit chữ Nôm TCVN 5773:1993. Tiếp đó, đợt hai đă đưa ra 3.349 chữ Nôm (trùng h́nh với chữ Hán) trong bộ mă chuẩn TCVN 6056:1995. Các chữ này đều được vẽ font tạo dạng điện tử, xử lư được trên máy tính. Hai tiêu chuẩn về chữ Nôm đưa vào trong các tiêu chuẩn TCVN 5773:1993 và TCVN 6064:1995 là cơ sở pháp lư quan trọng để yêu cầu Tổ chức Tiêu chuẩn Quốc tế ISO đưa chữ Nôm vào bộ mă quốc tế ISO 10646. Cho tới nay, tổng cộng Việt Nam đă đề nghị và được chấp thuận 9.299 chữ Nôm trong bộ mă ISO 10646. Chúng đă được đưa vào kho chữ biểu ư chung của các nước Đông Á IRG, khoảng 3.900 chữ đă có trong mặt phẳng BMP của bộ mă ISO 10646. Việt Nam cũng đă được cấp một cột riêng trong bộ mă ISO 10646 song song với các cột của Trung Quốc, Đài Loan, Nhật Bản, Hàn Quốc.


“Hiệp sĩ” Ngô Trung Việt

Về đại thể, gần như hầu hết các chữ Nôm chúng ta biết đă được đưa vào bộ mă quốc tế và được cấp mă. Hiển nhiên thế nào cũng vẫn c̣n một số chữ Nôm chưa được “vét hết” trong các văn bản cổ, và do đó không được mă hoá cho dù số chữ này không lớn. Tuy nhiên, chúng ta c̣n một kho chữ lớn là chữ Nôm Tày hiện c̣n chưa được khai thác để đưa ra thế giới và mă hoá. Trong nỗ lực hiện nay, các nước Đông Á đang tích cực đưa nốt những chữ trong lịch sử của ḿnh vào kho chữ mở rộng mới Extension C của IRG, Việt Nam cũng không nên để mất cơ hội này. Hàn Quốc dự định xin đưa vào kho chữ mới này cỡ 30.000 chữ, Đài Loan cỡ 15.000 chữ, Trung Quốc và Nhật Bản cũng hàng ngh́n chữ. V́ vậy, Việt Nam cần tiếp tục theo đuổi công tác của nhóm IRG để đưa nốt chữ Nôm Tày vào kho chữ mới này.

Để CNTT giúp ích hữu hiệu cho việc bảo tồn và phát triển văn hoá dân tộc, ngoài các vấn đề thuần tuư sưu tầm văn hoá cổ, cần thực hiện tám vấn đề kỹ thuật sau:

1. Xác định kho chữ Nôm: Lập ra danh sách chữ Nôm sẽ đưa vào máy.

2. Định mă: Gắn cho mỗi chữ một mă, t́m cách thể hiện trong các hệ phần mềm.

3. Tạo font: Tạo dạng điện tử cho chữ Nôm.

4. Xây dựng hệ thống xử lư văn bản Nôm trong khuôn khổ chữ Hán, Nhật... Xây dựng tŕnh soạn thảo đa ngôn ngữ. Tiến tới xuất bản các sách báo bằng chữ Nôm.

5. Xây dựng các cơ sở dữ liệu lưu trữ văn bản Hán Nôm cổ trên máy tính.

6. Đưa vào mạng Internet các cơ sở dữ liệu về chữ Nôm.

7. Chuyển dịch các văn bản Hán Nôm cổ sang quốc ngữ và tiếng nước ngoài.

8. Chuyển đưa các văn bản Hán Nôm trên thế giới về nước dưới dạng điện tử.

Hiện nay trên thế giới đă bắt đầu có một số nơi, một số người nghiên cứu để phát triển phần mềm cho chữ Nôm. Nhóm Văn tự kính Mojikyo của Nhật Bản đă làm font cho trên 9.000 chữ Nôm và đă trao tặng Viện Hán Nôm bộ font này, hiện đang tiếp tục nghiên cứu cách gơ chữ Nôm vào máy tính. Công ty thiết kế font chữ Dynalab Thượng Hải đă đồng ư cấp phép cho Viện Nghiên cứu Hán Nôm và Hội Bảo tồn Di sản chữ Nôm để dùng bộ font cho 9.298 chữ Nôm trong các hoạt động nghiên cứu. Một số anh chị em người Việt ở nước ngoài đă xây dựng cơ sở dữ liệu và việc t́m kiếm chữ Nôm trên mạng máy tính. Một website cho giới Phật học cũng đă xây dựng nhiều bộ font cho chữ Nôm. Lực lượng ṇng cốt cho việc chấn hưng vốn cổ Hán Nôm trong kỹ thuật CNTT hiện đại cần được h́nh thành từ trong nước với sự cộng tác của các chuyên gia tin học quốc tế người Việt và sự tham gia của các công ty tin học quốc tế. Cần tận dụng sức mạnh của CNTT thế giới để hỗ trợ cho sự phục hưng của vốn văn hoá cổ, không chỉ giới hạn trong phạm vi tiềm lực CNTT của Việt Nam. Đậc biệt, cần có sự hợp tác chặt chẽ giữa người Việt trên toàn thế giới trong công tác này, v́ bảo tồn văn hoá cổ là nhiệm vụ của mọi người dân Việt.