|
Ngô Trung Việt: Điện tử hoá chữ Nôm, tám vấn đề kỹ thuật
Hữu Thiện ghi |
Việc chọn ra các chữ Nôm để xây dựng bộ mă đă được tiến
hành từ năm 1992 cả trong lẫn ngoài nước. Dựa trên hai
từ điển chính là "Từ điển chữ Nôm" của Vũ Văn Kính và
"Bảng tra chữ Nôm" của Viện Ngôn ngữ học, chúng ta đă
rút ra đợt đầu 2.355 chữ Nôm, trong đó có 1.773 chữ
thuần Nôm, đưa vào Bộ mă chuẩn 16 bit chữ Nôm TCVN
5773:1993. Tiếp đó, đợt hai đă đưa ra 3.349 chữ Nôm
(trùng h́nh với chữ Hán) trong bộ mă chuẩn TCVN
6056:1995. Các chữ này đều được vẽ font tạo dạng điện
tử, xử lư được trên máy tính. Hai tiêu chuẩn về chữ Nôm
đưa vào trong các tiêu chuẩn TCVN 5773:1993 và TCVN
6064:1995 là cơ sở pháp lư quan trọng để yêu cầu Tổ chức
Tiêu chuẩn Quốc tế ISO đưa chữ Nôm vào bộ mă quốc tế ISO
10646. Cho tới nay, tổng cộng Việt Nam đă đề nghị và
được chấp thuận 9.299 chữ Nôm trong bộ mă ISO 10646.
Chúng đă được đưa vào kho chữ biểu ư chung của các nước
Đông Á IRG, khoảng 3.900 chữ đă có trong mặt phẳng BMP
của bộ mă ISO 10646. Việt Nam cũng đă được cấp một cột
riêng trong bộ mă ISO 10646 song song với các cột của
Trung Quốc, Đài Loan, Nhật Bản, Hàn Quốc.

“Hiệp sĩ” Ngô Trung Việt
Về đại thể, gần như hầu hết các chữ Nôm chúng ta biết đă
được đưa vào bộ mă quốc tế và được cấp mă. Hiển nhiên
thế nào cũng vẫn c̣n một số chữ Nôm chưa được “vét hết”
trong các văn bản cổ, và do đó không được mă hoá cho dù
số chữ này không lớn. Tuy nhiên, chúng ta c̣n một kho
chữ lớn là chữ Nôm Tày hiện c̣n chưa được khai thác để
đưa ra thế giới và mă hoá. Trong nỗ lực hiện nay, các
nước Đông Á đang tích cực đưa nốt những chữ trong lịch
sử của ḿnh vào kho chữ mở rộng mới Extension C của IRG,
Việt Nam cũng không nên để mất cơ hội này. Hàn Quốc dự
định xin đưa vào kho chữ mới này cỡ 30.000 chữ, Đài Loan
cỡ 15.000 chữ, Trung Quốc và Nhật Bản cũng hàng ngh́n
chữ. V́ vậy, Việt Nam cần tiếp tục theo đuổi công tác
của nhóm IRG để đưa nốt chữ Nôm Tày vào kho chữ mới này.
Để CNTT giúp ích hữu hiệu cho việc bảo tồn và phát triển
văn hoá dân tộc, ngoài các vấn đề thuần tuư sưu tầm văn
hoá cổ, cần thực hiện tám vấn đề kỹ thuật sau:
1. Xác định kho chữ Nôm: Lập ra danh sách chữ Nôm sẽ đưa
vào máy.
2. Định mă: Gắn cho mỗi chữ một mă, t́m cách thể hiện
trong các hệ phần mềm.
3. Tạo font: Tạo dạng điện tử cho chữ Nôm.
4. Xây dựng hệ thống xử lư văn bản Nôm trong khuôn khổ
chữ Hán, Nhật... Xây dựng tŕnh soạn thảo đa ngôn ngữ.
Tiến tới xuất bản các sách báo bằng chữ Nôm.
5. Xây dựng các cơ sở dữ liệu lưu trữ văn bản Hán Nôm cổ
trên máy tính.
6. Đưa vào mạng Internet các cơ sở dữ liệu về chữ Nôm.
7. Chuyển dịch các văn bản Hán Nôm cổ sang quốc ngữ và
tiếng nước ngoài.
8. Chuyển đưa các văn bản Hán Nôm trên thế giới về nước
dưới dạng điện tử.
Hiện nay trên thế giới đă bắt đầu có một số nơi, một số
người nghiên cứu để phát triển phần mềm cho chữ Nôm.
Nhóm Văn tự kính Mojikyo của Nhật Bản đă làm font cho
trên 9.000 chữ Nôm và đă trao tặng Viện Hán Nôm bộ font
này, hiện đang tiếp tục nghiên cứu cách gơ chữ Nôm vào
máy tính. Công ty thiết kế font chữ Dynalab Thượng Hải
đă đồng ư cấp phép cho Viện Nghiên cứu Hán Nôm và Hội
Bảo tồn Di sản chữ Nôm để dùng bộ font cho 9.298 chữ Nôm
trong các hoạt động nghiên cứu. Một số anh chị em người
Việt ở nước ngoài đă xây dựng cơ sở dữ liệu và việc t́m
kiếm chữ Nôm trên mạng máy tính. Một website cho giới
Phật học cũng đă xây dựng nhiều bộ font cho chữ Nôm. Lực
lượng ṇng cốt cho việc chấn hưng vốn cổ Hán Nôm trong
kỹ thuật CNTT hiện đại cần được h́nh thành từ trong nước
với sự cộng tác của các chuyên gia tin học quốc tế người
Việt và sự tham gia của các công ty tin học quốc tế. Cần
tận dụng sức mạnh của CNTT thế giới để hỗ trợ cho sự
phục hưng của vốn văn hoá cổ, không chỉ giới hạn trong
phạm vi tiềm lực CNTT của Việt Nam. Đậc biệt, cần có sự
hợp tác chặt chẽ giữa người Việt trên toàn thế giới
trong công tác này, v́ bảo tồn văn hoá cổ là nhiệm vụ
của mọi người dân Việt. |
|
|
|