Trang chủ Hiệp sĩ CNTT Tin tức Hiệp Sĩ CNTT Chân dung Hiệp Sĩ CNTT H́nh ảnh Hiệp Sĩ CNTT

VỚI NÔM LOOKUP TOOL: Chữ Nôm lại nhú mầm trở lại...

LTS: Trong hàng ngàn năm, bên cạnh chữ Hán (một loại kư tự biểu ư), cha ông ta đă bắt đầu xây dựng chữ Nôm của người Việt - một loại kư tự vừa biểu âm vừa biểu ư cho riêng ḿnh. Chữ Hán Nôm trong lịch sử đă là chữ chính thức của dân tộc dùng để ghi lại mọi vấn đề văn học, nghệ thuật, lịch sử văn hoá... và bị chính quyền thuộc địa Pháp chấm dứt cho sử dụng vào năm 1920. Với chúng ta ngày nay, chữ Nôm là ch́a khoá để mở kho tàng tri thức của tiền nhân. Không rành chữ Nôm, không những không thể thưởng thức nhiều tuyệt tác như Bạch Vân Am quốc ngữ thi tập của Nguyễn Bỉnh Khiêm, hay thơ Nôm của Nguyễn Trăi,… mà c̣n không thể nghiên cứu thấu đáo để học hỏi kinh nghiệm của cha ông, để biết tường tận thế nào là văn minh Việt (qua những hệ thống thư tịch về quản lư hành chính như Châu bản triều Nguyễn, chính sách đất đai như Địa bộ triều Nguyễn,…), và bồi dưỡng ư thức tự hào dân tộc.

V́ nhiều lư do, trong khi nhiều di sản văn hoá của người Việt đang mai một dần theo thời gian th́ hiểu biết về chữ Nôm của người Việt đương đại cũng ngày càng bị thu hẹp. V́ vậy, bảo tồn và phát huy các giá trị văn hoá được chuyển tải qua chữ Nôm đă trở thành một đ̣i hỏi hết sức cấp bách...

Các anh chị được đề cập đến trong công tŕnh dưới đây (Công cụ tra cứu chữ Nôm - Nôm Lookup Tool) hiện đang sống tại nhiều quốc gia khác nhau trên thế giới. Dù khác nhau về quốc tịch nhưng họ cùng là người Việt và luôn xem dải đất h́nh chữ S bên bờ biển Đông là quê hương. Văn hoá và văn minh Việt là niềm tự hào của họ và mỗi người trong họ đă góp “một chút”sức lực, trí tuệ trong việc hỗ trợ những đồng bào khác có thêm điều kiện nghiên cứu về ngữ âm và từ vựng của cha ông người Việt, giải mă các văn bản chữ Nôm, góp thêm dữ liệu trong việc nghiên cứu văn hoá và văn minh Việt… Đây là việc mở đầu cho những hoạt động của công nghệ thông tin (CNTT) ứng dụng vào xử lư ngôn ngữ dân tộc, tận dụng những thành tựu công nghệ hiện đại nhất vào các vấn đề văn hoá.


Công cụ tra cứu chữ Nôm – Nôm Lookup Tool (NLT)

Tổ chức tài trợ chính:

Hội Bảo tồn Di sản chữ Nôm VNPF

Nguồn dữ liệu:

- Từ điển chữ Nôm: Vũ Văn Kính

- Bảng Tra Chữ Nôm: Hồ Lê, Viện Ngôn ngữ học xuất bản

- Từ điển Hán Việt: Thiều Chửu

- Các tài liệu chữ Nôm: Nguyễn Quang Hồng

- UniHan Database: Cơ sở dữ liệu đặc biệt của tổ chức Unicode

- Các dữ liệu điện tử khác nhau: Ngô Thanh Nhàn, Đỗ Bá Phước, Ngô Trung Việt.

Công việc được phân công đảm nhiệm:

- Yêu cầu người dùng: Ngô Thanh Nhàn, Ngô Trung Việt

- Nhập dữ liệu: Lê Mai Phương, Ngô Trung Việt

- Thiết kế: Lê Phạm Ngưng Hương

- Thực hiện: Đỗ Bá Phước, Lê Phạm Ngưng Hương

- Đóng gói và phân phối: Hồ Văn Tiến.

Công cụ phát triển:

- MySql: DBMS mă nguồn mở

- PHP: Ngôn ngữ Web-scripting mă nguồn mở

- VietUni: Cấu phần dựa trên java-script do Trần Anh Hùng tạo ra để gơ chữ Việt

- Font: DFSongLight của Dynalab, chứa 9.299 chữ biểu ư Nôm, Arial Unicode MS của Microsoft, chứa một phần các chữ biểu ư thống nhất CJKV.


Nhóm NLT (từ trái sang): Lê Phạm Ngưng Hương (Thuỵ Sĩ), Ngô Thanh Nhàn và Đỗ Bá Phước (Mỹ), Ngô Trung Việt (VN), Hồ Văn Tiến (Thuỵ Sĩ), Lê Mai Phương (Bỉ)

Mọi việc cứ khớp lại với nhau y như có ai đă bày đặt sẵn

(Về ư nghĩa và các pha thực hiện NLT, theo lời kể của người chủ tŕ – chị Lê Phạm Ngưng Hương). Tiếng Việt đă tồn tại và phát triển với việc mẹ truyền lời dạy con nói. Tiếng nói như vậy mang yếu tố thời gian và không gian. Để cho tri thức vượt qua thời gian, tiếng nói lấy lại h́nh hài cụ thể là chữ viết. Tiếng Việt có hai loại chữ viết là Hán Nôm và chữ latinh (quốc ngữ).

Đă là người Việt Nam mà chỉ biết mỗi chữ la-tinh th́ cũng là một sự thiếu sót và mất mát đi cái ǵ đó của ông bà tổ tiên. Do vậy, chữ Nôm vẫn cứ là một chủ đề muôn thuở trong tâm khảm người Việt.

Chữ Nôm đă đi vào lịch sử, không c̣n là thứ văn tự được phổ biến chính trong cả nước nữa. Và cũng đă vài ba thế hệ qua đi hoàn toàn chẳng biết tới chữ Nôm là ǵ, trong những bận rộn của các cuộc chiến một mất một c̣n. Nhưng rồi mọi cuộc chiến tranh cũng phải qua đi để nhường lại vũ đài lịch sử cho các thế hệ mới đi vào khoa học, kỹ thuật và phát triển. Chính trong sự phát triển của những công nghệ và kỹ thuật mới đó như những cơn mưa đem tới mùa màng, chữ Nôm lại nhú mầm trở lại, bởi v́ hạt mầm của nó trong tâm khảm mọi người Việt vẫn c̣n đấy.

Hạt mầm đó nảy nở thành một hoài băo, một mơ ước được thấy chữ ông bà ngày xưa đă dùng như thế nào. Hẳn là bây giờ không ai dùng chữ Nôm cho các vấn đề khoa học và công nghệ, điều đó chữ quốc ngữ latinh đă là công cụ cực kỳ tiện dụng cho đại chúng. Thế nhưng vẫn có một cái ǵ đó bên trong mỗi người Việt, mang tính văn hoá, mang tính tâm linh thôi thúc con người ngày nay đọc lại chữ của ông bà tổ tiên, chí ít cũng là thấy xem tên ḿnh ngày xưa viết thế nào...

Chúng tôi cũng như đại đa số người Việt hiện nay, lúc đầu hầu như chẳng biết ǵ về chữ Nôm cả. Nhưng chính một cái ǵ đó tiềm tàng bên trong (chiều sâu của) tâm hồn đă gắn chúng tôi lại với nhau trong một dự án mở và ban đầu cũng khá mơ hồ: Làm sao cho mọi người thấy được, dùng được chữ Nôm trên máy tính? Ban đầu, thực sự đó là hoài băo và mơ ước. Rồi những người say sưa với ư tưởng về chữ Nôm trên máy tính ấy xích lại gần nhau, tự động phân chia công việc, ai thạo cái ǵ th́ làm cái ấy.

Phải nói thời đại internet ngày nay đă làm được cái việc mà ngày xưa không thể làm được: Gắn nhiều người, với những chuyên môn khác nhau ở bốn phương trời, vào trong một dự án, cứ làm lại vỡ ra cái ǵ đó mới mẻ trong vốn gia tài kế thừa chữ Nôm để lại. Cũng tài thật là mọi việc cứ khớp lại với nhau y như có ai đă bày đặt sẵn vậy. Tất nhiên cũng nhiều đêm mất ngủ, nhiều ngày cặm cụi làm việc, nhưng nói thực chúng tôi có cảm giác là ḿnh đang chơi một tṛ ǵ đó hay hay nên dù bận mấy th́ bận, cũng vẫn cứ để thời gian cho nó.

Bây giờ nh́n lại, té ra những việc ḿnh làm đă thành một cái ǵ đó xinh xinh, dùng cũng được, và một mong ước nữa lại phát sinh: Làm sao cho mọi người đều có cơ hội gặp gỡ lại chữ Nôm qua công cụ tra cứu chữ Nôm NLT này. Chính v́ vậy nên mới có phần giới thiệu này đến tay bạn đọc của e-CHÍP.

Và mơ ước vẫn cứ tiếp diễn...

Pha 1: Tra cứu một chiều đơn giản

Phiên bản NLT ban đầu (hè 2001) về cơ bản là công cụ tra cứu một chiều: Cho một âm tiết quốc ngữ, hay một từ tiếng Anh, bạn muốn biết nó được viết ra sao khi là chữ Nôm. Một cách lư tưởng, bạn cũng muốn tra cứu theo các cách khác: Cho chữ biểu ư Nôm, bạn muốn biết nó được đọc thế nào trong chữ quốc ngữ. Tuy nhiên, trong phiên bản ban đầu, chức năng t́m kiếm được trang bị cho loại tra cứu đó c̣n rất nghèo nàn: Bạn có thể t́m theo điểm mă Unicode, phần nghĩa, phần âm, hay cả hai. Trong thực tế, việc t́m kiếm theo điểm mă Unicode không dễ dùng bởi chúng ta không thể trông đợi người dùng quen thuộc với kư pháp kỹ thuật như điểm mă và việc t́m kiếm theo phần nghĩa/ âm cũng không hiệu quả mấy v́ hai lư do: Không phải mọi chữ biểu ư đều có thể bẻ thành các phần được. Trong cơ sở dữ liệu của chúng tôi, chỉ có các chữ biểu ư thuần Nôm được phân tích âm tiết.

Pha 2: Nỗ lực đầu tiên để giải quyết vấn đề font

Một trong những nhược điểm của phiên bản ban đầu là không thể phổ biến rộng được v́ font DFSongLight Nôm không sẵn có, c̣n font Arial Unicode lại chỉ chứa một nửa số 9.299 chữ Nôm biểu ư. Phiên bản 2 của NLT vào mùa xuân 2002 là nỗ lực đầu tiên của Nhóm NLT để giải quyết vấn đề font này, bằng cách dùng công nghệ SVG (scalar-vector graphics - đồ hoạ vectơ vô hướng). Với giải pháp SVG, không cần có font vẫn có thể xem được chữ Nôm biểu ư nhưng người dùng cần có một bộ SVG viewer để đọc các đồ hoạ được tạo ra tương ứng với font. Tiếc rằng đồ hoạ không thể sao và dán vào tài liệu, hoặc tiện dụng cho việc cất giữ như ảnh.Một trong những nhược điểm của phiên bản ban đầu là không thể phổ biến rộng được v́ font DFSongLight Nôm không sẵn có, c̣n font Arial Unicode lại chỉ chứa một nửa số 9.299 chữ Nôm biểu ư. Phiên bản 2 của NLT vào mùa xuân 2002 là nỗ lực đầu tiên của Nhóm NLT để giải quyết vấn đề font này, bằng cách dùng công nghệ SVG (scalar-vector graphics - đồ hoạ vectơ vô hướng). Với giải pháp SVG, không cần có font vẫn có thể xem được chữ Nôm biểu ư nhưng người dùng cần có một bộ SVG viewer để đọc các đồ hoạ được tạo ra tương ứng với font. Tiếc rằng đồ hoạ không thể sao và dán vào tài liệu, hoặc tiện dụng cho việc cất giữ như ảnh.

Pha 3: Đưa vào nhiều cách đọc quốc ngữ và ngữ cảnh, ngữ nghĩa liên kết của chúng

Một công việc quan trọng đă được thực hiện trong pha 3 (mùa thu 2002) với việc đưa vào nhiều cách đọc chữ quốc ngữ và ngữ cảnh, ngữ nghĩa của chúng. Cho đến pha 3, trong cơ sở dữ liệu của chúng tôi, từng âm tiết quốc ngữ có thể được biểu diễn bằng nhiều chữ biểu ư Nôm, nhưng mỗi chữ biểu ư Nôm chỉ biểu diễn cho một âm tiết quốc ngữ. Cách đọc tiếng Việt chính thức do Viện Hán Nôm đề nghị với tổ chức Unicode. Trong thực tế, có nhiều mối quan hệ giữa âm tiết quốc ngữ với chữ biểu ư Nôm và cùng chữ biểu ư có thể có nhiều cách đọc quốc ngữ. Chẳng hạn, một chữ biểu ư có bảy cách đọc quốc ngữ khác nhau “nữ”, “nữa”, “nỡ”, “nớ”, “nợ”, “lỡ”, “nhỡ” nhưng trong cơ sở dữ liệu của chúng tôi, chỉ có một cách đọc “nữa” do Viện Hán Nôm đề nghị. Để lấp lỗ hổng này, chúng tôi đă nhập những cách đọc chữ quốc ngữ c̣n thiếu từ Bảng tra chữ Nôm (BTCN), cùng với “ngữ cảnh, ngữ nghĩa” liên kết của chúng, dưới dạng ví dụ. Với những bổ sung này, NLT trở nên hiệu quả hơn ở nhiều khía cạnh: V́ nhiều mục quốc ngữ được thêm vào cơ sở dữ liệu nên công cụ có thể t́m thấy nhiều kết quả hơn. Chẳng hạn, “nữ” trước đây không thể t́m được trước khi có những bổ sung từ BTCN. Ngữ cảnh ngữ nghĩa liên kết với từng cặp <quốc ngữ, Nôm> có thể là những giúp đỡ hữu ích, đặc biệt khi cùng âm tiết quốc ngữ có thể có các chữ biểu ư Nôm khác nhau, tuỳ theo nghĩa của nó. Chẳng hạn, âm tiết “đá” có hai nghĩa khác nhau: “đá” như “ḥn đá”, hay “đá” như “đấm đá”. Người dùng có thể học được nhiều hơn từ việc t́m kiếm, v́ với mỗi chữ biểu ư Nôm được t́m, NLT có thể chỉ ra tất cả những cách đọc quốc ngữ khác nhau.

Pha 4: Thực hiện tra cứu hai chiều và giải quyết vấn đề f ont

Trong pha 4 (mùa xuân 2003), cơ sở dữ liệu có những thay đổi lớn, cho phép tra cứu từ Nôm sang quốc ngữ. Trong hầu hết các hệ thống t́m kiếm Trung Quốc dùng hai phương pháp: Truy vấn gơ theo tiếng Trung Quốc la-tinh hóa hay dùng phương pháp gơ chữ Trung Quốc nào đó. T́m chữ biểu ư theo chỉ mục bộ. Với việc dùng thông tin từ cơ sở dữ liệu Unihan database, NLT hiện nay có thể cung cấp nhiều phương pháp t́m kiếm trong cả hai loại này: Theo loại 1, bạn có thể gơ truy vấn của ḿnh theo chữ Quan thoại la-tinh hóa (hệ thống Pinyin) hay chữ Quảng Đông la-tinh hoá (hệ thống Yale) hay dùng phương pháp gơ Cangjie (xem chi tiết tại http://www.cjmember.4t.com/the-cj-method.htm). Mặt khác, cần lưu ư rằng hiện thời, phương pháp t́m kiếm theo loại 1 chỉ áp dụng cho chữ Trung Quốc và do vậy không thể dùng để t́m chữ biểu ư thuần Nôm. Theo loại 2, bạn có thể t́m kiếm tất cả các chữ biểu ư theo bộ gốc do Unicode đă xác định, hoặc bạn có thể giới hạn việc t́m kiếm theo chữ có số nét phụ đă xác định.

Một thành tựu khác trong pha 4: giải pháp cho vấn đề font, cụ thể chữ biểu ư Nôm bây giờ được hiển thị như ảnh .jpeg, sẵn sàng cho việc sao - dán vào tài liệu (có thể chọn cách hiển thị như kư tự thường nếu bạn có các bộ font đă xác định). Hăy thử nhé!

Các bạn có thể t́m hiểu NLT tại địa chỉ sau: http://nomfoundation.org/unicode/lookup.php.

9.299 chữ Nôm và những “người già đi bộ”
Hữu Thiện ghi

Chuyện kể về nhóm OF-OF

Chữ Nôm có khả năng ghi lại tất cả suy nghĩ từ lĩnh vực khoa học tự nhiên đến lĩnh vực khoa học xă hội – nhân văn. Chẳng hạn, có một tài liệu Nôm Tày của một vị tổ trong nghề múa rối của người Tày, viết về cách làm con rối, cách tŕnh diễn con rối... Hoặc một tài liệu khác về y học, cũng viết bằng chữ Nôm Tày, mô tả các bộ phận trong nội tạng con người,... Cũng cần nói thêm là chữ Nôm của chúng ta rất giàu khả năng để ghi lại các tiếng địa phương, tiếng cá nhân và những ngữ âm trong từng giai đoạn lịch sử của Việt Nam kể từ thế kỷ X, kể cả ghi lại tiếng nước ngoài phiên ra âm Việt (như tên các thánh của đạo Thiên Chúa).


Trao biểu tượng “Hiệp sĩ CNTT” cho GS Ngô Thanh Nhàn(bên trái ảnh) tại ṭa soạn e-Chíp.

Tôi đă chú ư đến vấn đề chữ Nôm khi xuất hiện bộ mă chuẩn cho chữ quốc ngữ vào năm 1985 ở Mỹ (trong nước chưa có), cũng như sau đó khi tôi làm luận án cấu tạo từ trong tiếng Việt, làm bảng tần số các từ dùng trong tiếng Việt cần đưa vào bảng mă tiếng Việt dùng trong máy tính,... Rơ ràng muốn hiểu sâu sắc chữ quốc ngữ, chắc chắn phải nghiên cứu chữ Nôm. Dựa vào Từ điển chữ Nôm của ông Vũ Văn Kính (in ở Sài G̣n) và một số tài liệu chữ Nôm in ở Hà Nội, tôi đă soạn bảng mă chữ thuần Nôm, trong khi anh Phước (lúc ấy đang làm ở hăng Mentor Graphics) giải quyết vấn đề in bảng mă này ra PostScript...

Một thời... “không đại diện”

Năm 1992, tôi và anh Đỗ Bá Phước dự hội nghị về chữ biểu ư (IRG) ở Honolulu. Vào giờ nghỉ, chúng tôi rủ nhau đi bơi, lên xe bus để đến một vịnh nổi tiếng ở đây. Trên xe có một ông già tự giới thiệu là người của hăng xe bus nhưng đang nghỉ hè. Ông ta luôn nhắc nhở mọi người đi xe bus không nên xuống ngay chỗ cắm bảng v́ phải đi bộ thêm một đoạn, v.v... Khi đi bơi về, chúng tôi cũng lại gặp ông ta đứng nhắc nhở mọi người. T́nh thực là những ǵ ông ta nói đều đúng, vậy mà không ai nghe theo, thậm chí c̣n chọc ghẹo ông ấy.

Từ “ông-già-đi-bộ” này, chúng tôi liên tưởng tới chuyện của ḿnh ở hội nghị Honolulu: Nhiều đại biểu các nước chất vấn chúng tôi đại diện cho ai, chúng tôi đành nói là “có làm việc với Việt Nam”. Họ thắc mắc tiếp: Tại sao Việt Nam lại cử người ở ngoài nước tham dự hội nghị? Chúng tôi nói rằng ḿnh đến với tư cách... khoa học để giới thiệu về chữ Nôm. Đúng là vào thời đó, cho dù chúng tôi có nêu với Việt Nam vấn đề mă hoá chữ Nôm để đưa vào bảng mă chuẩn quốc tế th́ cũng ít ai muốn nghe, v́ chưa phải đă có nhiều người hiểu rơ ư nghĩa của vấn đề này. V́ vậy, chúng tôi tự gọi đùa ḿnh là nhóm “OF-OF” (Old Folk On Foot) – tức “Những người già đi bộ”.

Đó là chưa kể phản ứng của đại biểu một nước đứng lên phản đối giữa hội nghị Honolulu rằng trước khi tham gia hội nghị, họ đă nghe nói về chuyện “chữ Nôm chi đó” nên đă cử người sang Việt Nam mà “không thấy chữ Nôm đâu cả” (!). V́ vậy, theo họ, “chữ Nôm không đại diện cho Việt Nam”(!).

Thơ Đường, chữ Nôm trên máy Mac

Dù sao, chúng tôi rất ngạc nhiên khi các đại biểu của Mỹ, Nhật, Hàn Quốc và Đài Loan lại ủng hộ chữ Nôm. Riêng đại biểu Hồng Kông là một thầy giáo và là người duy nhất có mở ra xem kỹ bảng chữ Nôm do tôi soạn (gồm 2.500 chữ thuần Nôm, được xếp theo nhiều loại khác nhau). Ông ấy nói: “Tôi học chữ Hán nhưng không đọc được chữ Nôm, c̣n bảng mă chữ Nôm được giới thiệu ở hội nghị là công phu, có quy tắc, chứng tỏ... quả thật có chữ Nôm nên đồng ư bỏ phiếu thuận”. Kết quả: 7/8 phiếu đồng ư đưa chữ Nôm vào bảng mă quốc tế!

Sau đó, chúng tôi báo cáo kết quả này và làm việc với Việt Nam. Anh Trần Lưu Chương, Trưởng Tiểu ban Chuẩn công nghệ thông tin (CNTT), thuộc Chương tŕnh Quốc gia về CNTT, chấp nhận làm bảng mă chuẩn chữ Nôm để làm cơ sở pháp lư cho việc đăng kư chữ Nôm vào bảng mă quốc tế. Đến năm 1993, nhân sáng kiến tổ chức hội nghị về bảng mă quốc tế ở Hà Nội, chúng tôi đă đưa các đại biểu đi thăm G̣ Đống Đa và Viện Hán Nôm, rồi cùng một số đi xe lửa vô Huế để thăm đền chùa, lăng tẩm để họ thấy rơ chúng ta có di sản chữ Nôm. Chúng tôi cũng gặp được nhiều người dân Huế sốt sắng đưa về nhà cho xem hồ sơ, gia phả,... chữ Nôm trong gia tộc họ. (Thậm chí, có ông tướng Việt Nam đọc được vài bài thơ Đường do chúng tôi gơ chữ Nôm trên máy Macintosh. Các đại biểu quốc tế rất ngạc nhiên, c̣n đại biểu Mỹ th́ bái phục v́ theo họ, “tướng Mỹ không... đọc được thơ”!)

Cũng năm 1993, bảng mă chuẩn chữ Nôm ra đời trong nước, với sự chủ tŕ của Viện Hán Nôm. Về sau, quá tŕnh đưa chữ Nôm vào bảng mă ISO 10646 của chúng ta gần như thành công trọn vẹn, như lời kể tóm tắt của anh Ngô Trung Việt (Viện CNTT) cùng đăng trong e-CHÍP số này.

Đưa được chữ Nôm vô bảng mă quốc tế là một thắng lợi có ư nghĩa của Việt Nam, song chúng ta không thể dừng lại ở đó. Cần ứng dụng các công nghệ mới vào việc giải quyết tiếp tục một số vấn đề về tư liệu, về kỹ thuật in ấn chữ Nôm,... sao cho mỗi khi phát hiện được h́nh chữ mới của chữ Nôm trên các văn bản th́ cho dù nó xuất xứ từ đâu ở khắp thế giới, chúng ta có thể tiếp nhận và đưa vào bảng mă chung rất nhanh thông qua mạng Internet mà không phải đến tận nơi để lấy.

Cần có sự hợp tác giữa các chuyên gia CNTT với các chuyên gia chữ Nôm. Các chuyên gia chữ Nôm là những người đặt hàng, để tránh t́nh trạng các chuyên gia CNTT nói rằng “chúng tôi chỉ làm được tới đó tới đó, các anh không dùng được th́... rán chịu v́ không c̣n ai khác làm nữa”!

GS Ngô Thanh Nhàn: Nôm Lookup Tool (NLT) - một diễn đàn
Hữu Thiện ghi

Thật là may khi chúng tôi có một nhóm “già mà đi bộ”, trong đó có chị Lê Phạm Ngưng Hương và anh Hồ Văn Tiến ở Thuỵ Sĩ, chị Lê Mai Phương ở Bỉ, anh Ngô Trung Việt ở Việt Nam để hợp tác xây dựng NLT (http://nomfoundation.org/unicode/lookup.php) như một nơi hội tụ những ư kiến khác nhau trong việc xử lư chữ Nôm. Chúng tôi muốn NLT là chỗ để... căi nhau về những ư kiến mới trong công nghệ xử lư chữ Nôm để t́m ra cách làm hay nhất, sao cho tất cả cùng có lợi khi h́nh thành và phát triển một bảng tra chữ Nôm trên mạng cho mọi người đều dùng được.

Trong bảng mă chuẩn quốc tế, chữ Nôm vẫn c̣n là một loại chữ mới, đ̣i hỏi phương pháp xử lư không đơn giản chút nào. V́ vậy, chúng tôi lôi vào NLT tất cả kiến thức của Khang Hy từ điển, của Unicode, của tất cả các chuyên gia Nhật - Trung - Triều. Nhờ vậy, người dùng NLT có thể dùng được Khang Hy từ điển mà không cần phải mua một quyển từ điển này. Đây là một trong các điểm chính mà các thầy đều thích.

Mặt khác, chúng tôi phân ra bộ, giúp cho mỗi khi gặp một chữ Nôm mới, ta chỉ cần nhận ra được một phần trong đó là có thể t́m ra được chữ ấy (so với ở Khang Hy từ điển, chỉ khi nào biết đúng một chữ Hán th́ may ra mới t́m được). Chúng tôi cũng bắt đầu bỏ mă Thương Hiệt vào NLT để xem mă này có hay hơn chữ quốc ngữ trong việc đi t́m chữ Nôm. Có người đă dùng chữ quốc ngữ để t́m chữ Nôm và kết quả tốt hơn việc dùng chữ Pinyin (chữ Quan thoại la-tinh hóa) để t́m chữ Hán, nhờ chữ quốc ngữ có dấu và những đặc thù rất hay...

Chúng tôi rất chú ư đến vấn đề những bạn trẻ ngày càng sử dụng chữ Nôm nhiều hơn, ngay cả trong việc họ thiết kế hay chơi games có chữ Nôm trong đó để tái hiện đúng khung cảnh lịch sử (như ở thời Nguyễn Trăi chẳng hạn). Khi tôi đi nói chuyện về quyển thơ Hồ Xuân Hương mà chúng tôi làm thành công ở Hoa Kỳ, các bạn trẻ bên ấy rất thích v́ người Việt ta có cả chữ quốc ngữ và chữ Nôm. Từ đó, họ cũng có nhu cầu muốn đưa tên ḿnh bằng... chữ Nôm lên mạng, trông rất đẹp. NLT phải giúp người ta làm được như vậy trên mạng mà không cần có bộ font.

Đó là một yêu cầu đơn giản từ phía người dùng song lại đặt ra những yêu cầu mới về xử lư kỹ thuật với chúng tôi. Cũng từ đó nảy ra sáng kiến mới của anh Đỗ Bá Phước: Dùng công nghệ SVG (scalar-vector graphics - đồ hoạ vectơ vô hướng) để không cần có font vẫn có thể xem được chữ Nôm biểu ư. Tiếp theo, lại có thêm một sáng kiến khác từ chị Lê Phạm Ngưng Hương: Chữ Nôm được hiển thị như ảnh .jpeg, tiện sao - dán vào tài liệu (LTS: Các bạn có thể xem lại bài “Với Nôm Lookup Tool: Chữ Nôm lại nhú mầm trở lại…”, e-CHÍP số 17, trg 12-14).