Số 12
Việt hoá PC & NET

Thư ngỏ
Bộ kiểm tra chính tả chữ Việt: Mời các bạn tham gia
NGÔ TRUNG VIỆT (Viện CNTT)

Trong nỗ lực phát triển các phần mềm nguồn mở và để áp dụng các nguyên tắc của kỹ nghệ phần mềm vào việc phát triển các phần mềm, e-CHÍP muốn nêu ra một số vấn đề thực tế của tiếng Việt cần có phần mềm hỗ trợ, qua đó tạo ra một môi trường thảo luận về vấn đề này với tất cả các bạn quan tâm.

Về tổng thể, chúng tôi muốn đặt vấn đề từ gốc rễ rồi trải qua dần các khâu tìm hiểu yêu cầu, phân tích yêu cầu, thiết kế hệ thống, thiết kế chương trình, cài đặt, kiểm thử và sử dụng. Qua quá trình này, chúng tôi hy vọng tạo ra thói quen làm việc và triển khai phần mềm một cách nghiêm túc, bài bản, theo đúng nguyên tắc của kỹ nghệ phần mềm. Qua đó, chúng tôi cũng muốn hình thành một cộng đồng những người phát triển phần mềm trao đổi thường xuyên với nhau về các vấn đề hiện tại của xử lý chữ Việt trên máy tính.

Vấn đề được đặt ra ở đây là cần xây dựng phần mềm kiểm tra chính tả cho các văn bản chữ Việt. Chúng ta cần có một bộ chương trình giúp kiểm tra chính tả của các văn bản được soạn thảo trong tiếng Việt. Từ trước tới nay, đã có một số công ty phần mềm triển khai các chương trình kiểm tra chính tả chữ Việt. Chúng ta vẫn sử dụng nếu chúng có ích. Thế nhưng chúng tôi muốn nêu lại vấn đề này để tạo ra sân chơi và môi trường làm việc mới theo các tiêu chuẩn quốc tế cho các bạn trẻ.

Vấn đề đầu tiên chúng tôi muốn nêu ra để các bạn cùng suy nghĩ và thảo luận là xác định yêu cầu của bộ kiểm tra chính tả chữ Việt. Chúng ta sẽ không đi vào các chi tiết kỹ thuật của việc thực hiện bộ kiểm tra chính tả trong thảo luận này (những điều đó sẽ được thảo luận sau). Trong bước đầu tiên, chúng tôi muốn các bạn cùng động não suy nghĩ để vạch ra xem chúng ta hiểu bộ kiểm tra chính tả là thế nào, chính tả tiếng Việt là gì và cần phải làm những gì để tạo được một bộ kiểm tra như vậy. Tất cả các trao đổi của các bạn sẽ được tổng hợp để tạo thành tài liệu đặc tả yêu cầu cho bài toán. Mọi triển khai tiếp để xây dựng phần mềm sẽ hoàn toàn tuỳ thuộc vào tài liệu đầu tiên được tạo ra này.

Để bắt đầu loạt thảo luận động não tập thể này, chúng tôi xin có đôi lời trao đổi về khung cảnh chung cho công việc này:

1. Xin mời tất cả các bạn quan tâm cùng đăng ký tham gia trao đổi công khai và tự do về vấn đề này. Một diễn đàn sẽ được lập ra trên e-CHÍP và website e-CHÍP (www.echip.com.vn) cùng Tạp chí CNTT trực tuyến I-Today (www.i-today.com.vn) thuộc Nhóm Truyền thông Công nghệ thông tin e-CHÍP để có thể đăng các ý kiến cá nhân. Mọi ý kiến xây dựng đều được hoan nghênh, chúng ta không chỉ trích ý kiến người khác mà chấp nhận cả những ý kiến trái ngược nhau.

2. Tất cả các ý kiến đóng góp sẽ được tổng hợp đều đặn và phổ biến cho tất cả các bạn. Qua đó, chúng ta sẽ đúc rút thành tài liệu đặc tả vấn đề.

3. Vấn đề chính tả tiếng Việt cần được xem xét dựa trên đặc thù của tiếng Việt. Tiếng Việt được nói và phát âm ở các miền có những chỗ khác nhau, từ đó làm phát sinh ra cách viết đôi lúc khác nhau và do đó phát sinh vấn đề chính tả của từ nhiều âm tiết (multi-syllables). Nhiều người ở các miền khác nhau rất cần có một công cụ giúp cho họ biết đâu là từ viết đúng chính tả.

4. Vấn đề chính tả các âm tiết Hán-Việt cũng là vấn đề cần được để ý, vì chúng là nguồn để tạo ra nhiều từ tiếng Việt.

5. Có một số quy tắc chính tả của tiếng Việt mà qua đó có thể nắm được một cách có hệ thống.

6. Vấn đề chính tả cũng phát sinh khi con người phải dùng bàn phím đưa thông tin vào máy tính và do đó làm phát sinh việc gõ nhầm chữ, đặt nhầm thanh,... Đây là vấn đề về chính tả âm tiết (syllable).

[Đầu trang]
Trang chủ
Thư ngỏ
Nội lực "Peter Pan"
Cầu nối Intel Việt Nam
Chuyện trong tuần
Nhóm Frontpage
Cõi người ta
Kim cương doanh nghiệp
Bình luận thị trường
Cõi Mô-bai
Chuyên đề
Bổ ngửa
Nuôi hồn Robot
Túi càn khôn IT
Hồ lô biến
Cảm về Game
Nhật ký e-CHÍP
Bản quyền VASC Orient, Công ty phát triển phần mềm VASC
99 Triệu Việt Vương HN; Tel: (04) 9782235 • email: echip@vasc.com.vn