|
Việt hoá PC &
NET |
|
Thư ngỏ
Bộ kiểm tra chính tả chữ Việt: Mời các bạn tham gia
NGÔ TRUNG VIỆT (Viện CNTT) |
|
Trong nỗ lực phát triển các phần mềm nguồn mở và để
áp dụng các nguyên tắc của kỹ nghệ phần mềm vào việc
phát triển các phần mềm, e-CHÍP muốn nêu ra một số
vấn đề thực tế của tiếng Việt cần có phần mềm hỗ
trợ, qua đó tạo ra một môi trường thảo luận về vấn
đề này với tất cả các bạn quan tâm. |
|
Về tổng thể, chúng tôi muốn đặt vấn đề từ gốc rễ rồi
trải qua dần các khâu tìm hiểu yêu cầu, phân tích
yêu cầu, thiết kế hệ thống, thiết kế chương trình,
cài đặt, kiểm thử và sử dụng. Qua quá trình này,
chúng tôi hy vọng tạo ra thói quen làm việc và triển
khai phần mềm một cách nghiêm túc, bài bản, theo
đúng nguyên tắc của kỹ nghệ phần mềm. Qua đó, chúng
tôi cũng muốn hình thành một cộng đồng những người
phát triển phần mềm trao đổi thường xuyên với nhau
về các vấn đề hiện tại của xử lý chữ Việt trên máy
tính. |
|
Vấn đề được đặt ra ở đây là cần xây dựng phần mềm
kiểm tra chính tả cho các văn bản chữ Việt. Chúng ta
cần có một bộ chương trình giúp kiểm tra chính tả
của các văn bản được soạn thảo trong tiếng Việt. Từ
trước tới nay, đã có một số công ty phần mềm triển
khai các chương trình kiểm tra chính tả chữ Việt.
Chúng ta vẫn sử dụng nếu chúng có ích. Thế nhưng
chúng tôi muốn nêu lại vấn đề này để tạo ra sân chơi
và môi trường làm việc mới theo các tiêu chuẩn quốc
tế cho các bạn trẻ. |
|
Vấn đề đầu tiên chúng tôi muốn nêu ra để các bạn
cùng suy nghĩ và thảo luận là xác định yêu cầu của
bộ kiểm tra chính tả chữ Việt. Chúng ta sẽ không đi
vào các chi tiết kỹ thuật của việc thực hiện bộ kiểm
tra chính tả trong thảo luận này (những điều đó sẽ
được thảo luận sau). Trong bước đầu tiên, chúng tôi
muốn các bạn cùng động não suy nghĩ để vạch ra xem
chúng ta hiểu bộ kiểm tra chính tả là thế nào, chính
tả tiếng Việt là gì và cần phải làm những gì để tạo
được một bộ kiểm tra như vậy. Tất cả các trao đổi
của các bạn sẽ được tổng hợp để tạo thành tài liệu
đặc tả yêu cầu cho bài toán. Mọi triển khai tiếp để
xây dựng phần mềm sẽ hoàn toàn tuỳ thuộc vào tài
liệu đầu tiên được tạo ra này. |
|
Để bắt đầu loạt thảo luận động não tập thể này,
chúng tôi xin có đôi lời trao đổi về khung cảnh
chung cho công việc này: |
|
1. Xin mời tất cả các bạn quan tâm cùng đăng ký tham
gia trao đổi công khai và tự do về vấn đề này. Một
diễn đàn sẽ được lập ra trên e-CHÍP và website
e-CHÍP (www.echip.com.vn)
cùng Tạp chí CNTT trực tuyến I-Today (www.i-today.com.vn)
thuộc Nhóm Truyền thông Công nghệ thông tin e-CHÍP
để có thể đăng các ý kiến cá nhân. Mọi ý kiến xây
dựng đều được hoan nghênh, chúng ta không chỉ trích
ý kiến người khác mà chấp nhận cả những ý kiến trái
ngược nhau. |
|
2. Tất cả các ý kiến đóng góp sẽ được tổng hợp đều
đặn và phổ biến cho tất cả các bạn. Qua đó, chúng ta
sẽ đúc rút thành tài liệu đặc tả vấn đề. |
|
3. Vấn đề chính tả tiếng Việt cần được xem xét dựa
trên đặc thù của tiếng Việt. Tiếng Việt được nói và
phát âm ở các miền có những chỗ khác nhau, từ đó làm
phát sinh ra cách viết đôi lúc khác nhau và do đó
phát sinh vấn đề chính tả của từ nhiều âm tiết
(multi-syllables). Nhiều người ở các miền khác nhau
rất cần có một công cụ giúp cho họ biết đâu là từ
viết đúng chính tả. |
|
4. Vấn đề chính tả các âm tiết Hán-Việt cũng là vấn
đề cần được để ý, vì chúng là nguồn để tạo ra nhiều
từ tiếng Việt. |
|
5. Có một số quy tắc chính tả của tiếng Việt mà qua
đó có thể nắm được một cách có hệ thống. |
|
6. Vấn đề chính tả cũng phát sinh khi con người phải
dùng bàn phím đưa thông tin vào máy tính và do đó
làm phát sinh việc gõ nhầm chữ, đặt nhầm thanh,...
Đây là vấn đề về chính tả âm tiết (syllable). |
|
|