|
Về AMPad của “Hiệp sĩ” Trần Triết Tâm
LÊ HOÀN |
TỰ BẠCH CỦA “HIỆP SĨ” TRẦN
TRIẾT TÂM:
Mong có bạn chứng minh rằng... tôi lầm!
AutoMark, và sau này là AMPad, là một công cụ dùng để xử
lý tiếng Việt không dấu. Đây không phải là một bộ gõ
tiếng Việt và không hoạt động độc lập. Chương trình xử
lý không bao giờ hoàn chỉnh 100% như ý muốn. Tuy nhiên
nếu dùng để xử lý các văn bản tiếng Việt (không bỏ dấu)
đúng chính tả, văn phạm thì kết quả rất cao (có thể đúng
97% trên tổng số từ được xử lý).
Chương trình này được tôi thực hiện trong khoảng một năm
với trên 10.000 dòng lệnh. Nền tảng của chương trình là
thống kê tần suất xuất hiện của các từ có dấu tương ứng
với một từ không dấu, thêm các thuật toán để lựa chọn và
đề xuất từ thích hợp... Từ khi viết chương trình đến
nay, tôi rất vui vì nhận được khá nhiều ý kiến đóng góp,
nhất là các bạn ở nước ngoài (hình như ở nước ngoài
không quen sử dụng bộ gõ tiếng Việt lắm).
Tôi chỉ tiếc vài điều sau:
- Chương trình chỉ nâng cấp được hai lần từ AutoMark lên
AMPad 1.1 (có trong dĩa CD kèm theo e-CHÍP số 1), và
AMPad 1.2 thì chấm dứt do sự cố về ổ cứng khiến tôi bị
mất toàn bộ mã nguồn của chương trình. Cũng vì vậy, một
số bạn ngỏ ý xin mã nguồn, tôi đã đồng ý nhưng sự cố ổ
cứng đã khiến tôi không thực hiện được lời hứa.
- Chương trình không hỗ trợ mã Unicode và không hoạt
động trong Win XP. Với AutoMark và AMPad, điều làm tôi
vui nhất là đã quen được một số bạn. Tôi chân thành cảm
ơn các bạn đã quan tâm sử dụng thử. Dù sao, đây vẫn là
một công cụ mà kết quả xử lý không bao giờ đạt kết quả
tuyệt đối nên có lẽ một số bạn cũng có phần thất vọng.
Tôi đã từng nghĩ có thể xử lý tiếng Việt không dấu thành
tiếng Việt có dấu 100% nhưng sau khi viết chương trình,
tôi mới phát hiện ra là điều đó gần như sẽ không bao giờ
thực hiện được. Mong rằng trong tương lai sẽ có bạn nào
đó sẽ chứng minh là tôi đã lầm! |
 |
Tên: Trần Triết Tâm
Tuổi: 44
Nghề nghiệp: Chuyên viên Thống kê
Nơi công tác: Cục Thống kê thành phố Đà Nẵng |
|
|
|