XML
PCWorld VN 8/99
Định nghĩa:
Ngôn ngữ đánh dấu mở rộng Extensible Markup Language (XML) là một đặc tả cho phép gán thẻ cho văn bản trong tài liệu Web. Nó không mô tả hình thức hiển thị của văn bản như chức năng mà ngôn ngữ lập trình trên Web là HTML thực hiện, chức năng của nó là gán ý nghĩa cho văn bản có trong trang Web.Mọi thứ đều có ngữ cảnh
Khi thực hiện công việc tìm kiếm trên Web, bạn có thể có được hàng trăm ngàn kết quả nhưng những thứ này lại hoàn toàn không liên quan gì với yêu cầu mà bạn đưa ra. Các công cụ tìm kiếm chỉ làm việc với văn bản đơn thuần mà không biết được ngữ cảnh của văn bản. Tuy nhiên, nếu trong kết quả tìm kiếm có những trang được tạo bằng XML thì rất có khả năng chúng đáp ứng đúng yêu cầu của bạn.
Sở dĩ như vậy là vì bản thân những tài liệu này đã được lập trình về ngữ cảnh nên việc tìm kiếm trên Web cũng như thu thập tài liệu được chính xác hơn.
Để đạt điều này, tài liệu phải được gắn thẻ. Thẻ là những thuộc tính được gán cho các mẫu thông tin. Document Type Definition (DTD) xác định loại thẻ nào được phép dùng với loại tài liệu nào. Hãy tưởng tượng DTD giống như các quy tắc ngữ pháp, được áp dụng riêng cho từng tài liệu, quy định việc sử dụng các thẻ tài liệu.
Ví dụ: tài liệu về văn chương Anh có thể dùng tác giả, chủ đề, biên tập viên, và ngày xuất bản để định ra DDT; sau đó bộ biên dịch cho công cụ tìm kiếm sẽ thông dịch văn bản và đánh thẻ Emily Dickson là tác giả. Thẻ sẽ có hình thức như sau: <author>Emily Dickinson</author>. Vì thế khi bạn tìm kiếm trên Web về Emily Dickinson, sẽ không phải nhận cả những kết quả cho Emily hoặc Dickinson - có khả năng lên đến con số hàng ngàn. Thay vào đó bạn chỉ nhận được những tài liệu mà Emily Dickinson là tác giả. Giới phân tích nhận định XML sẽ được dùng rộng rãi trong các ứng dụng liên quan đến kiểu dạng hay dùng để xác định kiểu loại đối tượng; chẳng hạn nó có thể xác định được một trang nào đó thuộc loại đối tượng nào - đặt hàng, kiểm tra hàng hay cơ sở dữ liệu. Nếu như trang HTML cung cấp nội dung thì XML mang lại định danh của tài liệu.
Đây là sự khác biệt với HTML chỉ có địa chỉ Web. Nếu địa chỉ thay đổi thì sẽ khó khăn hơn nhiều trong việc tìm lại trang Web. Ngược lại, địa chỉ vẫn giữ nguyên nhưng trang Web đã thay đổi thì bạn cũng không thể biết được điều đó. Nhờ khả năng định danh tài liệu, XML có thể giúp bạn biết được những thay đổi như vậy. Một số người dùng có nhu cầu xuất bản trên Web và thường xuyên phải thực hiện cập nhật tài liệu cũng đang thử nghiệm để chuyển sang XML chứ không dùng ngôn ngữ đánh thẻ như Bookmaster của IBM.
Theo các chuyên gia, mặc dù người dùng rất quan tâm đến XML nhưng nó vẫn chưa phổ biến. Nguyên nhân là do hầu hết các trình duyệt chưa hỗ trợ, hơn nữa số công cụ có sẵn vẫn còn rất ít và chúng cũng chưa được hoàn thiện. Một vấn đề khác cũng cần được giải quyết là chuẩn.
Computerworld

PcLeHoan
1996 - 2002
Mirror :
http://www.pclehoan.com
Mirror :
http://www.lehoanpc.net
Mirror :
http://www.ktlehoan.com