XML
Xem bai viet bang font ABC

PCWorld VN 8/99

Định nghĩa: Ngôn ngữ đánh dấu mở rộng Extensible Markup Language (XML) là một đặc tả cho phép gán thẻ cho văn bản trong tài liệu Web. Nó không mô tả hình thức hiển thị của văn bản như chức năng mà ngôn ngữ lập trình trên Web là HTML thực hiện, chức năng của nó là gán ý nghĩa cho văn bản có trong trang Web.

Mọi thứ đều có ngữ cảnh

    Khi thực hiện công việc tìm kiếm trên Web, bạn có thể có được hàng trăm ngàn kết quả nhưng những thứ này lại hoàn toàn không liên quan gì với yêu cầu mà bạn đưa ra. Các công cụ tìm kiếm chỉ làm việc với văn bản đơn thuần mà không biết được ngữ cảnh của văn bản. Tuy nhiên, nếu trong kết quả tìm kiếm có những trang được tạo bằng XML thì rất có khả năng chúng đáp ứng đúng yêu cầu của bạn.

    Sở dĩ như vậy là vì bản thân những tài liệu này đã được lập trình về ngữ cảnh nên việc tìm kiếm trên Web cũng như thu thập tài liệu được chính xác hơn.

    Để đạt điều này, tài liệu phải được gắn thẻ. Thẻ là những thuộc tính được gán cho các mẫu thông tin. Document Type Definition (DTD) xác định loại thẻ nào được phép dùng với loại tài liệu nào. Hãy tưởng tượng DTD giống như các quy tắc ngữ pháp, được áp dụng riêng cho từng tài liệu, quy định việc sử dụng các thẻ tài liệu.

    Ví dụ: tài liệu về văn chương Anh có thể dùng tác giả, chủ đề, biên tập viên, và ngày xuất bản để định ra DDT; sau đó bộ biên dịch cho công cụ tìm kiếm sẽ thông dịch văn bản và đánh thẻ Emily Dickson là tác giả. Thẻ sẽ có hình thức như sau: <author>Emily Dickinson</author>. Vì thế khi bạn tìm kiếm trên Web về Emily Dickinson, sẽ không phải nhận cả những kết quả cho Emily hoặc Dickinson - có khả năng lên đến con số hàng ngàn. Thay vào đó bạn chỉ nhận được những tài liệu mà Emily Dickinson là tác giả. Giới phân tích nhận định XML sẽ được dùng rộng rãi trong các ứng dụng liên quan đến kiểu dạng hay dùng để xác định kiểu loại đối tượng; chẳng hạn nó có thể xác định được một trang nào đó thuộc loại đối tượng nào - đặt hàng, kiểm tra hàng hay cơ sở dữ liệu. Nếu như trang HTML cung cấp nội dung thì XML mang lại định danh của tài liệu.

    Đây là sự khác biệt với HTML chỉ có địa chỉ Web. Nếu địa chỉ thay đổi thì sẽ khó khăn hơn nhiều trong việc tìm lại trang Web. Ngược lại, địa chỉ vẫn giữ nguyên nhưng trang Web đã thay đổi thì bạn cũng không thể biết được điều đó. Nhờ khả năng định danh tài liệu, XML có thể giúp bạn biết được những thay đổi như vậy. Một số người dùng có nhu cầu xuất bản trên Web và thường xuyên phải thực hiện cập nhật tài liệu cũng đang thử nghiệm để chuyển sang XML chứ không dùng ngôn ngữ đánh thẻ như Bookmaster của IBM.

    Theo các chuyên gia, mặc dù người dùng rất quan tâm đến XML nhưng nó vẫn chưa phổ biến. Nguyên nhân là do hầu hết các trình duyệt chưa hỗ trợ, hơn nữa số công cụ có sẵn vẫn còn rất ít và chúng cũng chưa được hoàn thiện. Một vấn đề khác cũng cần được giải quyết là chuẩn.

Computerworld

Thuật ngữ

Dưới đây là những từ chuyên môn cần được hiểu rõ khi làm việc với XML

Document Type Definition (DTD) - Định nghĩa loại tài liệu

Mô tả cách thức tài liệu được thông dịch thông qua các thẻ đánh dấu. DTD định nghĩa cho các loại tài liệu khác nhau. Ví dụ, đơn đặt hàng của công ty nào đó sẽ là loại tài liệu khác với tài liệu về pháp luật.

Parser - Trình biên dịch

Mã chương trình nhận tài liệu XML, đọc, thông dịch và trình bày chúng dưới dạng đối tượng mà những ứng dụng có thể truy cập đến.

Tag - Thẻ

Cách thức tài liệu được đánh dấu để hiển thị. Thẻ sẽ định dạng dữ liệu của tài liệu.


Hỏi đáp

Những trao đổi với một viên chức lãnh đạo công nghệ ở thủ phủ bang North Carolina về kế hoạch cho XML:

Hỏi: Hiện trạng về xây dựng HTML?

Đáp: Chúng tôi chỉ mới bắt đầu thử nghiệm XML, cần khoảng ba tháng.

Hỏi: Tạo sao lại là XML?

Đáp: Có rất nhiều cơ hội vì dường như XML linh hoạt hơn cũng như cho phép dùng lại các nội dung; những điều này không thể thực hiện được với HTML.

Hỏi: Liệu XML có làm nảy sinh vấn đề gì hay không?

Đáp: Một vấn đề là cần phải học XML, hiểu được việc dùng thẻ cũng như đạt được những thoả thuận về thẻ. Nếu mỗi người đánh thẻ theo một cách thì không thể dùng lại đưọc. Một vấn đề khác là đạt được sự thoả thuận về định nghĩa trong số những cơ sở có liên quan.


PcLeHoan 1996 - 2002
Mirror : http://www.pclehoan.com
Mirror : http://www.lehoanpc.net

Mirror : http://www.ktlehoan.com