Luận văn Ứng dụng kỹ thuật thu thập thông tin trên web để xây dựng hệ thống tổng hợp thông tin kinh tế xã hội

Tóm tắt Luận văn Ứng dụng kỹ thuật thu thập thông tin trên web để xây dựng hệ thống tổng hợp thông tin kinh tế xã hội: ...nhau nhằm khai thỏc nguồn dữ liệu phong phỳ ủược lưu trữ trong cỏc hệ thống thụng tin. Tựy theo bản chất của từng lĩnh vực, việc vận dụng Khai phỏ dữ liệu cú những cỏch tiếp cận khỏc nhau. Khai phỏ dữ liệu cũng ủược vận dụng hiệu quả ủể giải quyết cỏc bài toỏn phức tạp trong cỏc ngành ủũi hỏ...nội dung web page, tỡm tất cả cỏc hyperlink cú trong web page ủú và ủưa cỏc URL ủược trỏ tới bới cỏc hyperlink ủú vào danh sỏch URL. Dựa vào danh sỏch URL này, Crawler lại tiếp tục quỏ trỡnh duyệt ủệ quy ủể ghộ thăm tất cả cỏc URL chưa ủược duyệt ủến. Quỏ trỡnh này ủược gọi là web crawling hoặ...ghĩa bởi W3C, sử dụng ủể truy vấn cỏc node hoặc tớnh toỏn cỏc giỏ trị lấy trong một tài liệu XML [1]. Một biểu thức XPath (Xpath expression) cú thể chọn một node hoặc một tập hợp cỏc node, hoặc nú cú thể trả lại một giỏ trị dữ liệu dựa trờn một hoặc nhiều node trong tài liệu. XPath hiện cú 2 p...

pdf25 trang | Chia sẻ: ebook | Lượt xem: 1107 | Lượt tải: 0download

File đính kèm:

  • pdfTomtat (5).pdf