Luận văn Xây dựng hệ thống thu thập thông tin tự động phục vụ cập nhật nội dung cho trang web

Tóm tắt Luận văn Xây dựng hệ thống thu thập thông tin tự động phục vụ cập nhật nội dung cho trang web: ... dữ liệu liên quan và tiền xử lý chúng sao cho thuật tốn KPDL cĩ thể hiểu được. Đây là một quá trình rất khĩ khăn, cĩ thể gặp phải rất nhiều các vướng mắc như: dữ liệu phải được sao ra nhiều bản (nếu được chiết xuất vào các tệp), quản lý tập các dữ liệu, phải lặp đi lặp lại nhiều lần tồn...ch sử dụng. Như vậy, giải pháp được đưa ra đồng nghĩa với việc chúng ta đi giải quyết bài tốn tìm kiếm và phân cụm tài liệu web. Trên cơ sở áp dụng các lý thuyết về khai phá dữ liệu, chúng ta sẽ đi giải quyết bài tốn này. 1.4.2 Các yêu cầu • Tính phù hợp • Tính đa hình • Sử dụng các ...iệu sẽ tiến hành phân cụm dữ liệu đã thu thập thành các cụm với độ tương tự của các tài liệu trong cụm là gần nhau nhất. Giai đoạn 4: đánh giá và lựa chọn cụm tài liệu để phát hành lên trang chủ website. - 17 - Hình dưới đây minh họa mơ hình hoạt động của hệ thống: Hình 2.2: Mơ hình ho...

pdf26 trang | Chia sẻ: ebook | Lượt xem: 1007 | Lượt tải: 0download

File đính kèm:

  • pdfTomtat (32).pdf