Nghiên cứu gán nhãn từ loại cho văn bản tiếng Việt bằng phương pháp học máy không có hướng dẫn

Tóm tắt Nghiên cứu gán nhãn từ loại cho văn bản tiếng Việt bằng phương pháp học máy không có hướng dẫn: ..., có thể thấy có hai dạng tập nhãn từ loại thường được sử dụng cho các công cụ gán nhãn từ loại tiếng Việt:  Dạng thứ nhất, xuất phát từ tập gồm 8 nhãn từ loại tiếng Việt thông dụng được các nhà nghiên cứu ngôn ngữ học công nhận nhiều nhất (bao gồm: danh từ, động từ, tính từ, đại từ, phụ ...n luyện khác nhau: - Huấn luyện tần số quan hệ (Relative Frequency RF) - Huấn luyện khả năng cực đại (Maximum Likelihood ML) bằng thuật toán tiến-lùi. 3.1.1.1 Huấn luyện tần số quan hệ Nếu chúng ta có một lượng văn bản đã gán nhãn có sẵn, chúng ta có thể tính toán số lần N(w,t) một từ w đư... ngữ liệu gán nhãn bằng tay nhỏ thì sẽ sử dụng huấn luyện ML để thực hiện. KẾT LUẬN Những kết quả đã đạt đƣợc của luận văn:  Tổng quan về bài toán gán nhãn từ loại: luận văn đã trình bày được bài toán gán nhãn từ loại, trình bày và so sánh các hướng tiếp cận không có hướng dẫn và có hướ...

pdf13 trang | Chia sẻ: kasablanca | Lượt xem: 1115 | Lượt tải: 0download

File đính kèm:

  • pdf01050000498.pdf
Ebook liên quan