Xây dựng hệ thống trích chọn tên riêng cho văn bản tiếng Việt bằng phương pháp học thống kê

Tóm tắt Xây dựng hệ thống trích chọn tên riêng cho văn bản tiếng Việt bằng phương pháp học thống kê: ...tính chất chuỗi , có thể tích hợp hàng trăm nghìn thậm chí hàng triệu đặc điểm từ dữ liêụ hết sức đa daṇg nhằm hỗ trơ ̣cho quá trình huấn luyện. Thưc̣ nghiêṃ trên các văn bản tiếng Viêṭ cho thấy kết quả đaṭ đươc̣ rất khả quan. Luận văn được tổ chức thành ba chương như s... dụng công cụ CRF++ của Taku Kudo và đưa ra một số kết quả thực nghiệm của mô hình xây dựng được. References [1]. Duglas E.Appelt, D.J.Israel. Introduction to Information Extraction Technology. 1999. [2]. A.Berger. The Improved Iterative Scaling Algorithm: A gentle Introdution. School of...11]. A. McCallum, K. Rohanimanesh, and C. Sutton. Dynamic Conditional Random Fields for Jointly Labeling Multiple Sequences. 2004 [12]. A.McCallum, C.Shutton. An introduction for Conditional Random Fields for Relational Learning. 2005 [13]. A.McCallum, D.Freitag, and F. Pereira. Maximum entr...

pdf4 trang | Chia sẻ: kasablanca | Lượt xem: 713 | Lượt tải: 0download

File đính kèm:

  • pdfV_L0_01340.pdf