Mã tài liệu: 243875
Số trang: 60
Định dạng: pdf
Dung lượng file: 675 Kb
Chuyên mục: Tổng hợp
Tóm tắt
Với sự ra đời và Phát triển ngày càng mạnh mẽ trên World Wide Web đặt ra thách
thức đòi hỏi việc khai thác thông tin một cách hiệu quả. Mặc dù chất lượng của các máy
tìm kiếm đã được cải thiện nhưng kết quả trả về chỉ là những tài liệu có liên quan. Vì thế,
hệ thống hỏi đáp ra đời là một nhu cầu cấp thiết, cung cấp cho người dùng câu trả lời
ngắn gọn và chính xác nhất. Đây là một bài toán khó đối với hầu hết các Ngôn ngữ nói
chung trên thế giới nói chung cũng như hệ thống tiếng Việt nói riêng.
Khoá luận tập trung vào nghiên cứu các phương pháp Xây dựng hệ thống hỏi đáp
và đề xuất đề xuất mô hình cho hệ thông hỏi đáp tự động cho tiếng Việt dựa vào phương
pháp trích rút Quan hệ ngữ nghĩa bằng cách kết hợp hai phương pháp Snowball của
Agichtein, Gravano và phương pháp trích rút mối Quan hệ sử dụng sử máy tìm kiếm
của Ravichandran, Hovy cho tập Văn bản tiếng Việt. Thực nghiệm ban đầu của mô
hình cho thấy hệ thống có thể trả lời chính xác được 89,1% câu hỏi người dùng đưa vào
và khả năng đưa ra câu trả lời là 91,4%. Dựa vào kết quả trên, chúng tôi nhận thấy
phương pháp trích rút mối Quan hệ ngữ nghĩa được triển khai cho Ngôn ngữ tiếng Việt là
khả quan, phục vụ tốt cho việc Xây dựng hệ thống hỏi đáp.
Mục lục
Mở đầu 1
Chương 1. Khái quát bài toán trích rút mối Quan hệ ngữ nghĩa . . 3
1.1 Quan hệ ngữ nghĩa . 3
1.2 Các loại Quan hệ ngữ nghĩa . 3
1.3 Bài toán trích rút mối Quan hệ ngữ nghĩa 7
1.4 Hệ thống hỏi đáp dựa trên trích rút Quan hệ ngữ nghĩa . 9
1.4.1 Khái niệm hệ thống hỏi đáp . 9
1.4.2 Một số vấn đề quan tâm khi thiết kế hệ thống hỏi đáp 10
1.4.3 Một số hệ thống hỏi đáp tiêu biểu 10
1.5 Tóm tắt chương một 12
Chương 2. Các phương pháp trích rút mẫu Quan hệ ngữ nghĩa . 13
2.1 Phương pháp DIRPE . 13
2.2 Phương pháp Snowball 16
2.3 Phương pháp trích xuất mẫu tự động sử dụng máy tìm kiếm . 18
2.4 Phương pháp KnowItAll . 19
2.5 Phương pháp TextRunner 22
2.6 Nhận xét . 23
2.7 Tóm tắt chương hai 25
Chương 3. Mô hình hệ thống hỏi đáp tiếng Việt sử dụng trích rút Quan hệ ngữ nghĩa.
26
3.1 Mô hình trích rút mẫu Quan hệ ngữ nghĩa . 26
3.2 Phương pháp sinh tự động thực thể từ tập dữ liệu Web lớn 28
iv
3.3 Mô hình hệ thống hỏi đáp tiếng Việt. 30
3.4 Tổng kết chương ba 33
Chương 4: Thực nghiệm và đánh giá 34
4.1 Môi trường và các công cụ sử dụng cho thực nghiệm 34
4.2 Xây dựng tập dữ liệu . 35
4.3 Thực nghiệm 37
4.3.1 Sinh tự động tập thực thể từ dữ liệu web . 37
4.3.2 Thực nghiệm trích rút mẫu Quan hệ ngữ nghĩa trong Văn bản tiếng Việt 40
4.3.3 Thực nghiệm phân tích câu hỏi và trích xuất câu trả lời cho hệ thống hỏi
đáp tiếng Việt sử dụng phương pháp trích rút mối Quan hệ ngữ nghĩa. . 42
Kết luận . 47
Tài liệu tham khảo . 4
Những tài liệu gần giống với tài liệu bạn đang xem
📎 Số trang: 67
👁 Lượt xem: 530
⬇ Lượt tải: 16
📎 Số trang: 2
👁 Lượt xem: 848
⬇ Lượt tải: 16
📎 Số trang: 27
👁 Lượt xem: 474
⬇ Lượt tải: 16
📎 Số trang: 70
👁 Lượt xem: 566
⬇ Lượt tải: 16
📎 Số trang: 20
👁 Lượt xem: 397
⬇ Lượt tải: 17
📎 Số trang: 12
👁 Lượt xem: 441
⬇ Lượt tải: 21
📎 Số trang: 28
👁 Lượt xem: 265
⬇ Lượt tải: 16
📎 Số trang: 1
👁 Lượt xem: 545
⬇ Lượt tải: 16
📎 Số trang: 10
👁 Lượt xem: 322
⬇ Lượt tải: 17
📎 Số trang: 21
👁 Lượt xem: 355
⬇ Lượt tải: 16
📎 Số trang: 100
👁 Lượt xem: 689
⬇ Lượt tải: 17
📎 Số trang: 45
👁 Lượt xem: 370
⬇ Lượt tải: 16
Những tài liệu bạn đã xem
📎 Số trang: 60
👁 Lượt xem: 409
⬇ Lượt tải: 16