Mã tài liệu: 288865
Số trang: 74
Định dạng: zip
Dung lượng file: 3,674 Kb
Chuyên mục: Kỹ thuật - Công nghệ
Mục lục
Lời mở đầu i
Lời cảm ơn ii
Mục lục iii
Danh sách hình vẽ vi
Danh sách bảng vii
Chương 1 Giới thiệu 1
Chương 2 Các hướng tiếp cận cho bài toán đánh giá quan điểm 3
2.1 Xu hướng các cuộc nghiên cứu gần đây 3
2.1.1 Xác định từ, cụm từ quan điểm 4
2.1.2 Xác định chiều hướng từ, cụm từ quan điểm 4
2.1.3 Phân lớp câu / tài liệu chỉ quan điểm 7
2.2 Những thách thức và công việc có thể trong tương lai 9
2.2.1 Các loại từ khác 9
2.2.2 Thuật ngữ chỉ quan điểm 10
2.2.3 Tính phủ định 10
2.2.4 Cấp độ quan điểm 11
2.2.5 Sự phức tạp của câu / tài liệu 12
2.2.6 Quan điểm theo ngữ cảnh 13
2.2.7 Tài liệu không đồng nhất 13
2.2.8 Một số vấn đề khác 14
Chương 3 Giới thiệu GATE 15
3.1 Tổng quan về GATE 15
3.1.1 Mô hình kiến trúc của GATE 16
3.1.2 Những khái niệm cơ bản trong GATE 18
3.2 Xây dựng plugin trên GATE 18
3.3 Các thành phần quan trọng của GATE 21
3.3.1 Bộ từ điển (Gazetteers) 21
3.3.2 Bộ luật JAPE 22
3.4 Các công cụ quản lý chất lượng 27
3.4.1 Công cụ đánh giá độ tương đồng khi gán nhãn hai văn bản (Annotation Diff) 27
3.4.2 Công cụ đánh giá chất lượng của hệ thống (Corpus Benchmark tool) 28
Chương 4 Hệ thống đánh giá quan điểm người dùng 30
4.1 Giới thiệu hệ thống 30
4.2 Thu thập dữ liệu và gán nhãn 31
4.2.1 Thu thập dữ liệu 32
4.2.2 Gán nhãn dữ liệu 33
4.3 Xây dựng hệ thống đánh giá quan điểm 34
4.3.1 Mô tả tổng quan hệ thống 35
4.3.2 Tiền xử lý 37
4.3.3 Xây dựng bộ từ điển 38
4.3.4 Xây dựng bộ luật 40
Chương 5 Kết quả thực nghiệm và phân tích lỗi 46
5.1 Tiến hành thực nghiệm 46
5.2 Kết quả thực nghiệm 47
5.2.1 Kết quả thực nghiệm đánh giá ở mức từ 47
5.2.2 Kết quả thực nghiệm đánh giá ở mức câu 48
5.2.3 Kết quả thực nghiệm đánh giá ở mức văn bản theo từng Features 49
5.2.4 Kết luận chung về kết quả đánh giá 53
5.3 Phân tích lỗi 54
5.3.1 Lỗi do gán nhãn từ loại (POS tag) 54
5.3.2 Lỗi do luật 56
5.3.3 Lỗi do tách câu 57
Chương 6 Tổng kết và hướng phát triển 59
Tài liệu tham khảo 60
Phụ lục A. Annotation Guideline. 63
Phụ lục B. Bảng nhãn từ loại tiếng Việt 64
Danh sách hình vẽ
Hình 1 - Giao diện của GATE 16
Hình 2 - Mô hình kiến trúc của GATE 17
Hình 3 - Giao diện thêm một thành phần tích hợp vào GATE. 20
Hình 4 - Chọn các thành phần cho ứng dụng GATE 21
Hình 5 - Giao diện của Annotation Diff 27
Hình 6 - Giao diện của Corpus Benchmark tool 28
Hình 7 - Minh họa giao diện hệ thống 31
Hình 8 - Những reviews do người dùng đánh giá ở trang tinvadung.vn 33
Hình 9 - Gán nhãn dữ liệu 34
Hình 10 - Mô tả chi tiết hệ thống đánh giá quan điểm người dùng trên GATE 36
Hình 11 - GATE sau khi POS Tag và Lookup 40
Hình 12 - Lỗi do POS Tag ảnh hưởng đến nhận dạng từ 55
Hình 13 - Lỗi do POS tag ảnh hưởng đến tách câu 56
Hình 14 - Lỗi do viết luật ảnh hưởng đến nhận dạng từ 57
Hình 15 – Lỗi do tách câu 58
Những tài liệu gần giống với tài liệu bạn đang xem
📎 Số trang: 94
👁 Lượt xem: 513
⬇ Lượt tải: 16
📎 Số trang: 94
👁 Lượt xem: 349
⬇ Lượt tải: 16
📎 Số trang: 123
👁 Lượt xem: 494
⬇ Lượt tải: 16
📎 Số trang: 123
👁 Lượt xem: 594
⬇ Lượt tải: 17
📎 Số trang: 268
👁 Lượt xem: 505
⬇ Lượt tải: 18
📎 Số trang: 49
👁 Lượt xem: 515
⬇ Lượt tải: 18
📎 Số trang: 7
👁 Lượt xem: 329
⬇ Lượt tải: 19
Những tài liệu bạn đã xem