Mã tài liệu: 260106
Số trang: 71
Định dạng: pdf
Dung lượng file: 1,672 Kb
Chuyên mục: Tổng hợp
Mục lục
MỞ ĐẦU 1
1 Xếp hạng đối tượng 2
1.1 Giới thiệu 2
1.2 Phương pháp PageRank 3
1.3 Xếp hạng đối tượng 5
1.4 Phương pháp đánh giá xếp hạng 6
1.5 Tổng kết 8
2 Học xếp hạng 9
2.1 Giới thiệu 9
2.2 Phương pháp học xếp hạng . 11
2.2.1 Hồi quy có thứ tự và Pairwise 11
2.2.2 Học xếp hạng danh sách Listwise 13
2.3 Tổng kết chương . 15
3 Xếp hạng trong máy tìm kiếm thực thể 16
3.1 Máy tìm kiếm thực thể 17
MỤC LỤC
3.2 Xếp hạng thực thể 21
3.2.1 Mô hình Impression 22
3.2.2 Nhận xét, đánh giá mô hình Impression .27
3.2.3 Mô hình đề xuất .29
3.3 Thực nghiệm .32
3.3.1 Công cụ sử dụng .32
3.3.2 Dữ liệu .33
3.3.3 Kết quả và đánh giá .34
3.4 Tổng kết chương .36
4 Tạo nhãn cụm tài liệu 37
4.1 Giới thiệu .37
4.2 Phương pháp lựa chọn nhãn .39
4.3 Học xếp hạng nhãn cụm .42
4.3.1 Các đặc trưng .42
4.3.2 Học hàm tính hạng 44
4.4 Thực nghiệm .45
4.4.1 Nguồn dữ liệu .45
4.4.2 Dữ liệu học 46
4.4.3 Kết quả và đánh giá . 47
4.5 Tổng kết chương .48
Kết luận 49
Tài liệu tham khảo 51
A Dữ liệu 59
MỤC LỤC_vi
A.1 Dữ liệu tìm kiếm thuốc 59
A.2 Cây wiki 60
Danh sách hình vẽ 62
Danh sách bảng
63
MỞ ĐẦU
Xếp hạng các đối tượng (trang Web, tác giả, chủ đề, trường đại học, công ty .) có ý nghĩa quan trọng trong lĩnh vực khai phá dữ liệu, là trung tâm của nhiều ứng dụng - điển hình là máy tìm kiếm. Các phương pháp tính hạng được nghiên cứu và phát triển từ rất nhiều năm trước, nhưng khoảng 3 năm trở lại đây, hướng tiếp cận sử dụng phương pháp học máy để xếp hạng đối tượng trở thành một vấn đề thu hút được rất nhiều sự quan tâm như trong SIGIR 2007 và SIGIR 2008 đã tổ chức hội thảo chuyên đề về học xếp hạng (learning to rank: LTR) .
Học xếp hạng đang được nhiều nhà khoa học trên thế giới quan tâm nghiên cứu và ứng dụng, như cải tiến hàm tính hạng trong máy tìm kiếm của nhóm Yuehua Xu tại ICML năm 2007 , mô hình tính hạng thực thể trong máy tìm kiếm thực thể của nhóm các tác giả Tao Cheng, Kevin Chang trong [17, 18, 19], và sử dụng học xếp hạng để đánh giá trọng số của các cụm từ [65, 53].
Luận văn Học xếp hạng trong tính hạng đối tượng và tạo nhãn cụm tài liệu thực hiện khảo sát, phân tích các phương pháp học xếp hạng đang được quan tâm hiện nay và từ đó đưa ra mô hình xếp hạng thực thể áp dụng vào máy tìm kiếm thực thể trong tiếng Việt, cụ thể là tìm kiếm thực thể thuốc và học xếp hạng để tạo nhãn cho cụm tài liệu. Qua đó cho thấy ứng dụng to lớn và ý nghĩa quan trọng của bài toán học xếp hạng.
Luận văn này gồm bốn chương, nội dung được mô tả như dưới đây.
Chương 1. Tổng quan về xếp hạng đối tượng giới thiệu những nội dung cơ bản nhất về bài toán xếp hạng và đặt vấn đề học xếp hạng đối tượng.
MỞ ĐẦU
Chương 2. Học xếp hạng đối tượng trình bày hai phương pháp học xếp hạng cơ bản. Đồng thời, chương này cũng giới thiệu thuật toán học được sử dụng nhiều trong học xếp hạng là máy véc-tơ hỗ trợ (SVM) và hồi quy tuyến tính.
Chương 3. Học xếp hạng trong máy tìm kiếm thực thể đưa ra mô hình học xếp hạng đối tượng và thực nghiệm tính hạng thực thể thuốc trong máy tìm kiếm thực thể.
Chương 4. Gán nhãn cụm tài liệu phân tích, áp dụng và báo cáo kết quả thực nghiệm học xếp hạng từ/cụm từ để tạo nhãn cho các cụm tài liệu.
Phần kết luận tổng kết và tóm lược nội dung chính của luận văn.
Những tài liệu gần giống với tài liệu bạn đang xem
📎 Số trang: 91
👁 Lượt xem: 421
⬇ Lượt tải: 21
📎 Số trang: 126
👁 Lượt xem: 422
⬇ Lượt tải: 16
📎 Số trang: 126
👁 Lượt xem: 429
⬇ Lượt tải: 16
📎 Số trang: 73
👁 Lượt xem: 256
⬇ Lượt tải: 16
📎 Số trang: 86
👁 Lượt xem: 392
⬇ Lượt tải: 16
📎 Số trang: 131
👁 Lượt xem: 433
⬇ Lượt tải: 16
📎 Số trang: 126
👁 Lượt xem: 36
⬇ Lượt tải: 16
📎 Số trang: 126
👁 Lượt xem: 581
⬇ Lượt tải: 17
📎 Số trang: 102
👁 Lượt xem: 397
⬇ Lượt tải: 16
📎 Số trang: 102
👁 Lượt xem: 451
⬇ Lượt tải: 16
📎 Số trang: 102
👁 Lượt xem: 279
⬇ Lượt tải: 16
📎 Số trang: 94
👁 Lượt xem: 367
⬇ Lượt tải: 17
Những tài liệu bạn đã xem
📎 Số trang: 71
👁 Lượt xem: 458
⬇ Lượt tải: 16