Tìm tài liệu

He thong tu van website cho may tim kiem dua tren khai pha query log

Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log

Upload bởi: hichucmungnammoi

Mã tài liệu: 299149

Số trang: 55

Định dạng: pdf

Dung lượng file: 1,878 Kb

Chuyên mục: Kỹ thuật - Công nghệ

Info

Tóm tắt nội dung

Hệ tư vấn (recommender system) đã trở thành một trong những lĩnh vực nghiên cứu quan trọng kể từ khi bài báo đầu tiên về lọc cộng tác (collaborative filtering) xuất hiện vào giữa những năm 1990. Hiện nay, sự quan tâm đối với hệ tư vấn đang rất cao vì sự cần thiết của những ứng dụng có thể giúp người dùng xử lý với tình trạng quá tải thông tin & đưa ra những nội dung hoặc lời khuyên phù hợp cho từng cá nhân. Mộtvài ứng dụng nổi tiếng như: hệ tư vấn sách, CDs của Amazon.com, hệ tư vấn phim của MovieLens… Nhưng so với sách, phim… thì số lượng website bùng nổ mỗi ngày còn lớn hơn rất nhiều. Khóa luận đề xuất phương pháp xây dựng một hệ thống tư vấn website dựa trên việc khai phá query logs của máy tìm kiếm. Các website được tư vấn là kết quả có được dựa trên phân tích những lựa chọn của hàng nghìn người dùngtrước đó. Thực nghiệm ban đầu của hệ thống cho kết quả khá tốt.

Mục lục

Tóm tắt nội dung i

Mục lục .... ii

Danh sách bảng iv

Danh sách hình vẽ .. v

Lời mở đầu ...1

Chương 1. Tổng quan về hệ tư vấn ....3

1.1. Giới thiệu về hệ tư vấn.3

1.2. Bài toán tư vấn...4

1.3. Phân loại hệ tư vấn .5

1.3.1. Phương pháp dựa trên nội dung 5

1.3.2. Phương pháp cộng tác7

1.3.3. Phương pháp lai ghép ...10

1.4. Sơ bộ về hệ tư vấn trong khóa luận ....12

Chương 2. Bài toán khai phá query log và ứng dụng...14

2.1. Cấu trúc query log 14

2.2. Khai phá query log ....16

2.2.1. Một số dạng thống kê ...16

2.2.2. Khai phá luật ..20

2.3. Ứng dụng của khai phá query log .22

Chương 3. Mô hình ...24

3.1. Các công trình liên quan 24

3.1.1. Phân cụm query ..24

3.1.2. Phân tích chủ đề ẩn ..27

3.2. Mô hình ..31

3.2.1. Mô hình tổng quan ...31

3.2.2. Phần xử lý ngoại tuyến .33

3.2.3. Phần xử lý online 34

Chương 4. Thực nghiệm và đánh giá ....36

4.1. Môi trường ..36

4.2. Dữ liệu và công cụ 36

4.3. Thực nghiệm ....38

4.3.1. Lọc nội dung query ..38

4.3.2. Xử lý offline...39

4.3.3. Xử lý online ...41

4.4. Đánh giá 42

Kết luận và định hướng .44

Tài liệu tham khảo ....45

Tiếng việt..45

Tiếng Anh .45

Lời mở đầu

Trong thời đại bùng nổ thông tin, khi người dùng thường bị ngập trong khối lượng thông tin khổng lồ thì hệ tư vấn ngày càng có vai trò quan trọng. Có khá nhiều hệ thống tư vấn nổi tiếng, nhưng hầu hết chỉ tập trung vào một số lĩnh vực hẹp như: sách, phim, ca nhạc…Các hệ thống đó thường dựa vào đánh giá của các chuyên gia (reviewer) với những bộ tiêu chuẩn cụ thể, hoặc dựa trên việc chấm điểm sản phẩm bởi người dùng. Nhưng các lĩnh vực trong cuộc sống rất phong phú, số lượng chủng loại sản phẩm rất lớn. Để có hệ tư vấn dựa trên chuyên gia hay những bộ tiêu chuẩn cụ thể như vậy trên mọi lĩnh vực, mọi sản phầm là điều không thể.

Khi cần tìm thông tin về một sản phẩm nào đó, giải pháp được hầu hết người dùng sử dụng là đưa câu hỏi vào máy tìm kiếm thay vì tìm đến những website/forum chuyên ngành. Tuy nhiên, máy tìm kiếm không phải lúc nào cũng hiệu quả. Máy tìm kiếm chỉ có thể đưa ra một danh sách các lựa chọn (có thể lên đến hàng triệu) chứ không thể nói được lựa chọn nào là tốt nhất.

Ví dụ, một du khách lần đầu đến Hà Nội, muốn tìm khách sạn bằng query: “hanoi hotel”, sẽ nhận được từ Google gần hai triệu kết quả trả về. Hầu hết mọi khách sạn trong danh sách kết quả đều xa lạ và tự quảng cáo mình là tốt nhất, làm cho du khách bối rối trong biển thông tin. Không thể có thời gian để tìm hiểu lại về từng khách sạn (dù chỉ là trong 10-20 kết quả đầu); người khách cần lời khuyên cho trường hợp này. Những nhu cầu như vậy có thể bắt gặp rất nhiều trong cuộc sống hàng ngày, ngay cả khi người ta tìm kiếm những sản phầm đơn giản như một chiếc đầu DVD, một hãng sơn, một công ty taxi …, mà vì không có thông tin nên với họ mọi thương hiệu đều như nhau. Cần có một phương pháp có thể đưa ra gợi ý, tư vấn cho người dùng đủ tốt để áp dụng cho những chủ đề rất đa dạng của cuộc sống.

Một giải pháp rất tốt và hiệu quả là gợi ý dựa trên chính kinh nghiệm của những người đã từng tìm về chủ đề này trước đó. Những thông tin được lưu lại trong log của máy tìm kiếm sẽ cho biết những người tìm về chủ đề đó thường hay truy cập vào website nào. Những website này đã qua hai lần ―lọc‖, một của máy tìm kiếm và một của người dùng (không phải ngẫu nhiên mà nhiều người dùng lại có cùng một lựa chọn). Đôi khi những kết quả này còn tốt hơn cả kết quả máy tìm kiếm trả lại. Ví dụ: những website tin tức lớn,được nhiều người tìm & truy cập nhất của Vietnam như: VnExpress, Vietnamnet, Dân Trí… đều không xuất hiện trong top 10 khi tìm “vietnamnews” trên cả Yahoo & Live Search (phiên bản mới của MSN).

Vì lí do đó, khóa luận đề xuất việc xây dựng một hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log. Bài toán khai phá query logs là bài toán phải xử lý khối lượng dữ liệu rất lớn (lên tới hàng gigabyte) nên việc chọn được một thuật toán tốt và hiệu quả về thời gian là rất khó khăn. Hệ thống này được phát triển từ đề tài nghiên cứu khoa học về hệ tư vấn website của nhóm chúng tôi (thuộc phòng thí nghiệm Sislab – đại học Công Nghệ). tập trung vào việc thống kê website và khai phá mẫu có thứ tự (tìm ra quy luật giữa từ khóa trong query và url được click) để đưa ra tư vấn. Khác với , hệ thống được đề xuất trong khóa luận tập trung vào việc xác định tập website có giá trị và xếp hạng lại chúng theo query người dùng đưa vào. Ý tưởng chính của hệ thống gồm ba bước:

Bước một: nhóm các query tương đồng vào các cụm. Mỗi cụm tương ứng với một chủ đề.

Bước hai: tìm ra tập những website (url) tốt, đại diện cho từng cụm. Tập websitenày gọi là tập website tư vấn.

Bước ba: khi người dùng đưa vào một query mới, query này sẽ được phân cụm. Hệ thống sẽ phân tích, và đưa ra các website trong tập website tư vấn thích hợp nhất với query đó.

Phần còn lại của khóa luận được chia thành bốn chương:

Chương 1. Tổng quan về hệ tư vấn: Trình bày những nội dung cơ bản về hệ tư vấn (các hệ thống nổi tiếng, mô tả bài toán tư vấn, phân loại các hệ tư vấn theo phương pháp xây dựng). Giới thiệu hệ tư vấn website được xây dựng trong khóa luận.

Chương 2. Khai phá query log và ứng dụng: Giới thiệu về cấu trúc query log của máy tìm kiếm, các thông tin có thể khai phá, phương pháp khai phá và các ứng dụng của việc khai phá query log.

Chương 3. Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log: Trình bày mô hình hệ thống tư vấn website do chúng tôi đưa ra và các công trình liên quan.

Chương 4. Thực nghiệm và đánh giá: Xây dựng, thử nghiệm và đánh giá hệthống với các query liên quan tới miền sản phẩm điện tử.

Phần kết luận tổng kết nội dung chính của khóa luận, các vấn đề còn tồn tại và định hướng phát triển của hệ thống.

Phần bên dưới chỉ hiển thị một số trang ngẫu nhiên trong tài liệu. Bạn tải về để xem được bản đầy đủ

  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log
  • Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log

GỢI Ý

Những tài liệu gần giống với tài liệu bạn đang xem

Xây dựng hệ thống tìm kiếm thông tin tiếng ...

Upload: tiendung0505

📎 Số trang: 116
👁 Lượt xem: 530
Lượt tải: 16

Xây dựng hệ thống tìm kiếm thông tin và gợi ...

Upload: nguyenthethienbcl

📎 Số trang: 70
👁 Lượt xem: 689
Lượt tải: 18

Tìm kiếm ảnh dựa trên nội dung

Upload: meoconmk2003

📎 Số trang: 89
👁 Lượt xem: 456
Lượt tải: 16

Nghiên cứu một số vấn đề về khai thác và tìm ...

Upload: binhminh3769

📎 Số trang: 70
👁 Lượt xem: 443
Lượt tải: 16

Xây dựng hệ thống cung cấp chứng chỉ số dựa ...

Upload: hovanten

📎 Số trang: 78
👁 Lượt xem: 413
Lượt tải: 16

Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ ...

Upload: business_hkm

📎 Số trang: 69
👁 Lượt xem: 413
Lượt tải: 16

Tìm Hiểu IDS Và Triển Khai Hệ Thống Phát ...

Upload: levu21262

📎 Số trang: 55
👁 Lượt xem: 995
Lượt tải: 20

Khai phá dữ liệu từ website việc làm

Upload: tuanthanhnguyen2000

📎 Số trang: 71
👁 Lượt xem: 515
Lượt tải: 16

Tìm hiểu xây dựng website trên mã nguồn mỡ ...

Upload: thanhlongfrv

📎 Số trang: 22
👁 Lượt xem: 583
Lượt tải: 16

Tìm hiểu xây dựng website trên mã nguồn mỡ ...

Upload: truongthuha0311

📎 Số trang: 22
👁 Lượt xem: 478
Lượt tải: 16

Tìm hiểu xây dựng website trên mã nguồn mỡ ...

Upload: basu_nvbh7

📎
👁 Lượt xem: 630
Lượt tải: 17

Kiến trúc hệ thống quản trị mạng dựa trên xml

Upload: hoangphat8899

📎 Số trang: 106
👁 Lượt xem: 421
Lượt tải: 16

QUAN TÂM

Những tài liệu bạn đã xem

Hệ thống tư vấn website cho máy tìm kiếm dựa ...

Upload: hichucmungnammoi

📎 Số trang: 55
👁 Lượt xem: 495
Lượt tải: 16

CHUYÊN MỤC

Kỹ thuật - Công nghệ
Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log Tóm tắt nội dung Hệ tư vấn (recommender system) đã trở thành một trong những lĩnh vực nghiên cứu quan trọng kể từ khi bài báo đầu tiên về lọc cộng tác (collaborative filtering) xuất hiện vào giữa những năm 1990. Hiện nay, sự quan tâm đối với hệ tư pdf Đăng bởi
5 stars - 299149 reviews
Thông tin tài liệu 55 trang Đăng bởi: hichucmungnammoi - 11/12/2025 Ngôn ngữ: Việt nam, English
5 stars - "Tài liệu tốt" by , Written on 11/12/2025 Tôi thấy tài liệu này rất chất lượng, đã giúp ích cho tôi rất nhiều. Chia sẻ thông tin với tôi nếu bạn quan tâm đến tài liệu: Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query log