Tìm tài liệu

Phan lop phan cap taxonomy van ban web va ung dung

Phân lớp phân cấp taxonomy văn bản web và ứng dụng

Upload bởi: anhphtvn

Mã tài liệu: 243886

Số trang: 61

Định dạng: pdf

Dung lượng file: 654 Kb

Chuyên mục: Tổng hợp

Info

Tóm tắt nội dung

Phân lớp Văn bản là quá trình gán Văn bản một cách tự động vào một hoặc nhiều

lớp cho trước. Tuy nhiên, trong trường hợp có số lượng khá lớn các lớp, bài toán sẽ

phức tạp hơn rất nhiều, do đó, khi tiến hành phân lớp thường cho kết quả có độ chính

xác không cao. Vì vậy, một vấn đề được đặt ra là cần phân lớp các Văn bản sử dụng

cấu trúc phân cấp. Hiện nay, bài toán này đã và đang trở thành lĩnh vực nhận được

nhiều sự quan tâm, nghiên cứu của nhiều nhà khoa học trên thế giới. Khoá luận tốt

nghiệp với đề tài "Phân lớp phân cấp Taxonomy Văn bản Web và ứng dụng" nghiên

cứu nội dung, các thuộc tính, các thuật toán giải quyết bài toán phân lớp phân cấp.

Khóa luận đã tiến hành thực nghiệm trên 12 lớp dữ liệu, sử dụng thuật toán máy vector

hỗ trợ, kết quả thu được rất tốt với độ đo F1 trung bình lên tới gần 90%.

Lời mở đầu

Trích chọn thông tin trên Web đã và đang tạo thêm nhiều tài nguyên thông tin,

tri thức mới đáp ứng ngày càng hiệu quả nhu cầu thông tin của con người. Ngày nay,

công nghệ trích chọn thông tin trên Web đã hình thành loại hình dịch vụ đầy triển

vọng trong việc cung cấp thông tin phong phú và hữu ích từ nguồn dữ liệu được coi là

vô hạn trên Web. Một trong những bài toán cơ bản và quan trọng trong trích chọn

thông tin trên Web là bài toán phát hiện các Quan hệ của các lớp đối tượng trên Web

Quan hệ phân cấp giữa chúng là một loại quan hệ điển hình. Để thực hiện việc phát

hiện mối Quan hệ phân cấp giữa các lớp đối tượng trên Web thì bài toán đầu tiên cần

giải quyết đó là bài toán phân lớp tự động các đối tượng. Tự động phân lớp Văn bản

một nhiệm vụ rất quan trọng có thể giúp ích trong việc tổ chức cũng như tìm kiếm

thông tin trên nguồn tài nguyên lớn này. Phân lớp Văn bản là quá trình gán Văn bản

một cách tự động vào một hoặc nhiều lớp cho trước.

Trong các nghiên cứu phân lớp văn bản, hầu hết đều tập trung vào bài toán phân

lớp mà các lớp cho trước được xem là tách biệt nhau và không có cấu trúc xác định

mối Quan hệ giữa chúng. Những bài toán phân lớp như vậy được gọi là bài toán phân

lớp phẳng (flat classification). Tuy nhiên, trong trường hợp có số lượng khá lớn các

lớp, bài toán sẽ phức tạp hơn rất nhiều và khi thực hiện các giải pháp phân lớp thường

cho kết quả không chính xác. Vì vậy, một vấn đề được đặt ra là cần phân lớp các văn

bản sử dụng cấu trúc phân cấp. Thực hiện công việc này mặc nhiên cũng đã bao hàm

vấn đề phát hiện Quan hệ phân cấp giữa các lớp đối tượng như đã nói ở trên. Về bản

chất đây cũng được coi là một loại Quan hệ ngữ nghĩa giữa các đối tượng và lớp đối

tượng. Bài toán cần được giải quyết là phát hiện các lớp và Kiến trúc các lớp đã được

phát hiện vào một cây phân cấp. Đây là bài toán phân lớp phân cấp. Phân lớp phân cấp

cho phép định hướng vào bài toán phân lớp lớn ban đầu và sử dụng phương pháp chia

nhỏ và đệ quy.

Khoá luận tốt nghiệp với đề tài "Phân lớp phân cấp Taxonomy Văn bản Web

và ứng dụng" nghiên cứu nội dung, các thuộc tính, các thuật toán giải quyết bài toán

phân lớp phân cấp và cố gắng đưa ra một số nhận xét, đề xuất thích hợp và thi hành

chương trình thực nghiệm để kiểm chứng tính khả thi của phương pháp.

Phân lớp phân cấp Taxonomy Văn bản Web và ứng dụng

Khóa luận được tổ chức thành ba chương mà nội dung chính của các chương

được giới thiệu như dưới đây.

Chương 1. Tổng quan về Taxonomy và phân lớp Văn bản trình bày những nét cơ

bản nhất về taxonomy, các khái niệm và nội dung cơ bản về bài toán phân lớp văn bản.

Chương này cũng trình bày một số thuật toán phân lớp Văn bản điển hình, đặc biệt tập

trung vào thuật toán SVM - thuật toán hiện nay được đánh giá là bộ phân lớp nhanh và

hiệu quả nhất với bài toán phân lớp văn bản.

Chương 2. Phân lớp phân cấp Taxonomy Văn bản Web nghiên cứu các phương

pháp giải quyết bài toán phân lớp phân cấp và cách Xây dựng các bộ phân lớp cho cây

phân cấp văn bản. Chương này cũng giới thiệu một số phương pháp đánh giá cho bài

toán phân lớp phẳng và độ đo dựa vào khoảng cách và độ tương tự giữa các lớp.

Chương 3. Thực nghiệm trình bày các kết quả thực nghiệm thu được khi áp

dụng thuật toán SVM và phương pháp phân lớp phân cấp theo hướng top-down. Một

số nhận xét, đánh giá kết luận cũng được trình bày.

Phần kết luận tổng kết các kết quả của khóa luận và trình bày định hướng phát

triển nội dung của khóa luận. Bài toán phân lớp phân cấp Văn bản Web thực sự có ý

nghĩa về nghiên cứu và triển khai.

MỤC LỤC

Chương I. TỔNG QUAN VỀ TAXONOMY VÀ PHÂN LỚP PHÂN CẤP 5

1.1. Giới thiệu Taxonomy 5

1.2. Phân lớp văn bản . .6

1. 2.1. Một số khái niệm 7

1.3. Quá trình tiền xử lý dữ liệu 11

1.3.1.1. Phương pháp biểu diễn tài liệu .12

1.3.1.2. Quá trình lựa chọn thuộc tính . 14

1.4. Các thuật toán phân lớp Văn bản .19

1.4.1. Thuật toán K người láng giềng gần nhất .1 9

1.4.2. Thuật toán phân lớp AdaBoost 19

1.4.3. Thuật toán máy vector hỗ trợ 21

Chương II. PHÂN LỚP Văn bản WEB SỬ DỤNG CẤU TRÚC PHÂN CẤP

TAXONOMY .27

2.1. Hai phương pháp phân lớp phân cấp . 27

2.2. Phân lớp phân cấp Văn bản theo hướng top-down 28

2.2.1. Mô hình phân lớp 28

2.2.2. Xây dựng các bộ phân lớp nhị phân . 31

2.3. Đánh giá .32

2.3.1. Đánh giá cho bài toán phân lớp phẳng 32

2.3.2. Đánh giá dựa vào độ tương tự .34

Chương III. THỰC NGHIỆM .37

3.1. Dữ liệu và chương trình .37

3.2. Môi trường thực nghiệm .40

3.3. Kết quả và đánh giá 40

3.3.1. Thực nghiệm1 : Phân lớp phân cấp theo hướng top-down .40

3.3.2. Thực nghiệm 2 : Khảo sát sự phụ thuộc thời gian huấn luyện và kết quả

vào tập thuộc tính. .46

KẾT LUẬN. .52

Phần bên dưới chỉ hiển thị một số trang ngẫu nhiên trong tài liệu. Bạn tải về để xem được bản đầy đủ

  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng
  • Phân lớp phân cấp taxonomy văn bản web và ứng dụng

GỢI Ý

Những tài liệu gần giống với tài liệu bạn đang xem

Phân lớp bán giám sát và ứng dụng thuật toán ...

Upload: huongthachthao239

📎 Số trang: 47
👁 Lượt xem: 674
Lượt tải: 16

Nghiên cứu thuật toán phân lớp nhị phân và ...

Upload: ngoc_dixeraideur

📎 Số trang: 99
👁 Lượt xem: 500
Lượt tải: 16

Phương pháp phân cụm và ứng dụng

Upload: hoangchaulong

📎 Số trang: 100
👁 Lượt xem: 356
Lượt tải: 16

Phân lớp tài liệu web độc lập ngôn ngữ

Upload: haivn1987

📎 Số trang: 50
👁 Lượt xem: 288
Lượt tải: 16

Bảo mật Web với mã nguồn mở ACEGI và ứng ...

Upload: thuhuong_fueco

📎 Số trang: 140
👁 Lượt xem: 478
Lượt tải: 16

Xây Dựng Ứng Dụng Web Tin Tức Và Bán Hàng ...

Upload: anhlt888

📎 Số trang: 60
👁 Lượt xem: 419
Lượt tải: 16

Nguyên lí biến phân ekeland và một số ứng ...

Upload: legianghq

📎 Số trang: 42
👁 Lượt xem: 526
Lượt tải: 16

Dự đoán hiệu năng Web Services sử dụng phân ...

Upload: giangbvnt

📎 Số trang: 69
👁 Lượt xem: 18
Lượt tải: 7

Biến đổi Hough và ứng dụng phát hiện góc ...

Upload: tottochan108

📎 Số trang: 55
👁 Lượt xem: 705
Lượt tải: 16

Độ tương đồng ngữ nghĩa giữa hai câu và ứng ...

Upload: honghanh27905

📎 Số trang: 53
👁 Lượt xem: 460
Lượt tải: 16

Nghiên cứu tìm hiểu và xây dựng ứng dụng với ...

Upload: quoctritiengiang

📎 Số trang: 242
👁 Lượt xem: 727
Lượt tải: 16

Nghiên cứu tìm hiểu và xây dựng ứng dụng với ...

Upload: hoatcdn

📎 Số trang: 189
👁 Lượt xem: 24
Lượt tải: 13

QUAN TÂM

Những tài liệu bạn đã xem

Phân lớp phân cấp taxonomy văn bản web và ...

Upload: anhphtvn

📎 Số trang: 61
👁 Lượt xem: 372
Lượt tải: 16

Tổng hợp
Phân lớp phân cấp taxonomy văn bản web và ứng dụng Tóm tắt nội dung Phân lớp Văn bản là quá trình gán Văn bản một cách tự động vào một hoặc nhiều lớp cho trước. Tuy nhiên, trong trường hợp có số lượng khá lớn các lớp, bài toán sẽ phức tạp hơn rất nhiều, do đó, khi tiến hành phân lớp thường cho kết pdf Đăng bởi
5 stars - 243886 reviews
Thông tin tài liệu 61 trang Đăng bởi: anhphtvn - 18/10/2025 Ngôn ngữ: Việt nam, English
5 stars - "Tài liệu tốt" by , Written on 18/10/2025 Tôi thấy tài liệu này rất chất lượng, đã giúp ích cho tôi rất nhiều. Chia sẻ thông tin với tôi nếu bạn quan tâm đến tài liệu: Phân lớp phân cấp taxonomy văn bản web và ứng dụng