Mã tài liệu: 260112
Số trang: 69
Định dạng: pdf
Dung lượng file: 815 Kb
Chuyên mục: Tổng hợp
MỤC LỤC
DANH MỤC HÌNH VẼ . .4
DANH MỤC BẢNG BIỂU . .5
MỞ ĐẦU . 6
CHƯƠNG 1 - TỔNG QUAN VỀ SEMANTIC WEB . 9
1.1. Giới thiệu . .9
1.2. Khái niệm Semantic Web . .11
1.3. Các ứng dụng của Sematic Web . 12
1.4. Các công nghệ cần thiết cho Semantic Web . 14
1.4.1. XML và Semantic Web . 15
1.4.2. Ontology . .20
1.5. Các ngôn ngữ Ontology cho Semantic Web . 23
1.5.1. Các ngôn ngữ . .23
1.5.2. Đặc điểm chung của các ngôn ngữ . .25
1.6. Kết luận chương 1 . .28
CHƯƠNG 2 - QUAN HỆ NGUYÊN NHÂN-KẾT QUẢ VÀ THUẬT TOÁN PHÁT HIỆN
QUAN HỆ NGUYÊN NHÂN-KẾT QUẢ . .30
2.1. Giới thiệu . .30
2.2. Khái niệm về các mối quan hệ ngữ nghĩa trong ngôn ngữ tự nhiên . 30
2.3. Quan hệ nguyên nhân-kết quả . 32
2.4. Cấu trúc nguyên nhân-kết quả trong ngôn ngữ của con người . .34
2.4.1. Cấu trúc nguyên nhân-kết quả tường minh . .35
2.4.1.1. Từ nối chỉ nguyên nhân . .35
2.4.1.2. Động từ chỉ nguyên nhân . 36
2.4.1.3. Câu phức với một cặp từ chỉ nguyên nhân . 39
2.4.2. Cấu trúc nguyên nhân không tường minh . 39
2.5. Thuật toán khai phá dữ liệu phát hiện quan hệ nguyên nhân-kết quả từ các văn bản41
2.5.1. Giới thiệu . .41
2.5.2. Thuật toán phát hiện quan hệ nguyên nhân-kết quả . .43
Vũ Bội Hằng-Luận văn cao học-Trường Đại học Công nghệ-2005
3
Phát hiện quan hệ ngữ nghĩa Nguyên nhân-Kết quả từ các văn bản.
2.6. Kết luận chương 2 . .47
CHƯƠNG 3 - KẾT QUẢ THỬ NGHIỆM THUẬT TOÁN . .48
3.1. Giới thiệu . .48
3.2. Định dạng file dữ liệu . .49
3.3. Chương trình thử nghiệm . .52
3.4. Kết quả thực nghiệm . 53
3.5. Nhận xét . .57
3.6. Kết luận chương 3 . .58
KẾT LUẬN . .59
TÀI LIỆU THAM KHÁO . .60
PHỤ LỤC: Kết quả thực nghiệm với các cặp danh từ có tần suất xuất hiện lớn hơn 4 lần. 63
MỞ ĐẦU
World Wide Web là một kho thông tin khổng lồ với những tiềm năng
không giới hạn. Có rất nhiều tiềm năng của World Wide Web mà cho đến nay
vẫn chưa được khai thác một cách hiệu quả. Các văn bản Web được làm ra với
mục đích ban đầu là dành cho con người đọc. Nhưng với số lượng khổng lồ
của các trang Web trên Internet, một người có dành cả đời mình cũng sẽ
không bao giờ đọc hết tất cả những trang Web này để thu được đầy đủ các tri
thức cần thiết. Nhận thức được vấn đề này, có rất nhiều hướng nghiên cứu đã
hình thành, thu hút nhiều nhóm nhà khoa học trên thế giới, nhằm mục đích sử
dụng máy tính để hỗ trợ con người trong việc thu thập thông tin và tổng hợp
tri thức từ các trang Web trên Internet. Ví dụ như việc áp dụng các kỹ thuật
Data Mining để khai thác thông tin từ các văn bản Web, công nghệ Agent
trong kinh doanh trực tuyến Tuy nhiên trong thời gian vừa qua, những
hướng nghiên cứu này chủ yếu mới chỉ tập trung vào việc khai thác thông tin
dựa trên các từ vựng đơn lẻ hoặc dựa trên một số cấu trúc cố định của trang
Web. Thật là khó khăn để máy tính có thể truy cập và tổng hợp các thông tin
trong các văn bản về phương diện ngữ nghĩa. Gần đây, một số hướng nghiên
cứu mới đã được mở ra nhằm mục đích khai thác khả năng kết hợp nội dung
trang Web với các thông tin ngữ nghĩa, để tạo ra Semantic Web. Semantic
Web không phải là một loại Web mới tách biệt mà là sự nâng cấp của Web
hiện tại (thế hệ Web thứ ba), ở đó các thông tin ngữ nghĩa được xác định tốt
hơn và được kết hợp vào cùng với trang Web. Như vậy, việc đọc và hiểu các
trang Web không chỉ thi hành được bởi con người mà còn có thể được thi
hành bởi máy tính.
Semantic Web ra đời đòi hỏi một loạt các công nghệ kèm theo nó. Một
trong số những công nghệ quan trọng nhất đối với Semantic Web là Ontology.
Thành phần cơ bản của Ontology là một tập hợp các đối tượng (hay còn gọi là
các khái niệm) với các thuộc tính của các đối tượng và tập hợp các mối quan
hệ giữa các đối tượng đó. Việc xây dựng Ontology trong một miền ứng dụng
là quá trình tổng hợp tri thức trong miền ứng dụng đó. Công việc này đòi hỏi
những người xây dựng ontology phải có những hiểu biết và tri thức nhất định
để tìm ra đầy đủ đối tượng, thuộc tính và quan hệ.
Xuất phát từ nhu cầu nghiên cứu các phương pháp hỗ trợ trong việc xây
dựng các Ontology cho Semantic Web, luận văn trình bày một phương pháp
phát hiện mối quan hệ ngữ nghĩa nguyên nhân-kết quả dựa trên ý tưởng
nghiên cứu của bài toán Semantic Role (CoNLL Share Task 2004 ) và
thuật toán khai phá quan hệ nguyên nhân-kết quả mà Corina Roxana Girju đã
tiến hành (Luận án Tiến sỹ 2002 ). Kết quả tìm được của thuật toán chính
là những thông tin cần thiết hỗ trợ trong việc phát hiện các đối tượng mới và
mối quan hệ về mặt ngữ nghĩa nguyên nhân-kết quả của các đối tượng này
trong quá trình xây dựng Ontology.
Ngoài phần giới thiệu, kết luận và các phụ lục. Luận văn được chia thành
3 chương chính:
Chương 1 - Tổng quan về Semantic Web. Giới thiệu một cách tổng
quan những nhu cầu dẫn đến sự ra đời của thế hệ Web thứ ba (Semantic Web).
Những khái niệm cơ bản và những công nghệ thiết yếu để phát triển Semantic
Web cũng được trình bày trong chương này.
Chương 2 - Quan hệ nguyên nhân-kết quả và thuật toán phát hiện
quan hệ nguyên nhân-kết quả. Chương này đi sâu vào phân tích cấu trúc
quan hệ ngữ nghĩa nguyên nhân-kết quả trong ngôn ngữ của con người và cấu
trúc thể hiện của nó trong văn bản. Thông qua đó luận văn trình bày một thuật
toán nhằm phát hiện quan hệ nguyên nhân-kết quả từ tập các văn bản dựa vào
tần suất xuất hiện của các cặp danh từ trong những câu chứa động từ chỉ
nguyên nhân.
Chương 3 - Kết quả cài đặt thử nghiệm thuật toán. Chương này trình
bày các kết quả thực nghiệm về thuật toán phát hiện quan hệ nguyên nhân -
kết từ các văn bản. Chương trình cài đặt thử nghiệm cho thuật toán được viết
trên ngôn ngữ Java. Thông qua các nhận xét về giá trị các độ đo đánh giá, kết
quả thực hiện chương trình là khả quan.
Phần Kết luận trình bày tổng hợp các kết quả thực hiện luận văn và
phương hướng nghiên cứu tiếp theo về các nội dung của luận văn.
Mặc dù đã có một môi trường làm việc tương đối đầy đủ và thuận tiện,
nhưng luận văn chắc hẳn sẽ không tránh khỏi có nhiều sai sót. Rất mong được
sự đóng góp ý kiến, nhận xét để tôi có thể hoàn thiện được kết quả làm việc
của mình
Những tài liệu gần giống với tài liệu bạn đang xem
📎 Số trang: 14
👁 Lượt xem: 401
⬇ Lượt tải: 18
📎 Số trang: 15
👁 Lượt xem: 312
⬇ Lượt tải: 17
📎 Số trang: 15
👁 Lượt xem: 324
⬇ Lượt tải: 17
📎 Số trang: 12
👁 Lượt xem: 239
⬇ Lượt tải: 17
📎 Số trang: 7
👁 Lượt xem: 329
⬇ Lượt tải: 16
📎 Số trang: 15
👁 Lượt xem: 317
⬇ Lượt tải: 17
📎 Số trang: 50
👁 Lượt xem: 285
⬇ Lượt tải: 16
📎 Số trang: 100
👁 Lượt xem: 535
⬇ Lượt tải: 16
📎 Số trang: 8
👁 Lượt xem: 455
⬇ Lượt tải: 19
📎 Số trang: 60
👁 Lượt xem: 411
⬇ Lượt tải: 16
📎 Số trang: 9
👁 Lượt xem: 323
⬇ Lượt tải: 17
📎 Số trang: 198
👁 Lượt xem: 652
⬇ Lượt tải: 16
Những tài liệu bạn đã xem
📎 Số trang: 69
👁 Lượt xem: 436
⬇ Lượt tải: 16