Mã tài liệu: 79521
Số trang: 56
Định dạng: docx
Dung lượng file: 3,047 Kb
Chuyên mục: Công nghệ phần mềm
Trong những năm gần đây, trên cơ sở phát triển và ứng dụng công nghệ Internet, khối lượng dữ liệu trên máy tính đã tăng trưởng không ngừng theo cả phương diện tạo mới và thu thập thông tin. Việc mở rộng các dữ liệu khoa học về khoa học địa lý, địa chất, khí tượng do vệ tinh thu thập lại, việc giới thiệu quảng bá mã vạch đối với hầu hết các sản phẩm thương mại, việc tin học hoá sâu rộng các thương vụ và giao dịch, việc phát triển ứng dụng công nghệ thông tin trong quản lý hành chính nhà nước...đã phát sinh ra một khối lượng dữ liệu khổng lồ. Mặt khác, trong xã hội công nghệ thông tin hiện nay, nhu cầu nhận được thông tin một cách nhanh chóng, chính xác cũng như nhu cầu thu nhận được những tri thức hữu ích từ khối lượng thông tin khổng lồ nói trên đã trở nên cấp thiết. Nói một cách hình ảnh là chúng ta đang “ngập” trong dữ liệu nhưng lại “đói” tri thức. Bối cảnh đó đã đòi hỏi phải có những phương pháp tiếp cận mới, điển hình nhất là các phương pháp thuộc lĩnh vực khai phá dữ liệu. Sự tăng trưởng hàng năm về số lượng các công trình nghiên cứu được công bố, các hội thảo khoa học quốc tế liên quan đến việc giải quyết các bài toán điển hình thuộc lĩnh vực này đã thể hiện đầy đủ sự phát triển vượt bậc của KPDL. Các phương pháp KPDL đang ngày càng phát triển mạnh mẽ và thu hút nhiều sự quan tâm chú ý của các nhà nghiên cứu trong các ứng dụng thực tiễn của nó như : khai phá text và khai phá web, tin-sinh học, tài chính và thị trường chứng khoán...
Khai phá Text là một trong những ứng dụng điển hình của KPDL, hiện đang một lĩnh vực khá nổi bật và chủ yếu liên quan tới việc trích rút các khái niệm, các quan hệ và các tri thức tiềm ẩn từ các tài liệu văn bản. Trạng thái nghệ thuật của khai phá Text hiện nay dựa trên sự trình diễn các tài liệu văn bản đi cùng với các kỹ thuật khai phá dữ liệu thống kê. Hướng tiếp cận này bị hạn chế do ngôn ngữ tự nhiên có độ nhập nhằng rất cao. Luận văn này đi sâu nghiên cứu về mối quan hệ ngữ nghĩa nguyên nhân - kết quả trong ngôn ngữ tự nhiên và trình bày một thuật toán khai phá nhằm phát hiện các quan hệ này dựa trên tần suất xuất hiện của các cặp danh từ có quan hệ nhân quả với nhau...
Luận văn bao gồm phần mở đầu, ba chương nội dung và phần kết luận. Nội dung các chương được trình bày như sau :
Chương 1: Trong chương này trình bày một cách khái quát nhất về khai phá dữ liệu và khai phá Text, các bài toán chủ yếu, các phương pháp điển hình cũng như các ứng dụng trong thực tiễn.
Chương 2 : Nội dung chương hai giới thiệu sơ qua một số các quan hệ ngữ nghĩa trong cơ sở tri thức ngữ nghĩa từ vựng và cụ thể đi sâu vào nghiên cứu quan hệ ngữ nghĩa nguyên nhân-kết quả: nêu khái niệm, ý nghĩa và cấu trúc của các quan hệ này biểu diễn trong tiếng Anh. Trong phần này cũng đã trình bày một thuật toán nhằm phát hiện các cặp danh từ nguyên nhân và kết quả trong các mối quan hệ nguyên nhân kết quả tường minh dựa trên trọng số của động từ chỉ nguyên nhân và tần suất xuất hiện của các cặp danh từ trong các cấu trúc câu thể hiện quan hệ nguyên nhân - kết quả đó.
Chương 3: Trình bày về hệ thống thử nghiệm của thuật toán phát hiện quan hệ ngữ nghĩa nguyên nhân - kết quả được trình bày trong chương hai. Đưa ra một số kết quả ban đầu, những nhận xét, kết luận và một số hướng phát triển nghiên cứu trong tương lai.
Những tài liệu gần giống với tài liệu bạn đang xem
📎 Số trang: 39
👁 Lượt xem: 509
⬇ Lượt tải: 17
📎 Số trang: 78
👁 Lượt xem: 656
⬇ Lượt tải: 16
📎 Số trang: 74
👁 Lượt xem: 425
⬇ Lượt tải: 16
📎 Số trang: 145
👁 Lượt xem: 456
⬇ Lượt tải: 16
📎 Số trang: 4
👁 Lượt xem: 834
⬇ Lượt tải: 23
📎 Số trang: 31
👁 Lượt xem: 556
⬇ Lượt tải: 16
📎 Số trang: 75
👁 Lượt xem: 1226
⬇ Lượt tải: 20
📎 Số trang: 15
👁 Lượt xem: 573
⬇ Lượt tải: 16
📎 Số trang: 60
👁 Lượt xem: 431
⬇ Lượt tải: 18
📎 Số trang: 72
👁 Lượt xem: 483
⬇ Lượt tải: 16
📎 Số trang: 75
👁 Lượt xem: 982
⬇ Lượt tải: 16
📎 Số trang: 70
👁 Lượt xem: 530
⬇ Lượt tải: 17
Những tài liệu bạn đã xem