Mã tài liệu: 260127
Số trang: 119
Định dạng: pdf
Dung lượng file: 2,188 Kb
Chuyên mục: Kỹ thuật - Công nghệ
Nội dung
MỞ ĐẦU . 5
1 PH ẦN I: . 6
TÌM HIỂU VÀ SO SÁNH MỘT SỐ S.E THÔNG DỤNG HIỆN NAY . 6
1.1 MỘT SỐ S. E NƯỚC NGOÀI THÔNG DỤNG HIỆN NAY (xem
Bảng Tổng hợp chi tiết trong Phụ lục 1, 2,3) 6
1.1.1 GOOGLE 6
1.1.2 LYCOS . 9
1.1.3 ALTA VISTA . 10
1.2 MỘT SỐ S. E TIẾNG VIỆT THÔNG DỤNG HIỆN NAY (xem
Bảng tổng hợp chi tiết trong Phụ lục 4). . 12
1.2.1 NETNAM . 12
1.2.2 VINASEEK 16
1.3 NHẬN XÉT – SO SÁNH VỀ MỘT SỐ S.E. 17
1.3.1 SO SÁNH. 17
1.3.2 NHẬN XÉT. . 19
2 PHẦN 2: 23
XÂY DỰNG TỪ ĐIỂN NGỮ NGHĨA THUẬT NGỮ TIN HỌC . 23
2.1 TÌM KIẾM THEO NGỮ NGHĨA 23
2.2 BIỂU DIỄN NGỮ NGHĨA 24
2.2.1 ĐỒNG HIỆN (CO-OCCURRENCE) . 24
2.2.2 HỆ THỐNG QUAN HỆ ĐỒNG NGHĨA ĐƠN GIẢN 25
2.3 ONTOLOGY 42
2.3.1 XÂY DỰNG ONTOLOGY 42
2.3.2 TRAO ĐỔI ONTOLOGY 44
2.3.3 XÂY DỰNG ONTOLOGY TỪ VĂN BẢN 45
2.3.4 XÂY DỰNG ONTOLOGY CHUYÊN NGÀNH TIN HỌC .
2.3.5 BIỂU DIỄN ONTOLOGY TRONG CƠ SỞ DỮ LIỆU . 55
2.4 BIỂU DIỄN CẤU TRÚC PHÂN CẤP CỦA ONTOLOGY TRONG
CƠ SỞ DỮ LIỆU QUAN HỆ . 62
2.4.1 CÁC NHƯỢC ĐIỂM CỦA CÁCH BIỂU DIỄN BẰNG CON
TRỎ. 62
2.4.2 BIỂU DIỄN CẤU TRÚC CÂY TRONG ORACLE 63
2.4.3 NHẬN XÉT . 71
2.5. KẾT LUẬN . 72
3 PHẦN III: 73
THIẾT KẾ HỆ THỐNG S.E VÀ KẾT QUẢ THỬ NGHIỆM 73
3.1 THIẾT KẾ HỆ THỐNG . 73
3.1.1 Đặt tả Hệ thống: 73
3.1.2 Thiết kế các Chức năng của Hệ thống. . 73
3.1.3 Thuật giải nhận dạng bảng mã 83
3.2 CÀI ĐẶT HỆ THỐNG. . 86
3.2.1 Tổ chức Các Giao diệnModule WebRobot. . 86
3.3 Kết quả thử nghiệm. . 95
4. KẾT LUẬN .100
PH Ụ L ỤC 101
PHỤ LỤC 1. BẢNG TÓM TẮT ĐẶC TRƯNG CỦA MỘT SỐ S.E NƯỚC
NGOÀI 101
PHỤ LỤC 2. BẢNG TÓM TẮT ĐẶC TRƯNG MỘT SỐ META-S E NƯỚC
NGOÀI 103
PHỤ LỤC 3. BẢNG TÓM TẮT MỘT SỐ HỆ THỐNG DANH MỤC
(SUBJECT DIRECTORIES) 104
PHỤ LỤC 4. BẢNG TÓM TẮT ĐẶC TRƯNG CỦA MỘT SỐ S.E
TRONG NƯỚC. . 105
PHỤ LỤC 5. QUAN HỆ GIỮA ĐỘ CHÍNH XÁC & ĐỘ GỌI LẠI . 106
PHỤ LỤC 6. THỐNG KÊ VỀ PHÂN HẠNG CỦA CÁC DOMAIN 107
PHỤ LỤC 7. SƠ ĐỒ QUAN HỆ S.E .
PHỤ LỤC 8: CÁC MÃ NGỮ NGHĨA CỦA LDOCE 111
PHỤ LỤC 9. TỔNG QUAN VỀ CÔNG NGHỆ ORACLE TEXT ĐỂ PHÁT
TRIỂN S.E. . 112
PHỤ LỤC 10. SƠ LƯỢC VỀ THƯ VIỆN VNCONVERT: 116
TÀI LIỆU THAM KHẢO. . 118
CÁC TRANG WEB . 119
MỞ ĐẦU
Hiện nay, InterNET đã trở thành một Siêu Xa lộ Thông tin, cung cấp
thông tin cho mọi người, ở mọi nơi, trong mọi ngành, mọi lãnh vực. Hiện nay
trên thế giới có rất nhiều SEARCH ENGINE chẳng hạn như GOOGLE (xem
, , ), YAHOO, ALLTHEWEB, ALTA VISTA (xem ), có khả
năng tìm kiếm trên nhiều ngôn ngữ khác nhau, nhưng với Tiếng VIÊT vẫn có
hạn chế. Và trong nước cũng có vài SEARCH ENGINE chẳng hạn như
NETNAM (xem ), VINASEEK (xem ), ]), Mặc dù đã có rất nhiều
SEARCH ENGINE, nhưng vẫn rất cần thiết có một sự nghiên cứu đầy đủ để
phát triển một Hệ thống SEARCH ENGINE trên tiếng VIỆT có chú ý đến từ
khóa là TỪ GHÉP và NGỮ NGHĨA trong lãnh vực Công nghệ thông tin
(CNTT). Trên cơ sở này, có thể phát triển một Hệ thống SEARCH ENGINE
tiếng VIỆT tổng quát cho mọi lãnh vực.
Thời gian thực hiện Đề tài là 18 tháng từ tháng 01/2003 đến 07/2004.
Bản báo cáo này nhằm trình bày một số kết quả bước đầu:
PHẦN I. Thu thập và nghiên cứu tính năng của một số SEARCH ENGINE
thông dụng. So sánh và đánh giá các SEARCH ENGINE (S.E) này.
PHẦN II. Xây dựng Từ điễn ngữ nghĩa Thuật ngữ Tin học.
PH ẦN III. Thiết kế Hệ thống & kết quả thử nghiệ
Những tài liệu gần giống với tài liệu bạn đang xem
📎 Số trang: 116
👁 Lượt xem: 529
⬇ Lượt tải: 16
📎 Số trang: 187
👁 Lượt xem: 466
⬇ Lượt tải: 16
📎 Số trang: 187
👁 Lượt xem: 429
⬇ Lượt tải: 16
📎 Số trang: 187
👁 Lượt xem: 328
⬇ Lượt tải: 16
📎 Số trang: 78
👁 Lượt xem: 511
⬇ Lượt tải: 16
📎 Số trang: 133
👁 Lượt xem: 512
⬇ Lượt tải: 16
📎 Số trang: 133
👁 Lượt xem: 405
⬇ Lượt tải: 16
📎 Số trang: 133
👁 Lượt xem: 339
⬇ Lượt tải: 16
📎 Số trang: 12
👁 Lượt xem: 735
⬇ Lượt tải: 22
📎 Số trang: 59
👁 Lượt xem: 580
⬇ Lượt tải: 16
📎 Số trang: 118
👁 Lượt xem: 531
⬇ Lượt tải: 16
📎 Số trang: 118
👁 Lượt xem: 424
⬇ Lượt tải: 16
Những tài liệu bạn đã xem
📎 Số trang: 119
👁 Lượt xem: 638
⬇ Lượt tải: 16