Mã tài liệu: 258712
Số trang: 36
Định dạng: docx
Dung lượng file: 739 Kb
Chuyên mục: Kỹ thuật - Công nghệ
Nhận dạng chữ là một lĩnh vực đã được quan tâm nghiên cứu và ứng dụng từ nhiều năm nay theo hai hướng chính:
ã Nhận dạng chữ in: phục vụ cho công việc tự động hóa đọc tài liệu, tăng tốc độ và hiệu quả nhập thông tin vào máy tính trực tiếp từ các nguồn tài liệu.
ã Nhận dạng chữ viết tay: với những mức độ ràng buộc khác nhau về cách viết, kiểu chữ . phục vụ cho các ứng dụng đọc và xử lý chứng từ, hóa đơn, phiếu ghi, bản thảo viết tay . Nhận dạng chữ viết tay được tách thành hai hướng phát triển: nhận dạng chữ viết tay trực tuyến (on-line) và nhận dạng chữ viết tay ngoại tuyến (off-line).
Đến thời điểm này, bài toán nhận dạng chữ in đã được giải quyết gần như trọn vẹn (sản phẩm FineReader 9.0 của hãng ABBYY có thể nhận dạng chữ in theo 20 ngôn ngữ khác nhau, phần mềm nhận dạng chữ Việt in VnDOCR 4.0 của Viện Công nghệ Thông tin Hà Nội có thể nhận dạng được các tài liệu chứa hình ảnh, bảng và văn bản tiếng Việt với độ chính xác trên 98%, .). Tuy nhiên trên thế giới cũng như ở Việt Nam, bài toán nhận dạng chữ viết tay vẫn còn là vấn đề thách thức lớn đối với các nhà nghiên cứu. Bài toàn này chưa thể giải quyết trọn vẹn vì nó phụ thuộc quá nhiều vào người viết và sự biến đổi quá đa dạng trong cách viết và trạng thái tinh thần của từng người viết. Đặc biệt đối với việc nghiên cứu nhận dạng chữ viết tay tiếng Việt lại càng gặp nhiều khó khăn hơn do bộ ký tự tiếng Việt có thêm phần dấu, rất dễ nhầm lẫm với các nhiễu.
MỤC LỤC
DANH MỤC CÁC KÝ HIỆU, CỤM TỪ VIẾT TẮT 3
PHẦN MỞ ĐẦU 4
CHƯƠNG I. TỔNG QUAN VỀ CHỮ VIẾT VÀ LÝ THUYẾT NHẬN DẠNG 5
1.1. GIỚI THIỆU 6
1.2. MÔ HÌNH TỔNG QUÁT CỦA MỘT HỆ NHẬN DẠNG CHỮ VIẾT TAY 6
1.2.1. Tiền xử lý 6
1.2.1.1. Nhị phân hóa ảnh .7
1.2.1.2. Lọc nhiễu 7
1.2.1.3. Chuẩn hóa kích thước ảnh .7
1.2.1.4. Làm trơn biên chữ 8
1.2.1.5. Làm đầy chữ .8 1.2.1.6. Làm mảnh chữ 8
1.2.1.7. Điều chỉnh độ nghiêng của văn bản 8
1.2.2. Khối tách chữ 9
1.2.2.1. Tách chữ theo chiều nằm ngang và thẳng đứng 9
1.2.2.2. Tách chữ dùng lược đồ sáng 9
1.2.3. Trích chọn đặc trưng .10
1.2.3.1. Biến đổi toàn cục và khai triển chuỗi 10
1.2.3.2. Đặc trưng thống kê .11
1.2.3.3. Đặc trưng hình học và hình thái 11
1.2.4. Huấn luyện và nhận dạng .13
1.2.5. Hậu xử lý 13
CHƯƠNG II. CÁC PHƯƠNG PHÁP NHẬN DẠNG CHỮ VIẾT TAY 13
2.1. Đối sánh mẫu .13
2.2. Phương pháp tiếp cận cấu trúc 14
2.2.1. Phương pháp ngữ pháp (Grammatical Methods): .15
2.2.2. Phương pháp đồ thị (Graphical Methods): 15
2.3. Mạng nơ ron .15
2.4. Mô hình Markov ẩn (HMM - Hidden Markov Model) .16
2.5. Máy véc tơ tựa (SVM) 16 2.5.1. Giới thiệu . .16
2.5.2. Mô hình nhận dạng chữ viết tay rời rạc 17
2.5.2.1. Tiền xử lý 18
2.5.2.2. Trích chọn đặc trưng . .18
2.5.2.3. Lựa chọn thuật toán huấn luyện phân lớp .19
2.5.2.4. Thuật toán nhận dạng chữ viết tay rời rạc 19
2.5.3. Kết quả thực nghiệm 20
2.5.3.1. Chuẩn bị các bộ dữ liệu thực nghiệm .21
2.5.3.2. Kết quả thực nghiệm trên bộ dữ liêu MNIST 21
2.5.3.3. Kết quả thực nghiệm trên dữ liệu chữ viết tay tiếng Việt 22
2.5.4. Đánh giá hiệu quả phân lớp SVM 22
2.5.5. Kết luận 23
2.6. Kết hợp các kỹ thuật nhận dạng .24
2.6.1. Kiến trúc tuần tự .24
2.6.2. Kiến trúc song song 25
2.6.3. Kiến trúc lai ghép .25
2.7. Kết luận 25
CHƯƠNG III. ĐÁNH GIÁ,SO SÁNH CÁC PHƯƠNG PHÁP NHẬN DẠNG . 26
TÀI LIỆU THAM KHẢO . 2
Những tài liệu gần giống với tài liệu bạn đang xem
📎 Số trang: 53
👁 Lượt xem: 762
⬇ Lượt tải: 16
📎 Số trang: 63
👁 Lượt xem: 558
⬇ Lượt tải: 16
📎 Số trang: 105
👁 Lượt xem: 567
⬇ Lượt tải: 17
📎 Số trang: 56
👁 Lượt xem: 642
⬇ Lượt tải: 18
📎 Số trang: 56
👁 Lượt xem: 608
⬇ Lượt tải: 18
📎 Số trang: 26
👁 Lượt xem: 634
⬇ Lượt tải: 16
📎 Số trang: 28
👁 Lượt xem: 1091
⬇ Lượt tải: 17
📎 Số trang: 67
👁 Lượt xem: 610
⬇ Lượt tải: 17
Những tài liệu bạn đã xem
📎 Số trang: 36
👁 Lượt xem: 2398
⬇ Lượt tải: 23