Mã tài liệu: 246396
Số trang: 5
Định dạng: pdf
Dung lượng file: 319 Kb
Chuyên mục: Kỹ thuật - Công nghệ
NGHIÊN CỨU, ỨNG DỤNG CÔNG NGHỆ SAPI.
XÂY DỰNG HỆ THỐNG STT, TTS TRONG NHẬN DẠNG
TIẾNG NÓI
RESEARCH, APPLY SAPI TECHNOLOGY.
BUILDING STT, TTS SYSTEM IN SPEECH RECOGNITION.
SVTH: LÊ QUỐC HƯỞNG - TRẦN BỬU DUNG
PHAN PHẠM THỊ MY LY - 03T4
Khoa Công nghệ Thông tin, Trường Đại học Bách Khoa
GVHD: KS. MAI VĂN HÀ
Khoa Công nghệ Thông tin - Trường Đại học Bách Khoa
TÓM TẮT:
Bài báo này giới thiệu công nghệ SAPI của Microsoft trong nhận dạng tiếng nói và một số kết
quả đạt được khi ứng dụng công nghệ này vào việc chuyển từ giọng nói sang text cũng như
chuyển từ text sang giọng nói bằng tiếng Anh. Trong thời gian đến, chúng tôi sẽ ứng dụng
thành công công nghệ này vào việc xây dựng “hệ thống nhập và thông báo điểm thi tuyển sinh
bằng tiếng Việt“.
SUMARY:
This article introduces SAPI technology of Microsoft in speech recognition and some achieved
results when we apply this technology in speech to text (STT), text to speech(TTS) process by
English. In the next time, we’ll apply this technology successful to build “inputing and notifying
university entrance marks system by Vietnamese“.
1. Giới thiệu
Hiện nay, trên thế giới việc sử dụng các phần mềm về âm thanh không còn là một vấn
đề quá mới mẻ. Tuy nhiên, mỗi quốc gia đều có một đặc thù ngôn ngữ khác nhau nên không
có các quy tắc, các luật chung trong việc xử lý từ. Là một người Việt Nam, chúng tôi luôn tự
hỏi làm thế nào để nhận dạng tiếng Việt. Xuất phát từ ý tưởng đó, chúng tôi đã lựa chọn và
nghiên cứu đề tài này.
Trong quá trình tìm hiểu, chúng tôi nhận thấy rằng một số hãng phần mềm lớn như
Microsoft, Sun, IBM đã xây dựng sẵn các engine trong việc nhận dạng và xử lý tiếng nói.
Trong đó chỉ có một số ít các công ty cung cấp các công nghệ với mã nguồn mở để các lập
trình viên xây dựng nên các ứng dụng phù hợp với mục đích sử dụng của họ. Để giảm thời
gian xây dựng engine, chúng tôi đã lựa chọn công nghệ SAPI của Microsoft vì hiệu quả xử lý
cao và window là hệ điều hành đa người dùng.
Hiện tại, chúng tôi đã đạt được một số kết quả trong việc chuyển từ tiếng nói sang text
và text sang tiếng nói bằng tiếng anh dựa trên nền tảng công nghệ SAPI của Microsoft. Việc
nghiên cứu đề tài này đã tạo ra nền tảng bước đầu cho việc xây dựng ứng dụng trong lĩnh vực
nhận dạng tiếng nói. Hệ thống này mang tính thực tiễn cao vì nó sẽ làm giảm đến mức tối
thiểu các sai sót trong quá trình nhập điểm.
` Trong bài báo này, chúng tôi trình bày những vấn đề cơ bản liên quan đến việc phát
triển hệ thống này
Những tài liệu gần giống với tài liệu bạn đang xem
📎 Số trang: 67
👁 Lượt xem: 614
⬇ Lượt tải: 17
📎 Số trang: 116
👁 Lượt xem: 597
⬇ Lượt tải: 17
📎 Số trang: 111
👁 Lượt xem: 435
⬇ Lượt tải: 16
📎 Số trang: 59
👁 Lượt xem: 575
⬇ Lượt tải: 16
📎 Số trang: 72
👁 Lượt xem: 799
⬇ Lượt tải: 16
📎 Số trang: 14
👁 Lượt xem: 650
⬇ Lượt tải: 16
📎 Số trang: 5
👁 Lượt xem: 569
⬇ Lượt tải: 18
📎 Số trang: 88
👁 Lượt xem: 596
⬇ Lượt tải: 16
📎 Số trang: 48
👁 Lượt xem: 496
⬇ Lượt tải: 16
📎 Số trang: 48
👁 Lượt xem: 473
⬇ Lượt tải: 17
Những tài liệu bạn đã xem
📎 Số trang: 5
👁 Lượt xem: 687
⬇ Lượt tải: 16