Tìm tài liệu

Nhan dang tieng noi tieng viet theo huong tiep can nhan dang am vi tu dong

Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động

Upload bởi: thai

Mã tài liệu: 303221

Số trang: 91

Định dạng: pdf

Dung lượng file: 1,655 Kb

Chuyên mục: Kỹ thuật - Công nghệ

Info

Nhận dạng tiếng nói đóng vai trò quan trọng trong giao tiếp giữa người và máy. Nó giúp máy móc hiểu và thực hiện các hiệu lệnh của con người. Hiện nay trên thế giới, lĩnh vực Nhận dạng Tiếng nói đã đạt được nhiều tiến bộ vượt bậc. Tuy nhiên, hầu hết các công trình vẫn còn thực hiện ở trong phòng thí nghiệm, đặc biệt là đối với các thứ tiếng ít phổ biến như Tiếng Việt của chúng ta. Ý tưởng về xây dựng các hệ thống nhận dạng tiếng nói đã có từ những năm 50 của thế kỷ 20 và đến nay đã đạt được nhiều kết quả đáng kể. Có 3 hướng tiếp cận chính cho nhận dạng tiếng nói: Tiếp cận Âm học: Hướng tiếp cận này dựa vào các đặc điểm âm học được rút ra được từ phổ âm thanh. Tuy nhiên kết quả của hướng tiếp cận này còn thấp vì trong thực tế, các đặc trưng âm học có sự biến động rất lớn. Hơn nữa phương pháp này đòi hỏi tri thức rất đầy đủ về âm học (Vốn tri thức âm học hiện nay chưa thể đáp ứng). Tiếp cận Nhận dạng mẫu thống kê: Sử dụng các phương pháp máy học dựa trên thống kê để học và rút ra mẫu tham khảo từ lượng dữ liệu lớn. Hướng này đang được sử dụng nhiều, chủ yếu là dựa vào Mô hình Markov ẩn (HMM). Tiếp cận Trí tuệ nhân tạo: là hướng kết hợp của cả hai hướng trên. Phương pháp này kết hợp được cả tri thức của chuyên gia và phương pháp mẫu thống kê. Đây sẽ là hướng tiếp cận tương lai của nhận dạng tiếng nói. Việc nhận dạng tiếng nói gặp một số khó khăn sau: Trong môi trường sinh hoạt hàng ngày, chất lượng tiếng nói biến động rất lớn do chịu ảnh hưởng của các yếu tố ngoại cảnh, tâm và sinh lý người nói: một câu của cùng một người nói khi thâu vào máy sẽ khác nhau nếu nói ở hai tâm trạng khác nhau (lúc vui nói khác, lúc giận nói khác,…), sức khoẻ khác nhau (lúc khoẻ nói khác, lúc bệnh nói khác), tốc độ nói khác nhau (nói chậm thì rõ hơn nói nhanh), môi trường xung quanh khác nhau (môi trường có tiêng ồn thì âm thu vào sẽ bị nhiễu), v.v… Và còn nhiều yếu tố khác nữa tác động lên chất lượng của lời nói như thiết bị thu không tốt, tín hiệu bị nhiễu điện,… Do đó, việc nhận dạng trở nên rất khó khăn. Nói về nhận dạng tiếng Việt, chúng ta đi sau thế giới rất lâu. Vì vậy, thành quả đạt được còn hạn chế: chưa có những hệ thống nhận dạng thật sự tốt, chưa có các kho dữ liệu quí như trong tiếng Anh,… Tuy nhiên, chúng ta được thừa hưởng nhiều thành quả của thế giới về kỹ thuật nhận dạng. Hiện nay, trong khi chưa có các công trình nghiên cứu đầy đủ về ngữ âm tiếng Việt dưới góc độ làm tin học, hướng tiếp cận chủ yếu để nhận dạng tiếng nói tiếng Việt vẫn là nhận dạng thống kê. Và khó khăn của chúng ta là xây dựng các kho dữ liệu đủ lớn và chính xác dùng để học mẫu và kiểm tra kết quả nhận dạng. Trong hệ nhận dạng tiếng nói, đơn vị cơ bản phải nhận được là từ, hay còn gọi là âm tiết. Trong hầu hết các ngôn ngữ, số lượng âm tiết là rất lớn. Tiếng Việt có hơn 8000 âm tiết, khoảng 6000 âm tiết được dùng phổ biến. Với số lượng lớn như vậy, việc nhận dạng từng âm tiết là khó thực hiện được. Vì vậy, chúng ta phải đi theo hướng nhận dạng các đơn vị nhỏ hơn cấu thành âm tiết (đơn vị dưới từ, ví dụ như âm vị) vì các đơn vị này có số lượng ít. Theo thống kê, trong hầu hết các ngôn ngữ, số lượng âm vị dao động từ 20 đến 60 (ít hơn nhiều so với hàng ngàn hay hàng chục ngàn âm tiết). Vì vậy, nhận dạng âm vị là hướng thường được chọn trong số các hướng nhận dạng đơn vị dưới từ. Trong nhận dạng tiếng nói theo hướng nhận dạng từng âm vị, một khó khăn chúng ta gặp phải là: các âm vị liền nhau trong chuỗi tiếng nói không có vách ngăn rõ ràng (2 âm vị sát nhau có một phần giao nhau, khó xác định được phần giao nhau xi Giới thiệu chung thuộc âm vị trước hay âm vị sau). Ngay cả đối với con người, tách âm vị từ một âm tiết (xác định vị trí bắt đầu và vị trí kết thúc của âm vị đó trên sóng âm của âm tiết) cũng không phải là công việc đơn giản. Hiện nay, hầu hết các hướng tiếp cận để nhận dạng âm vị là nhận dạng theo học mẫu thống kê. Thông thường, để học mẫu, người ta cung cấp cho chương trình học một nguồn dữ liệu có nhiều mẫu được đã phân loại thành nhiều lớp và có gán nhãn (nhãn cho biết mỗi mẫu thuộc lớp nào). Nguồn dữ liệu này phải được phân lớp và gán nhãn chính xác hoàn toàn để máy học. Tuy nhiên, do không thể tách âm vị một cách chính xác, nguồn dữ liệu âm vị đưa vào khó đạt được mức độ chính xác, kết quả là việc huấn luyện giảm hiệu suất, làm cho hiệu suất của chương trình nhận dạng cũng giảm theo. Chúng tôi xin nêu ra một hướng giải quyết để tránh việc gán nhãn âm vị không chính xác: thay vì đánh nhãn âm vị, chúng ta sẽ đánh nhãn âm tiết, đồng thời cho biết các âm vị cấu thành âm tiết đó. Như vậy, dữ liệu mẫu cung cấp cho quá trình học là các âm tiết. Thuật toán học được sử dụng để tách âm vị là Embedded training. Kết quả thu được là các mô hình HMM cho từng âm vị. Do mỗi dãy âm vị được chọn tương đương với một âm tiết, công việc đánh nhãn âm vị trên sóng âm thực chất là không có (chỉ đánh nhãn trên âm tiết, vốn được thực hiện dễ dàng). Vì vậy, có thể xem dữ liệu đưa vào trong quá trình huấn luyện là dữ liệu không gán nhãn và phương pháp nhận dạng này được xem là nhận dạng âm vị tự động. Công việc gán nhãn âm vị bằng tay rất vất vả và mất nhiều thời gian.Ngoài ra, hiện nay có rất ít kho dữ liệu đã được gán nhãn âm vị. Vì vậy, hướng tiếp cận nhận dạng âm vị tự động, vốn hiệu quả hơn, tỏ ra là hướng tiếp cận đúng đắn. Tuy nhiên, huấn luyện trên dữ liệu không gán nhãn cũng có những khó khăn: đòi hỏi khối lượng dữ liệu lớn hơn nhiều so với huấn luyên trên dữ liệu có gán nhãn, đồng thời quá trình huấn luyện cũng lâu hơn. xii Giới thiệu chung Với những ưu thế vượt trội như trên đã nêu, hướng tiếp cận nhận dạng âm vị tự động đã được chúng tôi chọn trong đề tài nhận dạng tiếng nói tiếng Việt của mình. Trong bài làm, chúng tôi muốn chứng minh hai điều: Nếu có đầy đủ dữ liệu tiếng nói (không gán nhãn), có thể nhận dạng được số lượng lớn các âm tiết tiếng Việt với độ chính xác tương đối cao theo hướng tiếp cận nhận dạng âm vị tự động. Có thể nhận dạng được tiếng nói Tiếng Việt nói liên tục với tốc độ trung bình

Phần bên dưới chỉ hiển thị một số trang ngẫu nhiên trong tài liệu. Bạn tải về để xem được bản đầy đủ

  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Đang tải dữ liệu ...
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động
  • Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động

GỢI Ý

Những tài liệu gần giống với tài liệu bạn đang xem

Nhận dạng tiếng nói tiếng việt theo hướng ...

Upload: smartstockvn

📎 Số trang: 91
👁 Lượt xem: 403
Lượt tải: 16

Nghiên cứu các đặc trưng tiếng Việt áp dụng ...

Upload: hungpq

📎 Số trang: 116
👁 Lượt xem: 600
Lượt tải: 17

Nhận dạng tiếng nói tiếng việt tìm hiểu và ...

Upload: mepingpong

📎 Số trang: 103
👁 Lượt xem: 402
Lượt tải: 17

Nhận dạng tiếng nói bằng mạng nơron nhân tạo

Upload: vudaidong

📎 Số trang: 7
👁 Lượt xem: 752
Lượt tải: 22

Xây dựng các mô hình nhận dạng tiếng nói ...

Upload: linhthuynguyen1985

📎 Số trang: 50
👁 Lượt xem: 620
Lượt tải: 18

Tìm hiểu một số phương pháp nhận dạng tiếng ...

Upload: Hanhledinh

📎 Số trang: 53
👁 Lượt xem: 767
Lượt tải: 16

Nhận dạng tiếng nói và ứng dụng tích hợp với ...

Upload: lequocphapvn

📎 Số trang: 99
👁 Lượt xem: 636
Lượt tải: 17

Tìm hiểu ma ng Nơron sinh ho c và ứng dụng ...

Upload: ttmtr81

📎 Số trang: 14
👁 Lượt xem: 651
Lượt tải: 16

Kỹ thuật nhận dạng tiếng nói và ứng dụng ...

Upload: xoma35

📎 Số trang: 5
👁 Lượt xem: 572
Lượt tải: 18

Lý thuyết mạng Neuron và ứng dụng trong nhận ...

Upload: huyendtn

📎
👁 Lượt xem: 632
Lượt tải: 18

Nghiên cứu xây dựng phần mềm tạo lập và nhận ...

Upload: hoangdung_sc

📎 Số trang: 23
👁 Lượt xem: 636
Lượt tải: 16

Nhận dạng tập từ hạn chế Tiếng Việt trong ...

Upload: xuanluongpro

📎 Số trang: 48
👁 Lượt xem: 393
Lượt tải: 16

QUAN TÂM

Những tài liệu bạn đã xem

Nhận dạng tiếng nói tiếng việt theo hướng ...

Upload: thai

📎 Số trang: 91
👁 Lượt xem: 741
Lượt tải: 17

CHUYÊN MỤC

Kỹ thuật - Công nghệ
Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động Nhận dạng tiếng nói đóng vai trò quan trọng trong giao tiếp giữa người và máy. Nó giúp máy móc hiểu và thực hiện các hiệu lệnh của con người. Hiện nay trên thế giới, lĩnh vực Nhận dạng Tiếng nói đã đạt được nhiều tiến bộ vượt bậc. Tuy nhiên, hầu pdf Đăng bởi
5 stars - 303221 reviews
Thông tin tài liệu 91 trang Đăng bởi: thai - 24/03/2025 Ngôn ngữ: Việt nam, English
5 stars - "Tài liệu tốt" by , Written on 24/03/2025 Tôi thấy tài liệu này rất chất lượng, đã giúp ích cho tôi rất nhiều. Chia sẻ thông tin với tôi nếu bạn quan tâm đến tài liệu: Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động