Nhận dạng tiếng nói

Tài liệu thì bạn xem trong khóa này nè:https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-345-automatic-speech-recognition-spring-2003/
Về toolkit thì bạn có thể thìm hiểu về CMusphinx, HTK…
còn hiện đại nhất thì bạn nên search về “neural network for speech recognition”, framework thì hình như là kaldi.
Sách thì bạn có thể tham khảo cuốn: “speech and language processing”
bạn cũng có thể xem bài này: https://drive.google.com/file/d/0B2nvwhLjNEHgNFdnVHlKRzBFZ0U/view?usp=sharing

3 Likes

anh có thể hướng dẫn em nhận dang tiếng việt bằng cmusphinx được không anh? em đang làm đồ án về nó nhưng không biết sử dụng công cụ này như thế nào,nên gặp rất nhiều khó khăn.Mong anh sẽ giúp đỡ,cảm ơn a!

1 Like

Trong cái báo cáo mà mình gửi ở link phía trên, thì mình cũng đã viết chi tiết từng bước huấn luyện mô hình nhận dạng tiếng nói bằng cmusphinx. (Trong chương 5). Ngoài ra bạn có thể tham khảo tutorial này: https://cmusphinx.github.io/wiki/tutorial/
Chú ý là về mô hình ngôn ngữ bạn có thể sử dụng các bộ công cụ khác như IRSTLM, BLM…

1 Like

bạn có tài liệu mfcc ko cho m xin với !! đang cần lắm ý.tks

1 Like

@Hoang_The_Nam search google ra cả đống mà
https://www.google.com.vn/search?q=speech+recognition+with+mfcc&oq=speech+recognition+with+mfcc&aqs=chrome..69i57j0l5.6890j0j7&sourceid=chrome&ie=UTF-8

Còn Python thì
https://www.google.com.vn/search?ei=1FvdWqipO8nM8wWa64v4AQ&q=Python+speech+recognition+with+mfcc&oq=Python+speech+recognition+with+mfcc&gs_l=psy-ab.3...69944.70938.0.71046.7.7.0.0.0.0.130.621.3j3.6.0…0…1c.1.64.psy-ab…2.0.0…0.xIG81549lJ4

1 Like

xin chào bạn, bạn có thể cho mình file dict với file lm .bin và file.phone được không mình chỉ mới tiềm hiểu cần rất nhiều ví dụ

83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?