Tài liệu thì bạn xem trong khóa này nè:https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-345-automatic-speech-recognition-spring-2003/
Về toolkit thì bạn có thể thìm hiểu về CMusphinx, HTK…
còn hiện đại nhất thì bạn nên search về “neural network for speech recognition”, framework thì hình như là kaldi.
Sách thì bạn có thể tham khảo cuốn: “speech and language processing”
bạn cũng có thể xem bài này: https://drive.google.com/file/d/0B2nvwhLjNEHgNFdnVHlKRzBFZ0U/view?usp=sharing
Nhận dạng tiếng nói
anh có thể hướng dẫn em nhận dang tiếng việt bằng cmusphinx được không anh? em đang làm đồ án về nó nhưng không biết sử dụng công cụ này như thế nào,nên gặp rất nhiều khó khăn.Mong anh sẽ giúp đỡ,cảm ơn a!
Trong cái báo cáo mà mình gửi ở link phía trên, thì mình cũng đã viết chi tiết từng bước huấn luyện mô hình nhận dạng tiếng nói bằng cmusphinx. (Trong chương 5). Ngoài ra bạn có thể tham khảo tutorial này: https://cmusphinx.github.io/wiki/tutorial/
Chú ý là về mô hình ngôn ngữ bạn có thể sử dụng các bộ công cụ khác như IRSTLM, BLM…
bạn có tài liệu mfcc ko cho m xin với !! đang cần lắm ý.tks
@Hoang_The_Nam search google ra cả đống mà
https://www.google.com.vn/search?q=speech+recognition+with+mfcc&oq=speech+recognition+with+mfcc&aqs=chrome..69i57j0l5.6890j0j7&sourceid=chrome&ie=UTF-8
Còn Python thì
https://www.google.com.vn/search?ei=1FvdWqipO8nM8wWa64v4AQ&q=Python+speech+recognition+with+mfcc&oq=Python+speech+recognition+with+mfcc&gs_l=psy-ab.3...69944.70938.0.71046.7.7.0.0.0.0.130.621.3j3.6.0…0…1c.1.64.psy-ab…2.0.0…0.xIG81549lJ4
xin chào bạn, bạn có thể cho mình file dict với file lm .bin và file.phone được không mình chỉ mới tiềm hiểu cần rất nhiều ví dụ