Nhận dạng tiếng nói

Nguyen_Van_Khai · March 26, 2016, 12:51pm

mình cũng đang sử dụng ubuntu để làm,viết bằng ngôn ngữ python. python cũng hỗ trợ mấy library của toán nhưng vẫn khó.tìm tài liệu trên mạng chỉ thấy làm bằng matlab vì matlab đã có sẵn mấy cái lib cho giải thuật fft.

chazo1994 · March 26, 2016, 7:32pm

bạn biết sài cmusphinx không? đang mắt chỗ generate dictionary bằng Phonetisaurus

ltd · March 27, 2016, 12:16am

Đạt đã từng làm cmusphinx để nhận diện ngôn ngữ, nhưng đó là tiếng Anh.

Tiếng Việt thì không có thư viện nên không làm, với lại nhu cầu project là tiếng Anh.

Theo Đạt nhớ không lầm là để chuẩn bị một bộ thư viện tốn rất nhiều thời gian, không biết @chazo1994 đang muốn generate cái gì, file âm thanh hay file map thôi?

chazo1994 · March 27, 2016, 11:16am

bộ thư viện thì em mới đang làm nhận dạng số nên khá nhó.
có về dự án em đang theo là của viện nghiên cứu mica có nhiều người đi trước đã làm bộ thự viện rồi ạ. em chỉ develop thêm.
còn vấn đề em đang mắc với cái Phonetisaurus là lúc cài đặt nó trên ubuntu thôi a. hết error này đến error khác

chazo1994 · March 27, 2016, 11:17am

em đang làm cái nhận dạng số nhỏ nhỏ trươc khi tham gia dự án to. bị mắc khi cài Phonetisaurus. ko biết là có tool nào hay hơn để tạo dic ko a?

drgnz · August 25, 2016, 8:31am

A post was split to a new topic: Cách đưa các file huấn luyện để máy học nhận diện giọng nói trong VB.Net

ngocduc · December 14, 2016, 3:38am

Em rất hứng thú với cái này. Mà giờ không biết bắt đầu từ đâu.
Các anh có tài liệu không ạ? Em cần biết những thứ gì để có thể code được ạ?

Rok_Hoang · December 14, 2016, 3:59am

Background của bạn? Chỉ hứng thú thôi là chưa đủ.
Nhận dạng tiếng nói thì liên quan đến vision computer.

anhkien96 · December 14, 2016, 10:12am

perfect! hay qúa anh ơi.

Thi · February 21, 2017, 8:46am

Mình rất quan tâm và muốn tìm hiểu về vấn đề này. Các bạn có tài liệu hướng dẫn về CMUSphinx cho mình tham khảo với

banhmisg9509 · February 21, 2017, 11:37am

Không biết google có api cho chuyển giọng nói không? Thấy dùng nó trên android cũng khá tốt.

Trai_Tim_Bang_Gia1 · April 11, 2017, 4:57am

Mjk đang tìm hiểu cách nhận dạng giọng nói tiếng việt và chuyển text tiếng việt thành giọng nói bằng ngôn ngữ android. bạn có thể cho mjk xin tài liệu không? mail mjk là: [email protected]
Cảm ơn !

chazo1994 · April 12, 2017, 6:16am

Ok mình gửi qua mail nhé.

Kenh_Suy_luan_manga · May 11, 2017, 3:36pm

Anh ay anh dung phan mem gi tren dien thoai vay, chi cho em voi. neu duoc thi anh co the chi cho em cach lam cai do duoc khong, em cung dang co mot y tuong ve van de giong noi nay. Xin anh giup dum.

chazo1994 · May 11, 2017, 4:31pm

có nhiều cách để làm việc với giọng nói lắm. còn tùy theo project của bạn nữa. bạn có thể nêu qua cụ thể bạn muốn làm gì ko? mình sẽ gợi ý giúp cho.

Lovemagic · May 11, 2017, 7:06pm

Bạn check inbox nhé, mình muốn hỏi bạn thêm về vấn đề này mà không tiện post làm loãng topic của bạn.
Cảm ơn bạn.

hell6w9rld · May 12, 2017, 12:15pm

[email protected]
Cho mình xin tài liệu với. Tks bạn

chazo1994 · May 12, 2017, 1:32pm

Tài liệu thì bạn xem trong khóa này nè:https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-345-automatic-speech-recognition-spring-2003/
Về toolkit thì bạn có thể thìm hiểu về CMusphinx, HTK…
còn hiện đại nhất thì bạn nên search về “neural network for speech recognition”, framework thì hình như là kaldi.
Sách thì bạn có thể tham khảo cuốn: “speech and language processing”
bạn cũng có thể xem bài này: https://drive.google.com/file/d/0B2nvwhLjNEHgNFdnVHlKRzBFZ0U/view?usp=sharing

Nguyen_Khanh_Vy · September 18, 2017, 3:55pm

anh có thể hướng dẫn em nhận dang tiếng việt bằng cmusphinx được không anh? em đang làm đồ án về nó nhưng không biết sử dụng công cụ này như thế nào,nên gặp rất nhiều khó khăn.Mong anh sẽ giúp đỡ,cảm ơn a!

chazo1994 · September 19, 2017, 1:52am

Trong cái báo cáo mà mình gửi ở link phía trên, thì mình cũng đã viết chi tiết từng bước huấn luyện mô hình nhận dạng tiếng nói bằng cmusphinx. (Trong chương 5). Ngoài ra bạn có thể tham khảo tutorial này: https://cmusphinx.github.io/wiki/tutorial/
Chú ý là về mô hình ngôn ngữ bạn có thể sử dụng các bộ công cụ khác như IRSTLM, BLM…