Em đang có đề tài về nhận diện người nói sử dụng C++. Sau một hồi nghiên cứu thì em tìm ra giải pháp là sử dụng trích rút MFCC và sử dụng GMM để có thể xác nhận tỉ lệ phần trăm người nói là ai.
Nhưng em cũng không rõ là nên sử dụng thư viện nào cho một số công việc như:
- Yêu cầu Mic và ghi âm.
- Đọc file âm thanh.
- Trích rút MFCC
- GMM
- Xử lý nhiễu âm thanh.
Rất mong các tiền bối có thể giúp em hoàn thành được đồ án này ạ.
Em xin cảm ơn.
 
      
     … Tại ban đầu em định định hình cái ứng dụng ra đã, sau đó thêm thắt, tinh chỉnh lại sau ^^, Nhưng nếu ý kiến của bác vậy thì chắc chắn em sẽ làm luôn. Cho em hỏi em dùng SFML nó trả về 1 chuỗi số nguyên nhưng độc DOC nó chỉ ghi là “raw data” mà không rõ là gì - kiểu dữ liệu trả về cũng là kiểu số nguyên có âm dương (sf::Int16). Vậy nếu xử lý nhiễu, trích rút đặc trưng MFCC (dft, idft, log…) thì nó có hoạt động được không ạ? Tin hiệu âm thanh em khá là kém, mong bác giúp đỡ em.
 … Tại ban đầu em định định hình cái ứng dụng ra đã, sau đó thêm thắt, tinh chỉnh lại sau ^^, Nhưng nếu ý kiến của bác vậy thì chắc chắn em sẽ làm luôn. Cho em hỏi em dùng SFML nó trả về 1 chuỗi số nguyên nhưng độc DOC nó chỉ ghi là “raw data” mà không rõ là gì - kiểu dữ liệu trả về cũng là kiểu số nguyên có âm dương (sf::Int16). Vậy nếu xử lý nhiễu, trích rút đặc trưng MFCC (dft, idft, log…) thì nó có hoạt động được không ạ? Tin hiệu âm thanh em khá là kém, mong bác giúp đỡ em.
 em gần như là con số 0 để bắt đầu, em cũng GG ngày đêm để nghiêm cứu thêm. Nên có gì mong các anh trong Forum hỗ trơ. Em rất cảm ơn những chia sẻ trên.
 em gần như là con số 0 để bắt đầu, em cũng GG ngày đêm để nghiêm cứu thêm. Nên có gì mong các anh trong Forum hỗ trơ. Em rất cảm ơn những chia sẻ trên. 83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?
    83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?