Em đang có đề tài về nhận diện người nói sử dụng C++. Sau một hồi nghiên cứu thì em tìm ra giải pháp là sử dụng trích rút MFCC và sử dụng GMM để có thể xác nhận tỉ lệ phần trăm người nói là ai.
Nhưng em cũng không rõ là nên sử dụng thư viện nào cho một số công việc như:
- Yêu cầu Mic và ghi âm.
- Đọc file âm thanh.
- Trích rút MFCC
- GMM
- Xử lý nhiễu âm thanh.
Rất mong các tiền bối có thể giúp em hoàn thành được đồ án này ạ.
Em xin cảm ơn.