Em chào các anh chị.
Em có bài tập lớn là nhận dạng tiếng động vật từ thư viện 1000 file âm thanh động vật mình tự tạo. mà em còn chưa biết làm ra sao ạ.
Theo em tự tìm hiểu thì ta có các bước sau:
- Từ file âm thanh ta tiền xử lý bằng khử nhiễu
- Rút đặc trưng
- Xây dựng mô hình tiếng động vật
- Đưa file nhận dạng vào mô hình để đối chiếu với thư viện để ra được xác suất.
Anh( chị) cho em hỏi ở phần 2.trích rút đặc trưng thì ta làm như nào ạ( biên độ, cao độ, tìm đăc trưng âm thanh theo thời gian và không gian) hay làm như nào ạ.
Anh chị có thể gợi ý giúp em để làm bài này không ạ. Nếu anh chị nào có source code thì cho em để tham khảo ạ( Thầy em cho sử dụng code bên ngoài).
Em dã tham khảo một số bài viết:
- Hỏi về đề tài nhận dạng giọng nói
- Anh chị cho em hỏi đây có phải là code của bài trên không ạ. Em tìm được mà xem không hiểu: https://github.com/doanhpv-0200/speech2text/tree/no-trans
Em cảm ơn ạ.