Đây là vấn đề hay, nhưng không đơn giản. Nếu bạn biết về AI thì có lẽ nó dễ tiếp cận hơn. Nhưng cũng có thể làm theo cách này, thỏa mãn ý tưởng của bạn. Bạn có thể làm như kiểu ứng dụng từ điển. Đó là xây dựng kho dữ liệu sẵn, text, âm thanh gì thì tùy. Input của bạn là do người dùng nhập vào, (bàn phím, chuột, mic…). Phần mềm của bạn sẽ ghi nhận input và tìm kiếm trong kho dữ liệu, tìm ra đáp án đúng, gần đúng và trả về. Bạn tham khảo thêm một số tài liệu xử lý ngôn ngữ tự nhiên nếu muốn app của bạn pro hơn.
Tham khảo một số ứng dụng như tìm kiếm giọng nói của Chorme, Siri của iOS, Cortana của Windows Phone. Mình đang dùng BlackBerry, nó nhận diện giọng nói Tiếng Việt khá tốt, và chính xác.