Ý tưởng về chuyển giọng nói thành text trong AI

Như tiêu đề, mong mọi người có thể góp ý giúp mình về vấn đề này. Mình đang bắt đầu nghiên cứu về nó.

Xin lỗi nếu như chủ đề đã tồn tại rồi.

Hi Sơn Phạm.
Tự GG mội vài dòng không nói hết được.

cám ơn bạn đã phản hồi, vì mới là ý tưởng nên rất muốn senpai có thể giúp một số bài viết để có thể đi đúng hướng.

Hi Sơn Phạm.
text to speech paper

1 Like

Phải là speech recognition

2 Likes

Hi Đào An.
Cho cần câu không ai cho con cá. Bưng tận miệng vậy không hay. Đến cái mình làm không biết dịch tiếng Anh là gì thì nên nghỉ. @_@!

1 Like

À ý t là ông bị ngược ấy, ông chủ top hỏi là giọng nói --> text mà. Cho cần thì phải cho đúng loại cần mà hút mới phê chứ.

1 Like

cám ơn bạn đã có ý tốt, vì có ông anh đang nghiên cứu về vấn đề này, thấy ảnh nói về đề tài cũng hay nên mình mới mạng phép lên hỏi sơ qua để bắt đầu tìm hiểu thôi. Chứ mình không có ý ngồi đợi bưng cơm rót nước sẳn đâu.

Hi Đào An.
Đến cái mình làm không biết dịch tiếng Anh là gì thì nên nghỉ. @_@!

Vấn đề ở đây là ông sai mà =)) liên quan gì đến ông kia biết hay ko biết. Chỉ cho người ta thì làm ơn chỉ đúng dùm. Còn ko thì đừng reply

4 Likes

Hi Đào An.
Đến cái mình làm không biết dịch tiếng Anh là gì thì nên nghỉ. @@!
P/S @
@!

Hi,

Cám ơn hai bạn nha, nhờ có key mà mình ra đc cái clip.

Cái này dùng Google Speech mà, tự build 1 cái mới gọi là tìm hiểu

Và lĩnh vực bạn tìm hiểu giới hạn lại Deep Learning. AI quá rộng.

2 Likes

Mạn phép hỏi ké chút: Ở VN có chỗ nào dạy mấy thứ về AI này (mình nói AI cho rộng, dạy riêng 1 mảng cũng k vấn đề gì) không nhỉ? Mình muốn theo học 1 khóa offline. (Online mình có thể tự tìm được).

Mình chỉ biết trong trường đại học có dạy, cụ thể ở trường mình là ĐHBK Hà Nội, cụ thể hơn liên quan đến bài của bạn ở trên là môn Xử lý ngôn ngữ tự nhiên, ngoài ra còn có môn Xử lý ảnh liên quan đến Machine Learning (ngày xưa mình học môn này), bạn có thể liên hệ các thầy ở đó hoặc cựu sinh viên đã từng học.
Chứ theo mình AI còn rất mới nên sẽ chưa có khóa học nào đâu, vì nó quá rộng, người ta còn chưa biết định hướng cụ thể nhất là gì ở Vn mà :slight_smile:

2 Likes

Cảm ơn bạn.

Thật lòng mà nói mình cũng chỉ nắm qua và nghe qua khái niệm chứ cũng chưa tìm hiểu sâu.
Nói về thích thì mình có thích NLP, có thích cả việc con bot Alpha Go đánh cờ, và bất ngờ hơn khi nghe về Alpha 0 (nhớ mang máng vậy), con đời sau của Alpha Go.

Mình kể vậy để thấy mình thích 2 lĩnh vực hoàn toàn khác nhau nên chỉ dám viết nên chỉ dám viết AI chung chung.
Rất may có bạn đã bỏ thời gian trả lời. Xin chân thành cảm ơn bạn lần nữa.

Mình thật không hiểu ý bạn lắm. Giả sử mình có liên lạc đc với thầy cô X, Y nào đó thì bước tiếp theo là gì vậy bạn :smiley: Không nhẽ hỏi họ có mở lớp không :smiley: Bạn tư vấn giúp mình bước tiếp theo nhé.

Mình tự học k đc giỏi lắm + cũng lười nên mới muốn tìm lớp Off. Nếu thực sự không có lớp thì 100% phải tự cày online + chăm chỉ hơn thôi, hết cách :smiley:

À việc đơn giản ấy mà, ý minh liên hệ là xem lịch học các môn ấy mà đến…học chùa thôi :smile:, mình hồi còn đi học học chùa suốt mà, cứ môn nào hay hay nhảy vào học. Kể ra thì cũng có 1 lần bị phát hiện thì bảo em thấy môn này hay quá nên vào học nhờ, thấy mình ham ko ai đuổi mình đâu mà sợ bạn ạ :wink:
Hoặc ít ra bạn sẽ có được tài liệu/giáo trình, nhưng đi học trực tiếp tại lớp hiệu quả bao giờ cũng cao hơn.

1 Like

NLP hiện giờ có 2 trường phái: tri thức knowledge, thống kê Statistics.

Nếu bạn học đại học trong nước, đa số sẽ hướng dẫn bạn theo hướng knowledge. Trong khi xu hướng hiện giờ là Statistics.

Hướng tri thức sẽ học qua tất cả các môn như sinh viên chuyên ngành ngôn ngữ học, từ bảng chữ cái, từ, phiên âm, ngữ pháp, từ điển. Do lý thuyết rất nhiều nên đa số thầy/cô chỉ chú tâm vào ngữ pháp. Xây dựng model hoá ngữ pháp trong máy tính. Các thuật toán phân tích 1 câu dựa trên bộ ngữ pháp. Các heuristics để chạy nhanh. Còn các phần khác, âm, từ, đối thoại phải tự học. Độ chính xác khoảng 60 70%

Hướng thống kê, xây dựng trên Markov model, sẽ không quan tâm ngữ pháp, âm tiết. Nghĩa 1 câu dựa trên các từ chính trong 1 câu. Các từ trong câu được gắn xác suất, lọc ra các từ có xác suất cao, rồi kết hợp bằng các luật ngữ pháp đơn giản (tính từ - danh từ, SVO) để sinh ngữ nghĩa. Đoạn văn càng nhiều thì dịch càng sát nghĩa. Hướng này chuộng hơn thì chỉ cần thu thập nhiều đoạn văn, thay vì thuê chuyên gia phân tích âm, từ, ngữ pháp, ngữ cảnh,… Độ chính xác từ 80 - 97%

3 Likes

@Chien_Dang hơi khoai bạn ạ, giờ mình đi làm rồi, k học ké đc :smiley: Chắc liên hệ ông nào xin tài liệu thì may ra có :smiley:
@hungaya Cảm ơn bạn đã bổ sung thông tin, mình sẽ tìm kiếm theo keyword bạn đã đưa <3

1 Like

Ồ, nếu mình không nhầm thì hướng knowledge base từ vài thập kỷ trước đã trở nên lỗi thời rồi mà?

Và mình thì không rõ các trường trong nước dạy thế nào, nhưng nếu như dựa theo các group ở VN mình, mình không nghĩ có nơi nào dạy theo hướng linguistics vậy.

Mà Markov cũng chỉ là 1 hướng trong rất nhiều hướng đi của NLP thôi, thậm chí Markov model với giả định bước tiếp theo chỉ dựa vào bước hiện tại là 1 giả định rất tệ khi áp dụng cho text/speech, bởi lẽ đặc trưng của văn bản là 1 sequence. Những hướng đi tiên phong hiện tại là xài RNN / LSTM, đều nhờ xử lý chuỗi rất tốt.

In probability theory, a Markov model is a stochastic model used to model randomly changing systems.[1] It is assumed that future states depend only on the current state, not on the events that occurred before it (that is, it assumes the Markov property).

4 Likes
83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?