Cần góp ý phần mềm hỗ trợ người câm điếc giao tiếp với người thường

Anh hỏi làm em ngại quá. Em có điện thoại của winphone nhưng chưa test được anh ạ ! tại em đang ôn java để tuần tới thi học kỳ. Sau khi thi xong em sẽ cố gắng làm sớm để hỏi anh ạ! :frowning:

1 Like

Em không biết bước 1 2 mấy anh thực hiện như thế nào, nhưng cái bước thứ 3 là “rút gọn văn bản”. Vấn đề này em cũng đã được biết đến khi đi sự buổi seminar của 1 vị giáo sư người Nhật gốc Việt, đấy là 1 công trình của họ, họ sử dụng 1 database rất lớn để lưu trữ toàn bộ lại các câu cú ngữ nghĩa… Cái này nó hơi liên quan sang vấn đề máy học nữa, vd như: trời nhiều mây đen nên sẽ mưa. Mưa thì nghỉ học. Đấy, ta phải làm sao cho máy tính hiểu được: mây đen -> mưa -> nghỉ học. Điều này bắt buộc ta phải cho cái máy tính nó học những thứ áp đặt sẵn, học kiểu như từ a sẽ được b, và càng nhiêu dữ liệu thì độ chính xác càng cao, nhưng như thế sẽ phát sinh vấn đề rặp khuôn và máy tính sẽ không xử lí được những trường hợp ngoại lệ nhưng tương đồng. Ở Nhật họ đã thành công vấn đề rút gọn này trong văn bản pháp luật và xử lí máy học trong 1 nghiên cứu khi cho máy tính học toàn bộ kiến thức hóa học trong sgk và khi làm kiểm tra thì nó được điểm cao nhất, nhưng điều đó cũng chứng minh rằng nó không thể làm đề kiểm tra lý, và đó là bài toán phải giải quyết. Trở lại vấn đề rút gọn văn bản, họ phân tích cú pháp của câu, nhưng trên tiếng Anh. Họ đưa bài toán trở về tìm S, V… trong 1 câu. Rồi họ sẽ tìm kiếm trong cơ sở dữ liệu của họ xem S đã tìm được là gì, S sẽ quyết định gì tới V… xét tới ngữ cảnh… Nên ở đây, khi ở bước 3 chúng ta liệu có nên xem xét bỏ qua bước rút gọn văn bản không, vì dường như nó không cần thiết cho lắm, theo quan điểm của em. Thay vì ta cố gắng lọc bỏ từ thừa thải khi nó đã thành input thì sao ta không loại bỏ nó từ đầu. Để cho công việc trở nên đơn giản hơn, nó chỉ việc cho từ A -> hình A, khi mấy anh đã có 1 bộ giao tiếp cho từng chủ đề.
Tóm lại những gì ở trên là để rút gọn 1 văn bản khá phức tạp, theo ý kiến chủ quan của em, ai có ý tưởng gì hay thì chia sẻ và góp ý cho em nhé.

2 Likes

Suy nghĩ rất sâu sắc @thusanh001, cách suy nghĩ của mình như thế nào thì nó dẫn đến khó và dễ khác nhau.

Nói chính xác hơn, nếu mình yêu cầu cao, muốn hỗ trợ người bình thường sử dụng ngôn ngữ tự nhiên hoa mĩ để nói vào. Sau đó rút gọn ra thì cả một vấn đề.

Thay vì mình nghĩ như vậy, mình nghĩ đơn giản hơn về mục đích của chương trình ngày là để hỗ trợ giao tiếp trong gia đình. Tại sao mình không đặt ra một số quy tắc cơ bản câu nói phải có động từ và/hoặc danh từ.

Anh ví dụ nhé, một câu nói có thể chỉ bao gồm

  • Ăn cơm không
  • Tắm
  • đi chơi
  • đi công viên
  • đi chợ
  • ở nhà chờ
  • đói không

Khi nội dung ngắn gọn thì việc dịch sang sẽ rất đơn giản hơn rất nhiều. Mục tiêu cuối cùng mình muốn đạt được là giúp người thường có thể giao tiếp thành viên khiếm khuyết trong gia đình.

@hopptit nếu nhóm làm được sẽ là điều rất tốt đấy, có khó khăn gì anh có thể giúp. Có thể anh sẽ kêu gọi mọi người đóng góp tài chính nếu nhóm có giải pháp và đồng ý thực hiện cho đến khi hoàn thành sản phẩm này. Có thể bước đầu sản phẩm mình chưa tốt, nhưng nó là bước đệm để mình tiến lên hoàn thiện các chương trình tương tự.

3 Likes

thiệt tình gõ đi gõ lại mấy lần rồi xóa.
bước 2 các bạn đã có ý tưởng nào chưa, nếu kiếm được bộ dữ liệu bên ngoài thì tốt rồi mà hok kiếm được thì cũng chả sao. lúc đấy tự mần thôi. Nếu quyết định tự mần thì các bạn có thể nghiên cứu thêm bên các phương pháp máy học để tạo một bộ dữ liệu riêng cho mình. ( neural network …)
Cách đây một năm mình có gặp một bạn cũng nhận diện giọng nói nhưng code trên matlab, mình cũng không hỏi rõ là nhận diện giọng như thế nào?( nhận diện giọng nói con gái con trai , hay là nhận diện rồi xuất ra text nữa). nhưng mà có quyết tâm sẽ làm được. Cố lên,

2 Likes

Hiện nay bạn @hopptit chọn cách sử dụng dịch vụ của Google, Apple hoặc Windows Phone

Và xem video test thì thấy nhận dạng giọng nói tiếng việt khá ổn

1 Like

Anh @ltd ơi! hôm qua nhóm em có tới trung tâm dạy câm điếc và có trao đổi với mấy anh chị phiên dịch cho trung tâm , họ còn phiên dịch cho các hội nghị lớn và cả trên đài truyền hình. Họ nói dạy người câm điếc còn có cả ngữ pháp từ vựng. Họ nói một câu không giống người bình thường nói, trật tự của nó không giống ta. VD "Một người ăn hai quả táo " thì họ sẽ ký hiệu thành "Quả táo ăn hai người " và họ còn bảo điểm mấu chốt là dựa vào cảm xúc , ngôn ngữ cơ thể nữa, chứ không phải chỉ là các ký hiệu. Sau đó em có hỏi là nếu thế thì chỉ làm trong phạm vi ở mức giao tiếp trong gia đình và câu đơn giản thì mấy anh chị đó nói là nhưng cái đơn giản như ăn cơm, uống nước, đánh răng là những từ đơn ai cũng có thể ký hiệu được và người câm điếc cũng hiểu được . Em thấy tình hình khá khó khăn ạ! anh Đạt và mọi người góp ý cho em với ạ!

1 Like

Ví dụ này chính xác không? Anh thì nghĩ không chính xác vì ký hiệu như vậy có thể hiểu nhầm thành 2 người ăn 1 quả táo. Cái này anh chỉ thắc mắc về mặt ngữ pháp. Không rõ làm có ghi chú lại chính xác không. Anh nghĩ có thể phải là
“Quả táo hai ăn người” thì hợp lý hơn chứ. Đầu tiên đưa ra đối tượng, động tử và chủ ngữ.

Chính xác rồi, cảm xúc và ngôn ngữ cơ thể đến trước, sau đó mới tới ký hiệu. Nhưng ký hiệu thể hiện được chi tiết hơn. Theo anh “ngâm cứu” thì em không phải chỉ đưa cái hình tay hoặc mặt ra, mà nên đưa hình cả cơ thể. Hoặc chính xác hơn là phần trên cơ thể.

Đây là những cái anh ví dụ, không có nghĩa là mình chỉ làm những cái này. Em hỏi họ thêm những trường hợp nào khó thể hiện hơn. Ví dụ "một người ăn 2 trái táo em vẫn có thể thể hiện ra được mà? Cái ăn uống tắm rửa chỉ là ví dụ anh đưa ra.

Anh thấy vẫn ổn mà. Cố lên :smiley:

Anh @ltd cho em hỏi. Những anh chỉ đó nói là giao tiếp chủ yếu là nhìn vào nét mặt, cảm xúc, ngôn ngữ cơ thể nữa chứ không phải chỉ riếng ngôn ngữ cử chỉ. Em thấy xử lý vấn đề đó rất khó, mong anh giúp em. Tất nhiên là bọn em đang hướng tới một cuộc thi chỉ trong 3 tháng và mong muốn tạo ra một sản phẩm demo chứ không hoàn thiện để đưa ra thị trương.

2 Likes

Vậy thì cái em cần làm là thử thể hiện những bước đơn giản nhất. Mục tiêu của mình là thể hiện được mình làm được chương trình này. Thời gian mình không có, mình hãy làm một cái demo về tính khả thi gói gọn trong điều kiện hiện tại.

Em nhắn với các bạn mình, đừng bỏ dự án này mà nhảy sang dự án khác. Anh thấy mọi người đã đi một quãng đường khá xa rồi. Từ ý tưởng cho tới hỏi đáp trên này và đến trường của người khiếm thính để hỏi. Trong khi thời gian thì có giới hạn. Các em nên tiết kiệm công sức của mình. Đừng vội nhảy sang một dự án khác mà chưa chắc là có đi được tới mức này hay không.

P/S: Em gọi các bạn lên đây cùng thảo luận xem sao?

1 Like
1 Like

em không có khả năng trong vấn đề kế hoạch hay giải pháp nhưng bản thân em thấy cần tiếp cận với người khiếm thính. Tại sao em lại nói như vậy? Chúng ta muốn biết 1 đứa trẻ thích gì thì chúng ta phải đặt mình vào vị trí của đứa trẻ đó. ví dụ nó sống trong 1 gia đình nghèo bữa đói bữa no thì em chắc chắn rằng điều nó thích là 1 bữa cơm ngon và đủ no mà ko phải thứ đồ chơi đẹp mắt. Tại sao chúng ta không trao đổi với bên nuôi dưỡng, hỗ trợ, làm việc với những người khiếm thính đó để có thể biết cách họ nhận và truyền đạt ngôn ngữ ra sao? Lúc nào cũng muốn làm bác sỹ mà chẳng biết bác sỹ làm gì và như thế nào thì có bao giờ làm được không. Hãy là họ để có thể hiểu được cách họ cảm nhận và sống. Trong một số việc hãy đặt cái tâm lên trên mọi thứ sẽ suôn sẻ hơn. Có thể rất rồi hay bế tắc . vậy tại sao không dung hoà để rồi mượn cái nhìn của họ mà tạo nên chương trình này.

@Honey_moon e vẫn thấy a nên đơn giản hóa vấn đề ạ , tại nếu tìm hiểu quá sâu vấn đề này thì cần rất nhiều thời gian , e vẫn thi thoảng vào quán trà đá có cô chủ là người câm , họ nói chuyện có rất nhiều sắc thái biểu cảm trên khuôn mặt . e nghĩ nếu cần làm demo trong 3 tháng tới , a và nhóm chỉ cần nghiên cứu dịch được ý của cử chỉ là tốt rồi , về lâu về dài có thể dùng thêm các cảm biến để xét tới yếu tố biểu cảm . đó là cả một quá trình dài nghiên cứu để hoàn thiện đấy ạ , chứ e nghỉ 3 tháng mà làm nhiều việc quá sẽ ko thu được kết quả gì . nghĩ thì dài chứ 3 tháng hết nhanh thôi .

1 Like

1 Like

mình chỉ nói đến chuyện chúng ta sẽ thông qua họ để làm đó! khi nào mình câm điếc mình mới biết truyền đạt sao cho dễ hiểu! ý là vậy chứ k phải là làm thành 1 sản phẩm lun! demo chỉ cần là cho ngta biết có thể tạo ra thôi là xong mà. Vậy thì hãy từ cái đơn giản là nhận thức ngôn ngữ của họ. Chỉ cần mình có thể cho họ hiểu là ok.

1 Like

Nhóm của @hopptit đã đến trung tâm người khiếm thính rồi đấy @Honey_moon

Cái khó là phần cảm xúc không thể hiện được với công nghệ và khả năng của nhóm hiện giờ.

1 Like

@Honey_moon vậy e nghĩ các a sẽ hoàn thành được demo sớm thôi . :smile:
@ltd sau 1 tuần không gặp trên diễn đàn e thấy trình độ fun của a tăng ko ít :trollface:

chưa có gì tân tiến bằng con người mà a :stuck_out_tongue: . hiểu được ý của 1 câu nói đã khó , hiểu được cảm xúc còn khó hơn . :sweat_smile:

1 Like

mấy người khiếm thính họ rất tự kỷ. em vẫn đi 1 tháng 1 lần các trung tâm gần nhà. Họ rất xa lạ với biểu cảm . ý em nói là bởi vì họ có ít bạn và k tiếp xúc ngoài cuộc sống. CÁi mà họ nói cho e suốt 6 năm em thăm họ đó là hãy cho họ cơ hội được sống như người bình thường. họ thường nói với em họ cần những công việc để quên đi mặc cảm khiếm khuyết của họ. Hãy cho họ được cùng làm việc với mình. Trước em nghĩ sau này e giỏi e sẽ tạo ra 1 hệ thống tư duy mở cho họ để họ tiếp cận với kiến thức @ltd

2 Likes

Chào mọi người,

Lang thang thế nào lại lạc vào đây, làm mình lại sôi sục những giấc mơ còn giang dở thời sinh viên.

Mình đã nghiên cứu SLR tập trung vào VSL tổng cộng chắc cũng là 3 năm, khá giống bạn sinh viên này, bắt đầu từ năm 2 đại học.

(Không biết bây giờ bạn còn làm không nhỉ, hay từ bỏ rồi nhỉ ).

Trước khi đi vào chi tiết một vài góp ý khi nghiên cứu về SLR mình muốn chia sẻ vài điều:

Dự án của mình là ngược lại với dự án này của bạn. Đó là dịch ngược ngôn ngữ ký hiệu của người câm điếc thành tiếng nói thuần việt.

Sản phẩm của mình đã có thể thực hiện một bài thuyết trình ngắn với điều kiện người dung phải Train trước bài thuyết trình đó.

Các bạn có thể xem Demo tại đây:

Mình từng lang thang đi học ngôn ngữ khiếm thính như một đứa trẻ dưới trung tâm, xây dựng ý tưởng lao đầu vào làm.

Rồi cuối cùng cũng có kết quả thôi J. Kết quả là đạt vài giải thưởng nho nhỏ, một bài báo khoa học nho nhỏ J .Nhưng mình nghĩ kết quả lớn nhất là Những cảm xúc mình nhận được khi cho mấy bé ở dưới trung tâm khiếm tính thử sản phẩm của mình. Và mắt bọn nó đã sang lên như thế nào.

Ngày bảo vệ đồ án tốt nghiệp đại học của mình, mình mời một bạn bị câm ở dưới trung tâm lên Demo sản phẩm. Tuy lúc đó có chút vấn đề với sóng RF nhưng mọi việc vẫn ok, và cả hội trường bất ngờ vì những gì mình làm được, đạt điểm cao nhất toàn khóa bảo vệ đồ án. Mình nói thế để cổ vũ cho bạn trước vì mình biết sẽ rất khó khăn nếu bạn muốn theo đuổi đề tài này.

Về ngôn ngữ ký hiệu việt nam gọi tắt là VSL. Mình xin chia sẻ vài điều như sau.

  • Việt nam chưa có một bộ từ điển thống nhất về ngôn ngữ ký hiệu. Nó khác nhau theo từng khu vực thậm chí từng nhóm người. Hiện ở việt nam có thể chia thành các cụm Ngôn ngữ ký hiệu chính : HÀ nội, hải phòng, Hcm, Đà nẵng, Thuận An (bình dương). Đã có nhiều dự án nỗ lực để thực hiện việc này nhưng nó chỉ ứng dụng cho giáo dục,

  • Chưa có tỉnh phổ cập lớn. Các bạn có thể tham khảo tài liệu của Trung tâm Nghiên cứu Giáo dục Người khiếm thính (CED). Vậy nên các bạn đừng miền man đi sang tạo cấu trúc ngữ pháp của nó. Hãy chọn cho mình một bộ tài liệu chuẩn và theo đó mà làm. Ngôn ngữ ký hiệu có cấu trúc ngữ pháp phức tạp hơn. Nhưng về cơ bản nó vẫn có cấu trúc
    như ngôn ngữ nói nhưng thường thay đổi để nhấn mạnh chủ thể,

Trong dự án hướng đến mở bậc giáo dục đại học cho người khiếm thính ở VN, J. … CED cũng có một bộ từ điên Video và sách đi kèm, được nghiên cứu bởi các nhà ngôn ngữ học…, tâm lý học sư phạm … Khá lớn… J.

Bạn nào có hứng thú có thể liên hệ với mình.

Để dịch ngược lại từ tiếng nói ra ngôn ngữ ký hiệu. Mình có đọc qua THAM VỌNG của các bạn ở trên, nhưng mình thấy nó quá lớn để làm từ đầu đến đuôi. Theo mình các bạn nên tập trung cho cái chính nhất của dự án này và đầu tư mạnh vào nó, không dàn trải sức ra sẽ lãng phí. Xử lý ngôn ngữ tự nhiên từ tiếng nói ra, Phân tích ngữ pháp, xây dựng mô hình người nói. Là những Topic khá bự. Các bạn nên chọn ra cái chính. Còn lại nên sử dụng những thư viện nếu có thể.

Và cũng chấp nhận luôn những hạn chế đó không nên tham lam, Vd ,. Các bạn có thể bắt đàu chỉ nhận dạng những con số.

Trên thế giới mới đây có một nhóm nghiên cứu của ở ĐH bắc kinh thì phải họ đã xây dựng một hệ thống như thế này. Với mô hình 3D.

Chúc các bạn thành công nhé !

4 Likes
83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?