Hỏi về vấn đề nhận diện ý nghĩa câu

Em muốn làm 1 công cụ kiểu dạng phân tích ý nghĩa của từ ngữ và lấy ra số liệu.
Ví dụ: “Cho tôi đặt mua 5 quyển sách dạy lập trình Java ạ,giao cho em địa chỉ đường A,Quận B nhé!”
Giờ em muốn phân tích ra được ra các danh mục:
Số lượng:
Loại:
Địa chỉ:

Thì tìm hiểu thư viện hay thuật toán nào hỗ trợ nhanh nhất ạ.

2 Likes

Mình cũng quan tâm vấn đề này

Trợ lý Google (Assistant) chưa chắc hiểu thông suốt hết. Bố/mẹ nó là Google mà nó vẫn đang “học” để hiểu những câu đơn giản thế đấy.

3 Likes

Nếu bạn làm cho domain nhỏ cụ thể (ví dụ như chỉ bán sách) thì có thể sử dụng regex là có thể giải quyết được hầu hết các trường hợp rồi, tốt tới đâu thì do cách bạn làm. Nhưng rất khả thi nếu bạn làm cho domain hẹp.

  • (?:mua )?(\d+) (?:cuốn|quyển)
  • (sách 1|sách 2|…)
  • (?:số|đường|địa chỉ) (…)

Nếu domain open hơn thì bạn tìm hiểu bài toán NER (Named Entity Recognition). Làm bài toán này thì bạn phải làm dữ liệu cực đấy. Bạn tham khảo 1 open source của bài toán này

8 Likes
83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?