Chào mọi người,
Em đang gặp vấn đề với bài toán: nhập một chuỗi query, trả về các file (có data sẵn) liên quan đến nội dung vừa nhập. Em có tìm hiểu về thuật toán tf-idf nhưng không biết sau khi mình lập ra ma trận tính toán thì việc tìm kiếm sự liên quan giữa chuỗi query với các file sẽ thực hiện thế nào. Ngoài ra thì có các thuật toán cài đặt khác liên quan đến vấn đề này không ạ?
Mong mọi người giúp đỡ. Em cảm ơn.
Tìm kiếm nội dung trong danh sách files
Mỗi một từ sẽ có điểm tương ứng với tần suất xuất hiện của nó, khi so sánh thì tính điểm này ra, cái nào có điểm cao thì liên quan nhất.
1 Like
Dạ vâng, nhưng anh/chị cho em hỏi thêm là nếu một chuỗi gồm nhiều từ thì mình nên kết hợp điểm như thế nào là hiệu quả ạ?