Chào anh chị diễn đàn, em đang làm bài tập lớn môn Trí tuệ nhân tạo, đề tài tự chọn là Phân loại trang web (có một tập trang web và ta phải gán nhẫn cho nó thuộc lĩnh vực nào), phương pháp sử dụng là phân lớp Naive Bayes. Phần này thuộc học máy ở cuối môn mới học, nên em muốn hỏi a/c cho em xin hướng đi trước a/c nào có kinh nghiệm về lĩnh vực này hoặc đã học các môn này cho em hỏi chút là:
Đầu vào của bài toán chỉ là một tập các từ khóa được mình tìm hiểu và tổng hợp sẵn từ các trang web (ghi ra file text) hay là phải dẫn đương link của chính trang web đó vào ạ? Nếu dẫn đường link thì ta tách từ khóa ra để cho máy học kiểu gì ạ :3
Em cảm ơn!