Chào anh chị diễn đàn, em đang làm bài tập lớn môn Trí tuệ nhân tạo, đề tài tự chọn là Phân loại trang web (có một tập trang web và ta phải gán nhẫn cho nó thuộc lĩnh vực nào), phương pháp sử dụng là phân lớp Naive Bayes. Phần này thuộc học máy ở cuối môn mới học, nên em muốn hỏi a/c cho em xin hướng đi trước
a/c nào có kinh nghiệm về lĩnh vực này hoặc đã học các môn này cho em hỏi chút là:
Đầu vào của bài toán chỉ là một tập các từ khóa được mình tìm hiểu và tổng hợp sẵn từ các trang web (ghi ra file text) hay là phải dẫn đương link của chính trang web đó vào ạ? Nếu dẫn đường link thì ta tách từ khóa ra để cho máy học kiểu gì ạ :3
Em cảm ơn!

. Có thể bạn không biết cách lấy nội dung từ một trang web sao nhưng khi có văn bản thì chắc chắn bạn biết tách và lọc từ ra
Chưa từng học qua môn này (vì tự học) nhưng từng học qua “Xây dựng một web search engine” nên mình thấy vấn đề của bạn không khó lắm. Nếu bạn không biết cách implement thì bạn nên xem qua khóa học CS101 miễn phí này của Udacity.

83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?