Cách chọn feature dataset

Xin chào mọi người. Hiện tại em đang thắc mắc là em có 1 dataset, data của em có rất nhiều features(id, gender, job, age, height, weight,…)


Ví dụ ảnh trên kaggle.

Em muốn hỏi là làm sao để chúng ta có thể chọn lựa feature cho hợp lý?
Đây là em tìm hiểu được
image
Ý kiến mọi người như thế nào cho em xin ít thông tin thêm.

Thứ 2 là với thuật toán k.mean thì dataset có nhiều feature thì làm sao để mình visualize nó, em thấy có vài ví dụ người ta chọn 2 features ra để visualize, em k rõ cách chọn s người ta lại lấy ra như v.


Cảm ơn mọi người.

9 posts were merged into an existing topic: Topic lưu trữ các post off-topic - version 3

83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?