Cách tìm, tạo dataset cho giai đoạn huấn luyện - Machine learning

hello
mình đang cần tìm hoặc tạo dataset dùng để huấn luyện mà chưa biết tìm ở đâu hoặc tạo như thế nào :smile: Mình đang làm nhận dạng mã thẻ cào điện thoại sử dụng pp học có giám sát svm nên cần dữ liệu mẫu. Trên mạng có 1 dataset 10k ảnh chữ số 0-9 nhưng không biết font chữ đó là font gì, có giống font chữ trên thẻ cào không
Ai có kinh nghiệm về vấn đề này cho mình ý kiến với
thank you

Bạn phải tự tìm nguồn trên mạng, ví dụ Google, sau đó crawl về.
Đầu tiên bạn phải dạy cho.trình detect được vùng mã số, sau đó tách số rồi mới học được như yêu cầu.

Dataset bạn nói vó phải MNIST ko?

Đa số data mình phải tự tìm nguồn mà “chôm” thôi, chủ yếu là crawl.

1 Like

mình cần tìm dataset số 0-9 có font giống font của mã thẻ cào cần nhận dạng, chứ giờ tự lấy thẻ cào rồi tự tạo dataset để huấn luyện thì chắc hết năm quá :joy:
Phân tiền xử lý mã thẻ mình code xử lý ảnh thuần thôi, chứ k dùng deep learning cho tự trích chọn đặc trưng, mình chỉ dùng ml cho phần nhận dạng thôi

1 Like
83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?