Hỏi hướng giải quyết bài toán nhận diện và đếm số lượng bút bi trên ảnh

Dạ em chào các mọi người. Em có 1 vấn đề muốn tham khảo ý mong mọi người giúp đỡ ạ.
Việc là em muốn tạo phần mềm nhận diện 1 chiếc bút bi và khoanh tròn nó lại và in ra số lượng chiếc bút có trên hình ảnh. Mọi người cho em xin hướng giải quyết với ạ.
Em xin cảm ơn

Bạn làm việc đó như thế nào khi không dùng phần mềm thì làm rồi quay clip lại đưa vào phần mềm là xong.

Dạ, phương pháp làm theo em biết thì 1 là dùng mô hình học máy để training, 2 là dùng coutor để vẽ đường viền rồi xử lý tính toán xem nó có phải là hình dạng của bút bi hay không. Nếu là phương pháp 2 thì dễ bị ảnh hưởng bởi độ sáng, vật thể xung quanh ( vật thể có viền tương tự). Nếu giải pháp 1 thì em vẫn chưa có hướng đi cho giải pháp này ạ

Công đoan chính là “nhạn diện” vật thể mình cần, còn việc khoanh tròn hay đếm thì là các thông tin kèm theo khi vật thể đã được xác định thôi

Ví dụ như hình.

Keyword để bạn tìm kiếm là “object detection”, “computer vision”
Tutoroal tiếng Anh/Viet đều có nhiều, model có sẵn luôn, chỉ cần bỏ vô và xài theo ý mình thôi

Còn nếu bạn muốn tự mình tìm mẫu, train model để có data của riêng mình thì e là sẽ tốn nhiều thời gian và công sức, mà chưa chắc ngon hơn đồ có sẵn

Dạ, nhưng nhận diện bút bi thì trên một số model hiện có sẵn như YOLO thì không có ạ. Nên một số vật thể cụ thể em muốn như bút bi thì lại không có ạ.

My dear, if you want to have a ready-made model for object detection, you will have to wait a lifetime. It is a highly complex process involving AI/deep learning. It also depends on the algorithm you want to apply. That alone requires you to understand the different object detection algorithms - at least superficially.
Objects are individual and differ from the others by certain characteristic features that you need to figure out. Even so, a ready-made thing will never exist for long because it changes dynamically with time or position. That is the only reason why deep learning is used in object detection. Even if you somehow master the technique, there are still some shortcomings that make object detection difficult.
Autonomous car driving? :rofl: still in its infancy. And facial recognition (or whatever you plan on doing) is the same. The camera surveillance on every street corner in China is still unreliable and has to rely on the human to make the final decision.
The Vietnamese language is NOT a language for R&D work. If you want to work in IT, you have to search and research on the Internet in English. For such work in Vietnamese, the chance of getting useful tips is almost zero

bạn phải có dataset đủ lớn để trainning cho tốt, chứ ít data quá dễ overfitting.

83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?