mình là sinh viên năm cuối.
làm đồ án “tìm hiểu phương pháp phát hiện người đi bộ sử dụng học sâu” . Mình có tìm tài liệu của cái này thấy khá là khó khăn. ai có biết về lĩnh vực này thì chỉ giúp mình với
thank all.
Cần tư vấn đồ án “tìm hiểu phương pháp phát hiện người đi bộ sử dụng học sâu”
Deep Learning hả? Input với Output là gì? Nói cụ thể hơn đi nào?
Nếu input là ảnh, output là trong bức ảnh có người đi bộ hay không: Dùng CNN cơ bản(có thể sài mấy mô hình như AlexNet hay Vgg16/Vgg19 nếu thích). Đây là Classification Problem.
Nếu input là Video, output là Video có nhận biết người đang đi bộ hay không, giống như trong Video này: https://www.youtube.com/watch?v=4eIBisqx9_g
Trường hợp này thì phiền phức rồi: Đây là Obect Detection Problem. Hỏi giáo sư là có thể sử dụng Model đã TRAIN rồi được không, hay phải tự Build model từ đầu rồi tự Train?
Vì nếu muốn tự Train từ đầu đòi hỏi một nguồn Data đầu vào rất lớn, máy tính cực khủng(cân nhắc AWS hoặc MS Azure thử xem), chứ Google Colab chỉ có 12GB RAM, sẽ bị tràn bộ nhớ khi Train là cái chắc.
Nếu sài MODEL đã train rồi thì dễ òm. Nhưng như vậy thì chẳng còn gì để nghiên cứu nữa. Giống như mua đồ ăn sẵn ngoài chợ về rồi đưa cho giáo sư vậy, cóc cần động tay động chân chế biến gì…
Nếu là Object Detection thì bạn có thể tham khảo 2 khoá học này của Udemy(10$/ Khoá): Deep Learning: Advanced Computer Vision và Deep Learning and Computer Vision A-Z™: OpenCV, SSD & GANs