Chào mọi người, em đang chuẩn bị xây dựng một hệ thống gợi ý sản phẩm bằng hình ảnh dựa trên tập dữ liệu em tìm trên Kaggle gồm 44 k ảnh và 141 class. Em đã tìm hiểu và lên ý tưởng cho hướng phát triển nhưng em không chắc là nó đúng nên em muốn lên đây để nhờ mọi người gợi ý ạ.
- Xây dựng pretrain model (VGG16, VGG19, RESNET50,…) bỏ lớp cuối dùng để nó cho output là vector đặc trưng của mỗi input hình ảnh.
- Chia tập dữ liệu hình ảnh thành 2 phần train và test.
- Đưa tập dữ liệu train cho model để lấy ra vector đặt chưng và lưu danh sách vào dưới dạng file
- Khi người dùng mỗi tìm một hình ảnh (Input), dùng model để chiết xuất vector đặt chưng của hình ảnh đó và so sánh với danh sách các vector đặt chưng của tập train bằng metric là Cosine
- Lấy ra k hình ảnh có metric là lớn nhất.