Output của deep learning (CNN) có phải là 1 file chứa ma trận điểm để nhận dạng?

Em đang tìm hiểu về ConvNet cho phân loại ảnh nhưng xem 1 số example vẫn chưa hiểu 1 số chỗ, nhờ các anh (chị) thông não giúp em:
1/Khi training xong có phải ta sẽ có 1file .File này sẽ là đầu vào + với ảnh muốn nhận dạng để ra kq ko?
2/CNN khác gì với các thứ như AlexNet, VGG16, MobileNet. Được biết nó là pre-trained. Mà pre-trained là models dc training sẵn, nhưng em đọc thấy nó như là các biến thể của CNN.
Em đang thắc mắc chưa tìm được câu trả lời, mong anh (chị) nào biết giúp em với. Em cám ơn nhiều.

Không, Nó chỉ là trọng số

Về chung chung thì nó giống nhau, chỉ khác nhau về kết cấu mạng, các thành phần của mạng

bạn có thể hiểu đơn giản thế này (tất nhiên là đơn giản thôi)

a1x1 + b1x2 + c1x3 = d1
a2x1 + b2x2 + c2x3 = d2
a3x1 + b3x2 + c3x3 = d3

(x1, x2, x3) là dữ liệu đầu vào
(d1, d2, d3) là kết quả mình mong muốn
a1…c3 là bộ trọng số, Mình cần tìm bộ này sao cho cái hệ phương trình trên nó ra kết quả (d1, d2, d3) tốt nhất.
Vì thế mà tùy vào kết cấu từng loại mà có các bộ trọng số và thiết kế khác nhau

2 Likes

merged and moved by noname00

83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?