Em đang sử dụng tính năng sau của MLKit (Google) để quét và nhận dạng tài liệu:
ML Kit | Google for Developers
Tuy nhiên nó thiếu sự tùy biến về giao diện Camera, chọn ảnh và thiếu hỗ trợ trên IOS.
Nên em tìm hiểu và muốn làm chức năng tương tự và phù hợp hơn với nhu cầu của mình.
Dưới đây là một số dữ liệu mẫu, với ảnh bên trái là đầu vào, và bên phải là đầu ra đúng theo kỳ vọng
Do nền tảng về AI chưa nhiều nên em khó khăn trong việc phân tích các bước cần làm, thuật toán liên quan có thể hỗ trợ.
Các bước xử lý của thư viện theo cá nhân nhận định:
- Nhận diện các góc (Corner detection)
- Cắt ảnh theo những góc đã nhận diện
- Perspective Transformation
- Tự động loại bỏ các vết bẩn, tự động xoay và lọc màu
Ở bước 3 & 4 em chưa biết nên dùng những thuật toán nào, những bước nào cho hiệu quả đối với loại đối tượng là tài liệu.
Kính mong được mọi người giải thích và gợi ý thêm.
Chân thành cảm ơn