Xin ý kiến, gợi ý giải pháp về vấn đề xử lý nâng cao chất lượng tài liệu scan (pdf file)

Hello.
Kì học tới, theo quy định mình cần phải làm 1 project nho nhỏ tại trường.
Mình tính sẽ chọn làm project liên quan đến xử lý ảnh. Cụ thể là nâng cao chất lượng tài liệu scan định dạng pdf.
Tài liệu như các sách, vở văn bản được scan thực chất là các ảnh chụp sau đó lưu lại với định dạng pdf. Có lúc tài liệu có chất lượng rất tốt nhưng có lúc lại rất khó xem. 1 ví dụ như sau


Từ đây mình mới có ý định làm đề tài này
Vì sau khi đăng ký đề tài thì sẽ không được đổi đề tài. Mà chưa làm thì chưa biết có thành công không. Nên mình muốn hỏi bạn nào đã và đang làm về xử lý ảnh có thể cho mình lời khuyên. Để từ đó mình đánh giá và quyết định xem có nên thực hiện đề tài này không. Phòng trường hợp đề tài fail :smile: (dù gì cũng liên quan đến điểm số) . Nếu làm tự do thì mình không đắn đo lắm. Làm rồi nghiên cứu từ từ sẽ rõ. Nhưng vì đây là đề tài chấm điểm nên mình cũng ngại liều :smile:
Xem ảnh thì mình thấy có thể sử dụng pp biến đổi hình thái học để xử lý.
Mình đã thử xử lý 1 vài trường hợp

Nhưng khó đáp ứng được với tất cả các file đầu vào. Có nên chọn ra 1 tập mẫu các file có hiện trạng gióng nhau để xử lý?

CHIẾU TƯỚNG:

  • Theo các bạn đề tài có khả thi không?
  • Nếu khả thi thì còn pp nào có thể áp dụng?
    Thank you.

@Duong_Act anh cho em xin ý kiến với ạ. Tks :slight_smile:

Sau khi em học xủ lý ảnh ở trường thì em nghỉ nếu chỉ trắng đen thì có thể dùng phân ngưỡng. kèm theo đó là dùng thuật toán khử nhiểu và làm trơn(có thể dùng cho màu). có thể dùng openCV hoặc matlab…

1 Like

Phân ngưỡng chỉ làm mất chi tiết ảnh. Không thể bổ sung thông tin cho đối tượng được. Mà mình nghĩ xử lý cái này cần cả 2. Ảnh tài liệu scan thì chỉ có đa mức xám, hoặc đen trắng thôi bạn, mình chưa tìm hiểu về cấu trúc file pdf nên không rõ là loại nào nhưng chắc không phải ảnh màu.

help help :smile: :smile: :smile:

Cái này chắc AI mới gặm được mất :scream::cold_sweat:

2 Likes

Dùng OCR thì quá tay rồi bác. Giống như tác vụ đọc image chụp từ camera, chuyển image thành text. Rồi từ text sinh ra PDF.

1 Like

Mình tìm hiểu thấy

với ảnh pdf kiểu scan này thì khó dùng orc rồi nhẩy

pp biến đổi hình thái học không khả quan hả anh?

Cái này phải AI trở lên vì bạn xử lý kiểu kia thì thì như tăng black lên thôi

2 Likes

Nến bạn muốn làm xử lý ảnh thì hay là làm tiếp đề này xem https://kipalog.com/posts/Nhan-dien-khung-truyen-manga-voi-OpenCV , hôm sau mở web xem manga luôn :smile:

1 Like

Trường mình, mấy thầy cô khoa mình không hứng thú với đề tài sử dụng thư viện có sẵn lắm. Thà code thủ cộng nhưng tệ vẫn cao điểm hơn ngon lành nhưng lại dùng thư viện. Mình tính làm cái gì mà tự code được ấy :3 Vậy là đề tài này không khả thi, AI thì giờ mình cũng mới chỉ có kiến thức cơ bản nên chắc không làm được

1 Like

Input là pdf là loại dữ liệu mang rất nhiều thông tin : chữ in, chữ viết tay, thư pháp, ảnh… và không thể áp dụng một phương pháp nào đó cho mọi loại đối tượng, trường hợp được vì nó sẽ không hiệu quả.

Hình thái học có thể xử lý tốt với những nét mảnh như ký tự nhưng hình ảnh không phải lúc nào cũng dùng được. Cái khó nhất trong đề tài này là bước phát hiện đối tượng và mức độ chất lượng bị giảm. Qua được bước này mới xác định được phương pháp xử lý là dùng hình thái học hay là phương pháp khác.

2 Likes

Em có thể giới hạn đề tài là truyện hay tiểu thuyết chẳng hạn, toàn chữ :V Anh có thể cho e vài gợi ý nếu làm về xử lý ảnh được không ạ. Đơn giản nhưng không quá nhạt nhòa, vì e phải tự code T.T Có mấy ý tưởng thì trên mạng có hết rồi :3

Vậy thì né mấy dạng ảnh, thư pháp… chơi toàn chữ in thôi thì có thể ăn được.

Hay là làm mấy đề tài xử lý ảnh hỗ trợ công nghiệp cũng hay. Giờ mấy cái đó phải mua của nước ngoài đắt cắt cổ ra :slight_smile: Ví dụ:

Phát hiện bao bì in bị lỗi, chữ bị mất nét, bị nhoè.
Phát hiện việc lắp ráp linh kiện (bản mạch điện tử đi) lắp ráp bị sai.
Phát hiện chi tiết bị vỡ, xước.
Phát hiện sản phẩm quên dán tem, dán sai loại tem.

3 Likes

E nghe thấy xa xôi quá ạ T.T

Không xa xôi đâu. Mấy cái mình nêu đang rất cần cho công nghiệp. Hiện tại có một số hãng phát triển như Keyence nhưng giá vài chục đến vài trăm củ 1 sản phẩm nhưng chức năng vẫn bị hạn chế. Nên nếu mình làm ngon có lẽ nó không dừng lại ở dạng đồ án nữa. Cố lên :slight_smile:

2 Likes

E đang là sinh viên nên mấy cài này chưa tiếp xúc nhiều, chưa thấy được vấn đề với lại kiến thức còn non nên chắc không làm được mấy dạng này :3

83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?