Nhờ mọi người gợi ý cách làm

Em chào mọi người ạ

Em đang làm cái số hoá công văn, công việc là scan công văn giấy, lưu text và file scan vào trong csdl để tiện xử lý sau này, đoạn scan từ ảnh qua chữ thì em làm được rồi (em dùng textscart 4.0), mà bị ngặt cái làm sao để tách được mấy cái đặc trưng của công văn ví dụ như là:

  • Số kí hiệu
  • Ngày ban hành
  • Người ký
  • Mức độ
  • Cơ quan ban hành
  • Ngày có hiệu lực
  • Hình
  • Trích dẫn
  • Nơi nhận

Mỗi loại công văn lại theo một format khác nhau, em chả biết đâu mà lần, mong anh chị giúp đỡ giải quyết vấn đề này ạ.

Dùng máy chạy bằng cơm thôi @@

3 Likes

Thật là 1 sáng kiến mang tầm vóc lịch sử :stuck_out_tongue:

1 Like

Thì với mỗi loại văn bản, bạn lưu thành một template. Nếu gặp lại đúng loại văn bản đó thì chọn đúng template, nó sẽ khoanh những vùng bạn đã đánh dấu. Chứ kiểu gì cũng phải có các giai đoạn chạy bằng cơm.

3 Likes

em cũng tính thế, trường nào mà nó không đọc được thì cho người dùng nhập ạ

83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?