Code PDF Parser cần những gì?

Chào các bạn,

Như tiêu đề, mình muốn viết pdf parser thì cần kiến thức những mảng nào? Tài liệu nào?.
Mình đã google khá nhiều tìm đc mỗi cái pdf specifcations là thấy có giá trị. Đa phần các câu trả lời là “khó lắm, lớn lắm…”. Mình muốn tìm hiểu và thử viết trước khi dùng cái có sẵn.

Ai có kinh nghiệm hoặc từng làm những thứ tương tự chỉ giúp mình.

Cảm ơn các bạn.

Mình tìm thử thì có bộ Adobe PDF SDK dựa trên C. Có hướng dẫn, specs đầy đủ.
Tuy nhiên, khi mình xem các file bên trong bộ SDK thì chủ yếu file .h chứa các function declarations, không có binary files nào cả.

https://www.adobe.com/devnet/acrobat/documentation.html

3 Likes

Try this, mấy cái đầu có rất nhiều sao:

2 Likes

Hi Code Đơ.
Bạn cần biết fomat của file.

1 Like

Cảm ơn mọi người nhiều. Các replies cho mình tìm điểm bắt đầu.

Mình thấy format này rất hay và phổ biến mà có vẻ ít người làm sâu về nó quá.

1 Like
83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?