Bản chất của PDF format là gì? Nó được view như thế nào?

Hi all,
Mình có câu hỏi như trên.
Các phần mềm view pdf làm việc như thế nào?

Trên các phần mềm như adobe reader, foxit reader thứ chúng ta đang view khi mở file pdf là gì, image, svg hay là 1 thứ khác?
Phần mềm sử dụng 1 file pdf có thể tương tác trực tiếp vào cấu trúc (nội dung) của file không?

pdf cũng tương tự như các format khác như .doc, .ods, .mdb, .rtf, .odt,… là một dạng binary format (nghĩa là không phải text, mở file bằng notepad chỉ nhận được các kí tự vô nghĩa). Việc đọc/ghi pdf được Adobe (Adobe phát minh ra format này) giải thích bằng PDF specification. Thường thì các phần mềm đọc/ghi pdf sẽ dựa vào specification công khai này để đọc/ghi pdf.

Cũng nói thêm, nếu một format nào đó có specification công khai thì còn được gọi là open format. Ví dụ pdf là open format, doc thì không.

(specification = chuẩn. Thường thì một format nào đó phải có một chuẩn chung để các phần mềm đều có thể xử lý được format đó, nếu không thì mỗi phần mềm làm một kiểu, ví dụ Adobe Reader sẽ không đọc được file pdf xuất ra bằng Foxit Reader chẳng hạn)

2 Likes

Với file pdf là ảnh scan sách lên. ( thực chất là hình ảnh) thì muốn xử lý ảnh trong file pdf. Có đọc được ảnh đó ra không nhỉ

Có vẻ như cách duy nhất để view pdf đó là render ra display format (image).

Mình tìm thấy cái này

2 Likes

mình cũng đang cần tìm hiểu về định dạng pdf, cần đọc được và ghi được file pdf, nhưng chỉ với pdf là bản scan sách , nghĩa là nó là ảnh, chứ k có cách thành phần khác như pdf bình thường. có gì tìm hiểu được cho mình xin nguồn tài liệu với
mình tìm được tài liệu này thấy khá đủ

1 Like
83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?