PDF的文件結構及格式特點

印前頻道 - PDF 來源:設計在線 作者:cpcool 2010-10-18

    PDF(Portable Document Format)由Adobe公司所開發(fā),是一種不論用何種類型的計算機均可閱讀的文件格式。PDF文件包含一個PDF文檔和其它支持數據。一個PDF文檔包含一個或多個頁面,每個頁面包含與設備和分辨率無關的文字、圖形和圖像的任意組合,被稱為頁面描述。文檔還可以包含一些只有在電子讀物中才存在的信息,如超文本鏈接、聲音和動畫等。除了PDF文檔之外,PDF文件中還包含一些其它信息,如:文件中使用的PDF規(guī)范的版本號,文件中重要結構的位置。

        為了更好地理解PDF文件,可把PDF文件分解成四個部分。

        第一部分是PDF的對象,PDF的對象是一組基本對象類型。這些類型絕大部分與PostScript語言使用的數據類型對應。PDF支持很多種基本的數據類型:布爾型、數字、字符串、字面名、數組、字典和流,另外還有一種空對象。在PDF文件中,經常給一些對象賦予一個標簽供其它對象調用,這種有標簽的對象稱為間接對象。
        第二部分是 PDF的文件結構。PDF的文件結構決定了對象在 PDF文件中的存儲方式、訪問方式和更新方式。后面將詳細分析。
        第三部分是 PDF的文檔結構。PDF的文檔結構指定了怎樣用基本對象類型來表示 PDF的文檔成分,包括:頁面、注解、超文本鏈接、字體等。 
        第四部分是 PDF的頁面描述。頁面描述指的是頁面上包含的與設備和分辨率無關的文字、圖形和圖像的任意組合。PDF的頁面描述可不依賴于PDF的其它部分而被單獨地解釋。

       1、PDF的文件結構
      PDF的文件結構(即物理結構)包括四個部分:文件頭、文件體、交叉引用表和文件尾。文件頭指明了該文件所遵從的 PDF規(guī)范的版本號。它出現在 PDF文件的第一行。如%PDF-1.2,表示該文件符合PDF-1.2規(guī)范。
      文件體由一系列的PDF間接對象(inDirectob Ject)組成。這些間接對象構成了PDF文件的具體內容如字體、頁面、圖像等等。
      交叉引用表則是為了能對象接對象進行隨機存取,而設立的一個間接對象地址索引表。文件尾聲明了交叉引用表的地址,指明文件體的根對象(cata-log),還保存了加密等安全信息。根據文件尾提供的信息,PDF的應用程序可以找到交叉引用表和整個PDF文件的根對象,從而控制整個PDF文件。
 
        2、PDF的文檔結構
        PDF的文檔結構是PDF文件內容的邏輯組織結構。它反映了文件體中間接對象間的等級層次關系。PDF的文檔結構是一種樹型結構。樹的根節(jié)點就是PDF文件的根對象。根節(jié)點下有四個子樹:頁面樹(Pages tree)、 書簽樹(outline tree)、線索樹(Article tree)、名字樹(Named Destination)。其中在頁面樹中,所有頁面對象都在樹的葉子節(jié)點,樹中的子節(jié)點將繼承父節(jié)點的各屬性值作為相應屬性的缺省值。書簽樹中則按樹型層次等級關系將書簽(Book mark)組織起來。書簽建立了書簽名與一個具體頁面上的位置的關聯,它使得用戶可以按書簽名字來訪問文檔的內容。由于書簽可以有層次,能用來組織文檔的目錄,所以有時又將書簽樹稱作目錄樹。線索樹則將文章線索及線索下的文章塊(Article head)按樹型結構組織起來進行管理。

聲明:站內網友所發(fā)表的所有內容及言論僅代表其本人,并不反映任何網站意見及觀點。

全部評論

暫無相關推薦