PDF檔案格式中文嵌入現(xiàn)況與問題探討(下)

印前頻道 - PDF 來源:設(shè)計在線 作者:cpcool 2010-12-23

    五、亞洲字型嵌入現(xiàn)況

    一、字型編碼說明:

    亞洲字型要嵌入PDF檔案,比英文字型的嵌入需要更多的軟體,以及更復(fù)雜的技術(shù)。在此之前我們必須說明亞洲字型以及英文型的差異點(diǎn),以及其在不同平臺上的差異點(diǎn)。在亞太地區(qū),雖然都有使用漢字,但每個國家或地區(qū)所使用的內(nèi)碼都不相同,茲就各地區(qū)的編碼介紹如下

    (一)臺灣地區(qū)

    1.Big5:俗稱大五碼

    2.Big5plus:Big5擴(kuò)編碼

    3.CNS11643:中文標(biāo)準(zhǔn)交換碼

    (二)中國大陸

    1.GB2312-80:通稱國標(biāo)碼

    2.GBK:漢字內(nèi)碼擴(kuò)展規(guī)范

    (叁)日本

    1.ShiftJIS

    2.EUC-JIS

    (四)韓國

    1.KSC5601

    (五)其他:

    二、編碼原則:

    1.文字之選擇及字體悉依"國字標(biāo)準(zhǔn)字體表"為基準(zhǔn)

    2.以2個位元組(byte)為中文碼編碼單位,并以16進(jìn)位制之文數(shù)字表示之

    3.符合CNS5205及CNS7654之通信定則

    4.依字之使用頻率而編排於各不同的字面

    5.每字面按先筆劃後部首的排列順序來編訂字碼

    三、CID字型與TrueType字型,PostScript字型的關(guān)系:

    CID是取自於CharacterID的縮寫,此字元辨識碼的功用在於幫助檢索及取用字元,大量改進(jìn)了其使用效能,此種方法最適合用於龐大的字體集如東方雙位元文字-中文、日文、韓文等。Acrobat并非一定需要使用CID字型,亦可以使用TrueType字型,但在使用TrueType字型時若在印表機(jī)驅(qū)動程式字型選項中若選擇將字型傳送為Type1時,則嵌入於PDF中的中文字無法再做增字的動作,而選擇將字型傳送為Type42時,則嵌入於PDF中的中文字可修改增減(修改時系統(tǒng)中需有相同的字型)。中文PostScript字型目前尚無法適用於PDF檔案格式。

    內(nèi)嵌字型的最大優(yōu)點(diǎn)便在解決文件產(chǎn)生者與輸出者之間字型不同或?qū)?yīng)錯誤的問題,現(xiàn)在PS流程是用字碼對應(yīng),且必須是同一家字型公司的同一系列版本才可對應(yīng),字型內(nèi)嵌可將此問題一勞永逸的解決。

    四、AcrobatReader能顯示包含CJK文字的PDF檔案的方式:

    要顯示CJK文字,有兩種方式。

    一是在建立PDF檔案時,作者可以嵌入所有文件中使用到的字體,包含CJK字體,只要字體可以被嵌入就行。任何語言版本的AcrobatReader都可以用嵌入的CJK字體來顯示PDF檔案。但是因為嵌入字體的PDF檔案可能會占太多空間,所以作者可能在建立檔案時選擇不嵌入文件中使用的所有字體,這是第二種方式;如果在這種情況下,Acrobat或AcrobatReader的使用者若要查看該P(yáng)DF檔案,就必須使用正確的亞洲文字字體集。

    五、目前亞洲字體集中所包含的字體:

    目前有四個亞洲字體集(繁體中文、簡體中文、日文與韓文)中,每個都包括有serif與sans-serif字體。而PDF檔案中嵌入的亞洲字體的類型,在Windows平臺上可嵌入TrueType字體,而在Macintosh與Windows平臺上可以嵌入CID格式的AdobePostScript字體。較舊的OCF格式的PostScript字體不能嵌入,此外,文件中的字體必須容許嵌入。<注叁>

    嵌入字體使PDF檔案大小改變的因素取決於文件所包含的字體數(shù)量及字元多少。大體而言,一般文件中每嵌入一個C、J或K字體,PDF檔案的大小就會增加2MB到3MB。Macintosh版Acrobat1.0中的「MakeCID」可將TrueType字體與較舊的OCF格式的PostScript字體轉(zhuǎn)換成「Width-Only」(僅具寬度資訊)的CID字體。這些CID字體僅包含TrueType或OCF字體中使用的羅馬字元的寬度資訊,Distiller在建立參考原始TrueType或OCF字體的PDF檔案時,需要用到這種字形。如需更多資訊,請參閱「MakeCID」公用程式資料夾中的文件。如需在羅馬語言的作業(yè)系統(tǒng)中建立包含CJK文字的PDF檔案,僅具寬度資訊的CID字體就可派上用場。

    對於在羅馬語言的系統(tǒng)上建立包含CJK文字的PDF來說,Acrobat中的PDFWriter是不能在羅馬語言的作業(yè)系統(tǒng)上建立包含CJK文字的PDF檔案的。然而,如果Distiller可以使用它所要制作的PostScript檔案中所參考的字體,那麼Distiller就能建立含有CJK文字的PDF檔案。如果PostScript檔案含有嵌入的TrueType字體,您就可以在任何平臺上制作此PostScript檔。此外,針對目前AdobeTypeLibrary中的所有CJK字體,以及Macintosh或Windows系統(tǒng)中常見的TrueType字體,Distiller都附有「Width-Only」的CID字體。有了這些字體資訊,Distiller將可以在任何平臺上均可成功制作PostScript檔案。此外,如果制作的PostScript檔案中有其他的字體需要轉(zhuǎn)換,還可以用「MakeCID」公用程式建立僅具寬度資訊的CID字體。

    六、中文繁體字嵌入現(xiàn)況以及其所面臨的問題

    目前來說,支援中文PDF檔案字型內(nèi)嵌的字集在Mac上只有文鼎的CIDATM字型;在PC上有文鼎的CIDPostScript字型,以目前面臨的問題來說,第一就是檔案大小,第二就是目前在網(wǎng)路上使用的USER并未普遍在個人PC上安裝相關(guān)的瀏覽軟體。特別是亞洲字型,除了瀏覽軟體外,還必須加裝亞洲文字字集方可開啟嵌入亞洲字型的PDF檔案。

此外在印刷業(yè)上尚未能使用PDF檔輸出的做法。

 

    七、未來解決方案

    PDF檔案是一種非常具有發(fā)展?jié)摿Φ臋n案格式,舉凡各種格式的圖文檔案,皆可轉(zhuǎn)成PDF檔,未來無論是Microsoft系列的軟體、Corel系列、Adobe系列,都將支援PDF檔案格式的產(chǎn)生、修改、編輯以及輸出。但就目前來說,除了AdobeAcrobat系列有完整的功能以外,其他軟體的功能都還尚未健全,而且其他相關(guān)應(yīng)用軟體的種類太過繁雜,有待相關(guān)的軟體開發(fā)公司開發(fā)出更具整合性的應(yīng)用軟體。而檔案大小的問題,只有兩個方法,治標(biāo)的方法為將PDF以更高的比例壓縮,以利傳輸;而治本的方法還是必須一方面開發(fā)更寬頻的網(wǎng)路;一方面使之更普及,以利大量的資料在網(wǎng)路上傳輸。

    八、結(jié)論

    PDF檔案格式并非Acrobat特有的檔案格式,例如華康的DynaDoc檔案格式亦為可攜式文件的一種,其大致上的特性與Acrobat的PDF檔案格式相近,只是功能上有些許的出入。但基本上的目的、用途、產(chǎn)生方式以及瀏覽方式是非常相近的。

    PDF檔案尚有相當(dāng)大的研發(fā)以及應(yīng)用空間,例如在電子報方面,就是一個非常好的PDF檔案應(yīng)用實例,因為一般的電子報大多只有大量的文字,缺少圖片以及活潑的版面,使得閱讀者在瀏覽電子資訊時,會覺得面對滿版僵硬的文字,而降低閱讀的意愿;如果能將電子報編排成一般報紙的版面,以PDF檔的格式表現(xiàn)在讀者面前,如此有了活潑的版面以及圖片,一定會增加使用者閱讀的意愿;另外,PDF檔第二層的超連結(jié)功能亦可讓使用者從頭條標(biāo)題上直接連結(jié),將頁面導(dǎo)引到報紙的內(nèi)文中,而省去了逐頁瀏覽的時間。當(dāng)然了,這部分的構(gòu)想還得等使用者習(xí)慣於以AcrobatReader閱讀檔案,以及各種問題解決後,才能進(jìn)入實驗及應(yīng)用階段,這將是另一個網(wǎng)路出版的新出路。

   

聲明:站內(nèi)網(wǎng)友所發(fā)表的所有內(nèi)容及言論僅代表其本人,并不反映任何網(wǎng)站意見及觀點(diǎn)。

全部評論

暫無相關(guān)推薦