《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > PostScript文件與PDF文件間數據轉換
PostScript文件與PDF文件間數據轉換
來源:微型機與應用2013年第11期
孫 殷1,王 鵬2
(1.浙江商業職業技術學院,浙江 杭州 310053;2.浙江工業大學,浙江 杭州 310014)
摘要: 針對可變數字印刷中常用的頁面描述語言及其文件格式,通過研究PostScript文件結構和PDF文件結構,介紹了如何實現PostScript文件與PDF文件間的數據轉換,給出兩種文件間轉換算法流程圖,并利用PostScript解釋器Ghostscript提供的API接口,實現了PostScript文件和PDF文件間的轉換。轉換結果表明,該轉換算法轉換效果比較好,實現了所見即所得。
關鍵詞: PostScript pdf 數據轉換
Abstract:
Key words :

摘  要: 針對可變數字印刷中常用的頁面描述語言及其文件格式,通過研究PostScript文件結構和PDF文件結構,介紹了如何實現PostScript文件與PDF文件間的數據轉換,給出兩種文件間轉換算法流程圖,并利用PostScript解釋器Ghostscript提供的API接口,實現了PostScript文件和PDF文件間的轉換。轉換結果表明,該轉換算法轉換效果比較好,實現了所見即所得。
關鍵詞: PostScript;PDF;數據轉換

 在可變數據印刷系統中,每個電子頁面的內容(如文字、圖形、圖像)經過頁面描述語言合成后產生相應的可變數據印刷頁面,最終形成特定的數據文件。PostScript文件(簡稱PS)和PDF文件是目前存儲可變數據印刷頁面常用的文件格式,因此,研究這兩種文件格式之間的數據轉換對可變數據印刷的發展具有一定的意義。而當前PS文件與PDF文件之間的轉換主要有兩種方式[1]:(1)通過專業的軟件(如Acrobat Distiller)轉換;(2)通過虛擬打印機來實現。
 但是這兩種方式都不利于自主研究數據印刷系統的開發。本文根據PS文件格式和PDF文件格式的特點,利用PS解釋器Ghostscript提供的API接口,通過VC6.0實現了PS文件和PDF文件的相互轉換,并給出相應的代碼。
1 PostScript和PDF文件結構
1.1 PostScript文件

 PostScript是由Adobe公司開發的頁面描述語言,其最大特點是可以將印刷品中包含的文字、圖形、圖像、字體和顏色等各種元素用一種計算機數據來表現和描述,然后經過RIP(光柵圖像處理器)快速地解釋為可控制打印設備輸出用的點陣信息。用PostScript語言所描述的頁面文件稱為PS文件,其后綴名為.ps或.eps。
 PostScript程序可訪問的所有數據都是以對象(Object)形式存在的[2],對象由操作符產生、管理和撤銷。常用的對象有整數和實數、布爾型、數組、壓縮數組、串、名字、字典等[3-4]。程序中的數據存儲在堆棧中并通過堆棧被操作符管理執行。
 PostScript語言解釋器對語句的執行是逐句解釋執行,控制比較靈活,一切操作均通過堆棧進行。例如用粗線畫一個圓:
%%Title:用粗線畫一個圓
/inch{72 mul} def
4.25 inch 5.5 inch
2.5 inch
0 360 arc                                
1.75 inch setlinewidth
stroke
showpage
 以‘%’開頭的第一段語句表示注釋,第二段語句定義了名字對象‘inch’,接著定義圓的中心位置(4.25,5.5),半徑2.5;然后畫角度為360°的圓;最后定義粗線的寬度1.75,畫出粗線的路徑進行顯示。
1.2 PDF文件
 便攜式文件格式PDF(Portable Document Format)是Adobe公司繼PostScript后于1993年推出的一種電子文件格式[5]。它具有能夠完整地保存任何原文檔中的文字、格式、顏色、圖形、可加密等優秀特性,廣泛應用于數據印刷系統中。
 PDF文件主要由四部分組成:文件頭(Header)、文件體(Body)、交叉引用表(Cross-referrence table)和文件尾(Trailer)。PDF作為一種結構化的文件格式,它是由一些具有特定數字標號的“對象”的模塊所組成。其文檔結構是一種樹形結構,通過文件尾(Trailer)可以找到文件體的根對象Catalog[6],根對象包含PDF文檔的大綱(Outline)、頁面組對象(Pages Tree)等。文檔結構具體層次關系如圖1所示。

 其中頁面對象(Page)作為PDF中最重要的對象,包含了該頁面的文字、圖片、頁面大小等信息。頁面中包含的信息是包含在一個稱為流(stream)[7-8]的對象里,這個流的長度(字節數)必須直接給出或指向另外一個對象。
2 文件格式轉換算法的實現
 根據前兩節的PostScript文件結構可知,要實現PS文件到PDF文件的轉換,首先需要對PS文件中的不同信息(文字、圖形和圖像等)進行解析,然后轉換為對應的PDF對象。兩者間轉換的總流程主要為:
 (1)導入要轉換的PostScript文件,初始化PS解釋器;
 (2)開始掃描PS文件,記錄當前代碼段所在頁。判斷頁信息是否已經到末尾,是則退出,否則繼續向下掃描;
 (3)讀取PS頁面描述信息,對其中的文本信息、圖形信息和圖像信息分別進行提取并處理;
 (4)將第三步中處理的文本、圖形和圖像信息進行重構,然后分別轉換為相對應的PDF對象;
 (5)判斷PS文件是否掃描結束,是則回到第(2)步,否則回到第(3)步;
 (6)轉換算法結束。
 圖2為PS文件轉換為PDF文件的總流程圖。

 由于PostScript文件對文本、圖形和圖像的描述機制各不相同,因此,其相應的信息提取算法也不盡相同。在PostScript文件中,圖像是取樣值的矩形數值,每個取樣值表示某種彩色。按行或者列掃描圖像矩形所得的一串取樣數據定義了一個圖像。除了矩形數組之外,PS程序中還包括一些圖像參數:源圖像的格式、圖像取樣數據的數據源、圖像空間坐標等。因此,對PS文件中圖像的提取主要是將圖像的參數和圖像取樣數據進行提取,其對應的提取算法流程圖如圖3所示。

 在標準的PostScript文件中,文本大都是以字庫[9]的形式進行保存,因此在PostScript中的字符可以由PS解釋器根據字庫提取出對應的字符。對PS文件中文本信息的提取流程如圖4所示,主要過程如下:
 (1)掃描文檔,記錄當前頁面信息。判斷是否已掃描到文件尾,是則跳轉到第(5)步,否則跳到第(2)步;
 (2)繼續掃描,判斷是否掃描到文本提示符,是則跳到第(3)步,否則跳回第(1)步;
 (3)根據文本提示符獲取相應的字庫詞典,查找字庫獲取PS所描述的字符;
 (4)保存第(3)步提取的文本信息;
 (5)結束文本掃描。

 掃描文件時通過尋找關鍵操作符函數FindStringInBuffer(),可以得到需要的操作符位置。源程序如下:
size_t FindStringInBuffer(char*buffer,char*search,size_t buffersize)
{
     char*buffer0=buffer;
     size_t len=strlen(search);
     bool fnd=false;
     while (!fnd)
     {
       fnd=true;
       for(size_t i=0;i<len;i++)
       {
         if(buffer[i]!=search[i])
         {
           fnd=false;
           break;
         }
     }
     if (fnd) return buffer-buffer0;
     buffer=buffer+1;
  if (buffer-buffer0+len>=buffersize)
  return-1;
  }
  return-1;
}
 由于PS解釋器的實現比較復雜,本文通過利用PS解釋器Ghostscript提供的API接口函數對PS文件進行解釋轉換。首先通過接口函數gsapi_new_instance()新建一個要轉換的實例。轉換過程主要在接口函數gsapi_init_with_args()中進行,即初始化PS解釋器并將輸入PS對象轉換為對應的PDF對象。主要轉換程序如下:
if(code=gsapi_new_instance(&minst, NULL))  
{
     printf("Can′t create Ghostscript instance\n");
     return 1;
}
code=gsapi_init_with_args(minst,gsargc,(char**)gsargv);
code1=gsapi_exit(minst);
if((code==0)||(code==e_Quit))
code=code1;
gsapi_delete_instance(minst);
if((code==0)||(code==e_Quit))
  return 0;
3 效果及結論
 本文的程序在VC6.0上編譯通過,并可以將輸入的PS文件(my.ps)轉換為PDF文件(my.pdf)。轉換前后的結果如下:
 由圖5和圖6可以看出,轉換前后的圖像幾乎完全一樣。由圖7中文本的轉換結果可以看出,轉換的字符內容一樣。通過修改輸入文件名和輸出文件名類型,例如輸入文件為.pdf格式文件,輸出文件為.ps文件,也可以實現PDF文件到PS文件的轉換。因此,在設計開發可變數據印刷系統時,可以將該程序作為數據轉換的一部分嵌入到印刷軟件系統中,具有一定的實用性。但是,由于PS解釋器并非獨立設計,受到其接口函數的限制,程序的延伸性不是很好。

參考文獻
[1] 張志偉,孔凡讓,吳欣.PostScript格式文獻中數學表達式的提取方法[J].計算機應用與軟件,2008,25(11):157-159.
[2] USA Adobe Systems Inc. PostScript language reference mannal. Addison Wesley Protessional, 1990.
[3] 何明,匡燕玲,李小龍,等.頁面描述語言PostScript及其轉換程序[J]. 北京工業大學學報,2004,20(4):102-104.
[4] 徐福培,潘志庚.頁面描述語言及其程序設計[M].南京:南京大學出版社,1994.
[5] USA Adobe Systems Inc. Document management-Portable document format-Part 1:PDF 1.7[J]. Adobe Systems Incorporated, 2008, PDF 32000-1.
[6] 李珍,田學東.PDF文件信息的抽取與分析[J].計算機應用,2003,23(12):145-148.
[7] 王婉,韓逸秋,徐福培.PDF文件格式及其向PS文件轉換的研究[J].計算機科學,2001,28(9):123-127.
[8] 吳一民,朱檬,羅綿川.基于.NET平臺PostScript文件解析標引系統設計與實現[J].微計算機應用,2009(10):5863.
[9] 段華偉,黃靈閣.計算機文字處理技術現狀[J].印刷質量與標準化,2004(5):39-41.

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲一区二区毛片| 亚洲人成在线影院| 最新成人av在线| 黄色成人av| 狠狠干综合网| 激情成人亚洲| 黄色成人在线| 红桃视频国产精品| 红桃视频成人| 在线播放不卡| 亚洲大黄网站| 亚洲国产成人久久综合一区| 伊人久久大香线| 激情文学一区| 亚洲国产高潮在线观看| 亚洲国产精品毛片| 亚洲人成网站777色婷婷| 亚洲激情av在线| 亚洲精品一二三区| 亚洲精品小视频| 亚洲最新中文字幕| 一区二区三区欧美视频| 在线中文字幕不卡| 亚洲手机视频| 午夜国产精品视频| 欧美在线免费一级片| 久久不射网站| 亚洲精品免费在线| 亚洲视频在线观看免费| 午夜欧美精品久久久久久久| 欧美一区国产二区| 久久久久国产一区二区| 久久综合伊人| 欧美片第一页| 国产精品麻豆成人av电影艾秋| 国产日本欧洲亚洲| 影音先锋欧美精品| 亚洲精选久久| 亚洲在线视频| 久久精品国产2020观看福利| 亚洲激情网站免费观看| 一区二区三区久久网| 亚洲欧美在线视频观看| 欧美中文字幕视频| 老司机午夜精品视频在线观看| 欧美激情1区2区| 国产精品久久久久久久久久直播 | 欧美+亚洲+精品+三区| 欧美日韩国产一区二区三区| 国产精品亚洲综合天堂夜夜| 精品成人乱色一区二区| 亚洲美女网站| 久久爱www久久做| 夜夜精品视频| 久久精品亚洲精品国产欧美kt∨| 欧美国产在线电影| 国产精品自拍在线| **性色生活片久久毛片| 一本一本久久a久久精品牛牛影视| 欧美亚洲三区| 一个人看的www久久| 久久精品国产亚洲一区二区三区| 欧美激情视频一区二区三区在线播放 | 久久国产精品久久久久久| 欧美国产在线观看| 国产日产欧美精品| 亚洲人体偷拍| 久久精品成人| 午夜免费日韩视频| 欧美精品在线免费| 韩国一区二区在线观看| 99精品国产99久久久久久福利| 欧美一区二区三区视频在线 | 亚洲欧洲日本mm| 欧美在线视频a| 欧美日韩精品久久久| 精品福利av| 中文在线资源观看网站视频免费不卡 | 久久久久九九九| 欧美性一区二区| 亚洲国产二区| 久久gogo国模裸体人体| 亚洲欧美日韩国产| 欧美激情一区二区三区在线视频观看| 国产日韩在线一区| 这里只有精品丝袜| 亚洲破处大片| 久久亚洲精品视频| 国产欧美精品久久| 在线亚洲精品福利网址导航| 亚洲欧洲日产国产综合网| 久久久免费精品| 国产精品私房写真福利视频 | 亚洲男女毛片无遮挡| 欧美精品久久久久久久久老牛影院 | 一区二区三区欧美视频| 99精品视频免费| 欧美xxxx在线观看| 国产一区二区三区网站| 亚洲欧美日韩精品一区二区| 亚洲少妇诱惑| 欧美日韩国产亚洲一区| 亚洲欧洲精品一区二区三区| 亚洲高清不卡在线观看| 久久成人精品无人区| 国产精品美女午夜av| 亚洲视频网在线直播| 亚洲视频欧美在线| 欧美日韩精品免费观看视一区二区| 亚洲成人自拍视频| 亚洲欧洲另类| 欧美国产精品人人做人人爱| 在线观看不卡av| 亚洲第一黄网| 久久人人97超碰国产公开结果 | 伊人成综合网伊人222| 久久精品夜色噜噜亚洲a∨| 久久精品一区四区| 国产日韩欧美一区在线| 欧美亚洲一区二区在线观看| 欧美怡红院视频一区二区三区| 国产精品v一区二区三区| 一本一本a久久| 亚洲专区欧美专区| 国产精品美女一区二区| 亚洲自拍偷拍网址| 久久黄金**| 国产综合色产在线精品| 亚洲第一福利社区| 麻豆精品视频在线观看| 亚洲福利视频网| 一本久久综合亚洲鲁鲁五月天| 欧美日韩一区二区高清| 国产精品99久久久久久久女警| 亚洲欧美另类久久久精品2019| 国产精品午夜在线观看| 亚洲欧洲av一区二区| 久久久久久久综合| 亚洲电影天堂av| 在线一区日本视频| 国产精品人成在线观看免费| 香港久久久电影| 另类专区欧美制服同性| 亚洲激情第一页| 亚洲尤物影院| 国产一区二区三区视频在线观看| 亚洲国产精品ⅴa在线观看| 欧美国产先锋| 亚洲午夜av在线| 久久久亚洲精品一区二区三区| 亚洲二区视频在线| 在线视频日韩精品| 国产模特精品视频久久久久| 久久精品国产精品亚洲精品| 欧美激情a∨在线视频播放| 一区二区毛片| 久久国产手机看片| 在线电影一区| 亚洲一区二区在线播放| 国产区精品视频| 亚洲欧洲日本专区| 国产精品v日韩精品| 久久精品国产亚洲一区二区三区| 欧美精品18+| 亚洲欧美一区二区视频| 欧美v日韩v国产v| 亚洲图片欧美一区| 久热精品视频在线| 一区二区激情小说| 狂野欧美激情性xxxx欧美| 日韩天堂在线视频| 久久久99精品免费观看不卡| 亚洲国产综合91精品麻豆| 午夜亚洲福利| 亚洲国产三级在线| 欧美在线视频播放| 91久久精品国产91性色tv| 香蕉国产精品偷在线观看不卡| 在线日韩欧美视频| 欧美伊人久久久久久久久影院 | 91久久久久久| 欧美在线视频a| 亚洲精品一区二区三区樱花| 欧美中文字幕在线观看| 亚洲精品美女在线观看| 久久精品视频99| 99av国产精品欲麻豆| 久久久久久久网站| 亚洲视频一区在线观看| 欧美成人久久| 欧美影院精品一区| 国产精品v日韩精品| 亚洲精品乱码久久久久久按摩观 | 亚洲线精品一区二区三区八戒| 狠狠色狠色综合曰曰| 校园激情久久| 日韩写真视频在线观看| 免费在线欧美视频| 欧美一区二区三区久久精品| 欧美色视频在线|