《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 業界動態 > 以音節為輸入單位的藏文輸入模型研究

以音節為輸入單位的藏文輸入模型研究

2008-06-24
作者:王維蘭

  摘 要:藏文" title="藏文">藏文音節作為輸入的基本單位,建立了音節與詞的編碼模型" title="編碼模型">編碼模型以及音節輸入、詞匯輸入和聯想輸入的模型并實現了藏文輸入方案。試驗結果表明,該方案科學、合理。輸入方法簡單、方便、快速。
  關鍵詞: 藏文輸入 編碼模型 輸入系統模型


  藏文輸入是藏文信息處理的一個重要內容。目前藏文輸入法主要有基字輸入法、拉丁輸入法和區位碼輸入法[1]。基字輸入法類似于拼寫輸入法[2],國外的Wylie[3]輸入法即為拉丁輸入法。基字輸入法和拼寫輸入法都是將字丁拆分成藏文字母,然后規定編碼順序,或者按照藏文書寫規則依次輸入。Wylie輸入法是鍵入字丁的拉丁轉寫,從而轉換為藏文字丁。總之,這幾種輸入法都是以藏文字丁為編碼單位輸入的。根據字丁的疊加層數,有不等的擊鍵次數:基字字丁需2鍵;疊字(含元音)字丁擊鍵次數比層數少1;無元音的3層疊字則需4鍵。參考文獻[4]實現了一種藏文詞組輸入方案,其基本特點是按照單音節詞、雙音節詞、三音節詞、四音節詞和多音節詞分別以每個詞各音節的基字與后置字編碼,實現藏文詞輸入。本文建立以音節為基本輸入單位的輸入模型、詞匯輸入模型及其相應的聯想輸入,從理論和實現的角度解決藏文的快速輸入問題。
2 藏文輸入法編碼方案模型
2.1 以音節為輸入單位的可行性及其編碼模型的建立
  藏文音節結構的兩種形式如圖1所示。一個音節有7個成分,1、2、3、4、5、6、7分別為基字、上加字、下加字、前加字、后加字、又后加字和元音位置。除基字外,其它任何成分少一個或幾個,只要符合音節規則,都是合法音節。從左到右形成4個縱向單位,除第二個縱向單位外,其他三個部分都不缺或少一個、兩個、三個和四個,則分別形成四字、三字、雙字和單字音節。詞由一個或多個音節構成,音節之間用音節點分隔。


  目前在中文Windows環境下處理藏文,音節的每一個縱向單位即字丁占一個漢字位置。
  首先建立藏文音節編碼方案的模型,表示以音節為單位的輸入方案的可行性。根據參考文獻[5][6]的啟發并分析藏文的特點,定義了5個集合:(1)T={t:t是藏文音節}是規范藏文音節集。藏文有嚴格的音節拼寫規則,規范音節是本方案必須獲得的一個統計數據,根據已經統計的數據[7][8],集合T含有的元素個數約12 000左右。以此集為基礎建立如下各集。(2)W={為一個詞包含的音節數,w是詞}為藏文詞集。(3)C={c:c是鍵盤字符}是編碼字符集。C可以是小寫26個英文字母、大寫英文字母、10個數字0~9以及鍵盤上的其他字符。(4)S={s:s=C1C2……Cm,其中Ck∈C,k=1,2,……n是英文字母數目}是藏文數字、符號、音節、梵文代碼集。每個代碼s都是一個或若干編碼字符。因為S是T對應的編碼集,而不同音節有相同的代碼現象,如對三字音節:和雙字音節:的編碼就可能一樣,因為前一個音節中的第二個字母在第二個音節中是下加字(變形顯示),所以S集的元素個數小于T集,即|S|≤|T|。(5)L={==∈S,k=1,2,……m},m為詞li包含的音節數,li為詞的代碼串,對應的代碼}。
  設規范藏文音節集T中所有子集(即冪集)表示為2T,S為T的代碼集。根據以上集合可建立如下音節編碼模型。
  定義1 若g是S到2T的一個映射:g:S→2T,即s→g(s)且對任意的音節t∈T,g-1({t}≠,則稱g為一種音節編碼方案。若存在s∈S,使得|g(s)|>1,則稱g為有重碼的音節編碼方案,這時,g(s)中的藏文音節的代碼都是s。若對于每個s∈S,總有|g(s)|=1,則g為無重碼的音節編碼。
  若g為無重碼的藏文音節編碼,則g是S到T的單滿射。這樣s和g(s)一一對應。實際上g不是一個單滿射,這在實際設計中是允許的。反之,任何一個規范音節,根據某種編碼方式都有編碼。如果把以音節為單位的藏文信息輸入過程看成通過輸入音節代碼得到藏文音節的過程,則有:
  定義2 音節的代碼轉換為藏文的模型可以表示為:ti=g2°g1(si),其中gi(si)表示取得代碼Si的重碼音節集,g2表示重碼音節中的選擇處理,最后得到規范音節集中的藏文音節ti
  因為|gi(si)|≥1,即代碼Si所對應的音節至少有一個,當|gi(si)|>1時,即代碼Si對應多個音節,而g2表示從這多個音節中選取一個。可以由輸入者完成,也可以由計算機自動完成。如果自動完成,則必須通過音節的轉移概率或藏文語言知識的應用。
  因為信息輸入是一個狀態轉移過程,如前面定義的藏文音節集、代碼集、代碼字符集,可以建立如下音節輸入模型:
  定義3 代數系統<2T,S,g,,T>稱為以音節為單位的藏文輸入處理系統模型,其2T是藏文音節集T的所有子集(即T的冪集),稱為該代數系統的狀態集;空集表示初始狀態;T為終結狀態集;g稱為狀態轉移函數,是2T×S到T的一個映射:g:2T×S→2T。若用q表示狀態,則模型:(q,s) g(q,s)=q∪{g(i)(g1(s))}就表明在狀態q下,如果再輸入代碼s,則得到以s為代碼的重碼音節集g1(s)。n=|g1(s)|是g1(s)中所含元素的個數。g(i)(g1(s))表示從g1(s)的元素集合{g(1)(g1(s)),g(2)(g1(s)),……g(n)(g1(s))}中取定一個。
  因為藏文的詞都是由若干個音節組成的,所以當音節的代碼集是S時,若用f鍵符表示空格,則S+f表示音節代碼加空格符的集合。于是詞的代碼集為:
  (S+f)i-1S=S∪(S+f)S∪……∪+(S+f)m-1S=S∪(S+f)×S∪……∪(S+f)×(S+f)×……(S+f)×S的子集,其中m=max{|k|:|k|是詞包含的音節個數},于是有:
  定義4 若g是(S+f)i-1S到詞集W的所有子集2W的一個滿射,則g為一藏文詞輸入編碼方案。對于該編碼方案g,若有w∈W,則g(-1)({w})=是不允許的;若有s∈(S+f)i-1S,則可以有g(s)=
  有了藏文詞的編碼方案,即可以得到詞輸入系統的模型:
  定義5 一個詞輸入系統的模型是一個5元代數系統<2W,L,g,,W>,其含義如下:
  2W是藏文詞集W的所有子集,是該代數系統的狀態集;L=(S+f)i-1S是詞的代碼集;空集表示一個詞也沒有輸入時的初始狀態;W稱為系統的終結狀態集;g稱為狀態轉移函數,是2W×L到2W的一個映射:g:2W×L→2W,(q,l)|→g(q,l)=q∪{g(i)(g1(l))}。其中g1是一個詞編碼方案,它是L到2W的一個映射;g1(l)是代碼為l的重碼詞集合;g(i)是{g1(l)|l∈L}到W的一個映射。g(i)(g1(l))表示從集{g(1)(g1(l)),g(2)(g1(l)),g(3)(g1(l)),……g(n)(g1(l))}中選取一個,它是詞集W中的一個確定元素。
  從上面的" title="面的">面的模型可以發現,如果以s為代碼的音節集g(i)(g1(s))和以l為代碼的詞集g(i)(g1(l))的個數很多,在實際輸入法應用中可選擇兩種方法:一是手工鍵選,即在輸入法候選窗口通過翻頁選擇。如果每次都要不斷翻頁選擇,不僅打斷人的思維,也不能有效提高輸入速度。二是通過語言知識的統計和應用自動選擇。鑒于藏文語言應用研究的現狀,通過兩種辦法來解決這個問題:(1)詞頻。通過靜態的詞頻排序盡量減少翻頁,達到快速輸入的目的。(2)智能記憶。將靜態統計和輸入時的動態統計情況相結合,通過記憶,不斷調整靜態統計的結果,適應輸入者的動態需要,減少翻頁鍵選。
2.2 音節和詞的聯想輸入
  在設計聯想輸入時分為以下兩個層次。
  (1)音節輸入過程的聯想
  音節t可以用代碼s表示,而s=C1C2……Ck,Ci∈C,i=1,2,……k,C1C2……Ck是對一個音節的編碼。一個音節最多由四個縱向單位,七個成分組成,最少只有一個輔音字母,所以音節的代碼串是不定長碼。于是,音節的聯想可以有多種方式,如由前加字聯想可能的基字、上加字、下加字、后加字和又后加字;或由基字聯想可能的其他成分而組合成的規范音節。隨著代碼序列s的輸入,每個Ci的輸入既和前面字母的結合有確定性,又對后面有聯想結果,以供選擇,直到音節代碼輸入結束。
  (2)詞輸入過程的聯想
  詞的代碼由若干個音節的代碼組成,輸入第一個" title="第一個">第一個音節時的聯想是音節的聯想,輸入第二個及以后的音節時則進入詞的聯想。詞的聯想是根據前面的n個音節聯想的,當輸入第n+1個音節的第一個代碼時,聯想下一個可能音節的詞,依次類推。
3 實驗結果與分析
  前面用藏文的拉丁轉寫作為輸入代碼,實現了以音節為輸入單位的藏文輸入法。圖2為輸入窗口和選擇窗口,實現一個音節的輸入和聯想過程。當輸入y時,聯想出以為基字的所有可能的音節;當輸入yo時,聯想出以基字位置的所有音節;當輸入yos時,聯想出以為基字、后加字拉丁轉寫為sa的藏文音節(此時有惟一一項)。
  圖3為詞的聯想輸入過程。輸入一個6音節的詞(其拉丁轉寫為:kun brtags kyi ma rig pa),候選窗口序號1所在的詞即為要輸入的詞。如左側的輸入窗口和候選窗口所示,當輸入第二個音節的拉丁轉寫首字母時,聯想出所有第一個音節為kun,第二個音節的前加字、基字為ba的藏文詞。隨著輸入的繼續,候選窗口列表在已確定的前面幾個音節的前提下,聯想后面的音節。


  上述輸入方案以實現為目標,以實用為目的。在本方案的基礎上,設計和實現了一個藏文輸入系統。實驗表明該輸入方案科學、合理。
參考文獻
1 彭壽全,黃 可.漢字信息處理.成都:電子科技大學出版社,1994:336~360
2 柔 特,才智杰.班智達藏文詞組輸入法的設計與實現.少數民族語言信息技術研究進展——中國少數民族語言信息技術與語言資源庫建設學術研討會論文集,2004:228
3 谷文祥.關于計算機漢字信息輸入處理的一個新模型.計算機研究與發展,1995;(7):61~65
4 錢培德.計算機漢字I/O處理的數學模型.中文信息學報,1992;(2):46~51
5 王維蘭.現代藏文語言單位頻率和頻級關系的統計分析.科學技術與工程,2004;(5):413~417
6 王維蘭,陳萬軍.藏文字丁、音節頻率及其信息熵.術語標準化與信息技術,2004;(2):27~31

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
日韩一级裸体免费视频| 亚洲一区久久久| 日韩一级欧洲| 在线电影一区| 激情亚洲网站| 国产一区二区在线免费观看 | 黑人操亚洲美女惩罚| 国产婷婷精品| 国产三级欧美三级日产三级99| 国产精品日韩一区二区三区| 国产精品久久久久久久久久久久 | 亚洲性线免费观看视频成熟| 一个色综合av| 中文一区二区在线观看| 中文精品一区二区三区| 亚洲欧洲综合另类| 在线成人激情视频| 影音先锋久久久| 亚洲国产高清自拍| 亚洲啪啪91| 亚洲精选久久| 亚洲视频观看| 亚洲欧美激情视频| 午夜精品久久久久久99热| 亚洲欧美国产毛片在线| 性久久久久久久久久久久| 欧美在线欧美在线| 亚洲国产91色在线| 亚洲精品日韩精品| 亚洲社区在线观看| 午夜精品一区二区三区在线播放| 欧美va亚洲va香蕉在线| 欧美激情第六页| 欧美chengren| 欧美黑人在线观看| 欧美精品首页| 欧美午夜精品久久久久久浪潮| 欧美日韩亚洲一区二区三区在线观看| 欧美日韩一区二区三区在线看 | 精品成人久久| 激情视频一区| 亚洲高清在线| 99视频在线观看一区三区| 亚洲性夜色噜噜噜7777| 欧美亚洲综合在线| 亚洲日本国产| 亚洲一区二区在线播放| 久久国产精品久久w女人spa| 麻豆精品网站| 欧美日韩理论| 国产精品一卡二卡| 伊人久久综合97精品| 亚洲精品极品| 午夜精品视频网站| 亚洲激情综合| 亚洲免费在线观看视频| 久久久久久一区二区| 欧美激情在线免费观看| 国产精品萝li| 红桃视频国产精品| 亚洲精品日产精品乱码不卡| 欧美中文字幕在线播放| 欧美日韩亚洲一区二区| 欧美特黄一级| 亚洲激情在线| 能在线观看的日韩av| 亚洲美女精品一区| 亚洲性视频网站| 久久久精品一品道一区| 欧美日韩高清不卡| 国产人久久人人人人爽| 亚洲国产三级网| 亚洲中午字幕| 99亚洲视频| 久久国产一区二区| 欧美精品一卡| 国产视频一区二区在线观看| 亚洲黄色性网站| 亚洲欧美综合| 亚洲最黄网站| 久久尤物视频| 国产精品狠色婷| 亚洲第一偷拍| 午夜精品av| 99re在线精品| 久久在线免费观看视频| 国产精品激情电影| 亚洲国产精品成人一区二区| 亚洲欧美欧美一区二区三区| 在线视频精品一| 麻豆免费精品视频| 国产美女精品人人做人人爽| 亚洲精品一区二区三区四区高清| 久久激情视频| 欧美亚洲一区二区在线| 欧美午夜视频在线| 亚洲福利视频网站| 亚洲大胆视频| 久久大逼视频| 国产精品一区二区a| 日韩午夜视频在线观看| 亚洲欧洲视频| 久久婷婷丁香| 国产欧美综合一区二区三区| 在线综合+亚洲+欧美中文字幕| 亚洲人成啪啪网站| 久久久久久久综合日本| 国产精品手机视频| 一本色道久久88亚洲综合88| 99国产精品久久久久久久成人热| 久久人人九九| 国产一区二区看久久| 亚洲一区二区不卡免费| 亚洲午夜一区二区| 欧美人与禽猛交乱配视频| 亚洲国产美国国产综合一区二区| 久久精品国产v日韩v亚洲 | 久久精品91久久香蕉加勒比| 欧美精品在线免费播放| 在线成人性视频| 久久精品三级| 久久综合精品一区| 韩国av一区二区| 欧美一级精品大片| 久久不射中文字幕| 国产精品一区二区三区四区| 亚洲深夜福利网站| 亚洲自拍偷拍福利| 国产精品露脸自拍| 亚洲在线成人精品| 午夜欧美不卡精品aaaaa| 国产精品久久7| 亚洲天堂免费观看| 亚洲一区国产| 亚洲黄网站黄| 免费欧美电影| 亚洲激情图片小说视频| 亚洲精品国产欧美| 欧美激情亚洲综合一区| 欧美日本成人| 亚洲无亚洲人成网站77777| 亚洲最新合集| 亚洲欧美日韩电影| 国产精品青草久久| 亚久久调教视频| 久久色在线观看| 伊人久久大香线| 亚洲美女电影在线| 欧美日韩精品国产| 亚洲另类黄色| 亚洲欧美日韩电影| 国产偷国产偷精品高清尤物| 欧美一区2区三区4区公司二百| 久久久精品2019中文字幕神马| 激情久久五月天| 亚洲日韩第九十九页| 欧美日韩国产成人在线免费| 日韩性生活视频| 午夜精品成人在线视频| 国模大胆一区二区三区| 亚洲人成人99网站| 欧美日韩在线精品一区二区三区| 亚洲一区二区精品在线| 久久嫩草精品久久久久| 亚洲高清三级视频| 亚洲一区二区伦理| 国产欧美日本| 亚洲人成在线免费观看| 欧美亚洲成人网| 欧美在线黄色| 欧美日韩国产成人在线91| 亚洲欧美另类在线观看| 久久亚洲高清| 亚洲最新合集| 久久夜色精品国产| 亚洲免费电影在线观看| 午夜日韩福利| 在线观看视频免费一区二区三区| 亚洲小视频在线| 国产综合久久久久久| 日韩午夜在线| 国产欧美日韩亚州综合| 亚洲精品日韩一| 国产精品美女久久久久久2018 | 亚洲精品影视| 欧美一区二区三区免费在线看| 在线观看日韩专区| 亚洲欧美日韩爽爽影院| 影音先锋亚洲视频| 亚洲永久免费观看| 在线成人黄色| 欧美一区二区私人影院日本| 亚洲欧洲在线免费| 久久久久久九九九九| 99热这里只有精品8| 久久亚洲综合网| 亚洲免费中文字幕| 欧美另类亚洲| 亚洲国产精品久久91精品| 国产精品美女久久久久久免费 |