文泉驛漢字製作手冊
本頁面搬運自文泉驛漢字製作手冊(失效連結,存檔)。請注意,這份手冊已經過時,僅供參考。對本頁面的注釋可以寫在「注釋」一節。
本頁面使用GFDL 1.2或更新版本授權。
文泉驛漢字製作手冊
最後更新:蔡芊於 2005-1-20
版權 © 2004, 2005 文泉驛
法律通告
Copyright (c) 2005 文泉驛. Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled "GNU Free Documentation License".
簡介
關於文泉驛
我們是一群致力於在計算機世界中推廣漢字,豐富電子漢字資源的志願者,我們希望透過自己無私的勞動,使得無論你在世界上任何一個角落,都可以免費地獲得我們的電子漢字資源,能夠流暢地透過漢字進行交流。「文泉驛」是我們自己建立的,以上述目標為宗旨的的非贏利性組織。
我們製作的點陣漢字字庫將可以使用在各種主流計算機作業系統上,特別是同樣基於開放原始碼的 Linux 作業系統。
對於製作電子漢字資源,文泉驛制定了如下子計劃:
- 基於開放原代碼的點陣漢字庫(優化畫面顯示)
- 基於開放原代碼的矢量漢字庫
- 基於開放原代碼的漢字筆畫筆序資料庫
- 基於開放原代碼的漢字圖像識別系統
- 基於開放原代碼的漢字筆畫識別系統
- 基於開放原代碼的漢字資訊系統(解釋,編碼等)
- 開放的非官方電子漢字標準
具體來講,我們希望完成覆蓋 Unicode 4.0 所包含的 7 萬多漢字的點陣位圖(9pt、10pt、11pt、12pt 等),筆畫筆順資料庫以及基於筆畫筆順資料庫生成的不同字型(細宋,中宋,報宋等)的矢量漢字庫。這個工作還可以繼續擴展到對所有漢字進行注音,釋義,透過筆畫筆順進行漢字檢索和分類,少數民族語言文字的點陣和矢量字體,以及漢字圖像識別和筆畫識別算法,軟體的開發。
當前我們正在努力完成的是計劃當中的第一步,即製作點陣漢字圖像。
字體風格
需要注意的是,我們點陣字體要求有統一的字體風格,即大陸風格的宋體,該字型主要用於閱讀,它橫平豎直、結構清晰、筆劃簡練、節省讀者的目力。如果您不熟悉該字體可以對比下列字體(24x24 像素)。
-
宋體
-
仿宋體
-
楷體
-
黑體
下面是 48x48 像素的宋體:
以上圖片來自中易公司國家標準點陣字庫樣品。更多字體的宋體風格範例請看商務印書館出版的《現代漢語詞典 2002 年增補本》。
對於以前按照舊的標準繪製的字體,我們也將對它們進行保留。由於新的標準是參照當前資訊技術中與漢字相關的國家標準、行業標準以及相關領域的專家的建議制定的,它對我們項目以後的健康發展有很多的促進作用。因此我們希望您能在製作字體的過程中嚴格遵守該標準的相關內容。
在製作 12 pt(16x16)點陣時請將最後一列(第 16 列)空出來作為字與字間的間隔,請勿在其上繪製。現有的 12 pt 點陣及參照圖片採用的是中科紅旗公布的炎黃中文平台 GBK16 漢字點陣,它只是作為一個參考,其中有很多字體在風格上以及細節部分和我們的製作標準有出入。因此如果您在製作過程中發現錯誤請將其改正。
點陣字體製作
簡介
點陣字體就是每個漢字都以一組二維的像素(即位圖)表示。該字體很難縮放進行縮放。
對於常見的計算機作業系統,字體的顯示算法需要一些字體的資訊來優化畫面顯示效果,英文稱為 hinting。漢字由於筆畫複雜,所以 hinting 的方式與西文截然不同。使用在漢字字體中嵌入預先製作的點陣位圖既可以有效地避免 hinting 算法帶來的計算開銷,同時畫面上顯示的漢字邊緣清晰,易於閱讀。下面就是使用點陣顯示和不使用點陣顯示的兩個例子:
-
未使用點陣中文的顯示效果
-
使用點陣中文的顯示效果
同時,點陣漢字也是一種非常特殊的漢字型式,如何在點陣有限的網格空間上排步黑白像素,使得即能最好地表現出漢字的比劃特徵,又能黑白勻稱,顯示優美,可以說,製作點陣漢字是一種藝術創作活動。
製作標準
為了製作高質量風格統一的點陣字體,我們參考了相關國家標準和規範,以及我國傳統書法對筆劃的處理方法制定了以下標準。
- 清晰明了
由於畫面字體的特殊性,首先要確保字體的形狀在畫面上一目了然,不會由於字體筆劃粗細不同或筆劃重疊使使用者在長時間閱讀漢字中使眼睛受到傷害。下面這些規定是為了確保製作的點陣字體在畫面上的可讀性。
單線筆劃
宋體的標準體在單線寬時顯示效果較好,(有別於黑體),所以您在繪製筆畫時,請勿使用寬於兩個像素的筆劃。
-
正確的例子
-
不正確的例子:豎線不應加粗
避免黑疙瘩
點陣漢字中如果出現結集在一起的黑色像素(即黑疙瘩),畫面上顯示效果會比較差,漢字的筆畫特徵也會因此受損。在合適的情形下可以透過調整筆畫的位置(比如輕微的移動或者合併)可以避免「黑疙瘩」,但注意,這種合併或者移動不能使該漢字出現歧義或者重碼(即兩個漢字的點陣完全相同或者幾乎相同)。通俗地說,小筆畫特徵的合併或者移動需要使得大多數使用者能夠透過 1:1 的預覽圖迅速判斷這是什麼漢字。
-
正確的例子
-
不正確的例子:黑疙瘩
- 均勻飽滿
中文字體美觀與否的一個非常重要的因素就是看字體是否均勻飽滿,比例協調。所以在製作字體過程中您應該特別注意字體中偏旁部首間的比例是否合適,要突出字體的主要部分。有一些書法方面的基本知識對製作字體是非常有幫助。當您對某些結構比例把握不準時,請參見《現代漢語詞典 2002年增補本》中的字體構造。
均勻對稱
除了少數偏旁部首、標點符號、筆劃很少的字(如「二」)之外,絕大多數漢字應該均勻地占據整個方格,左右或上下所留間隙應該對稱。
-
正確的例子
-
不正確的例子:字體不均勻
對於繪圖區域像素為偶數時,字體為對稱結構並且在其中軸處有筆劃透過,這時其中軸筆劃應向左(左右對稱)或上(上下對稱)偏離一個像素,例如 10 像素寬的區域,左右對稱的字體其中軸筆劃應選擇在第五個像素處,如下圖所示:
-
正確的例子
而以上原則對於一些本來就偏於一側的符號或者偏旁部首不適用,比如:
-
正確的例子
-
不正確的例子:偏旁居中
另外當字體中某一個部件(偏旁、部首)為對稱結構並且存在透過中軸的筆劃時,該部件中軸兩邊的像素分布(在部件內)也應對稱。
-
正確的例子:「土」為左右對稱結構並且有筆劃透過中軸
-
不正確的例子:「土」左右兩邊分布不均
字型飽滿
字型「飽滿」指的是點陣漢字應該撐滿整個網格。對於絕大多數漢字(除標點符號、少量的偏旁部首、筆劃很少的字),我們要求漢字至少在一個方向(橫向或者縱向)要延伸到邊界(最多距離邊界一個像素)。
- 藝術處理
漢字的書寫是一門藝術。同樣,繪製漢字點陣也不能缺少藝術處理。由於字體,特別是漢字的藝術處理需要專業的技能,因此字體製作一直是商業公司的天下,中國廣大的 Linux 使用者也很難徹底擺脫使用商業字體的尷尬局面。所以對於我們的開源字體,繪製風格統一、美觀大方的中文字體一直是我們所追求的目標。我們也搜集了一些這方面的資料。但總體來說,由於網上這方面的資料非常有限,我們在這方面的進展比較緩慢。如果您有與這方面相關的資料和建議並願意提供給我們,我們將感激不盡。
裝飾點
中國書法中宋體在較長筆畫的起筆落筆處有一些裝飾,增加這些裝飾可以提高字體的美學效果,但由於我們這裡使用的點陣比較小,太多裝飾反而減弱了字體的可讀性。為了整齊劃一,我們規定:無論點陣的大小,請不要加入裝飾點。
-
正確的例子
-
不正確的例子:加入裝飾點
更多資訊
關於點陣字體的藝術處理是個很複雜的問題,它已經超越了該手冊所涵蓋的內容。下面我列舉一些個人認為比較好看的點陣字體。
下面的範例都是在 12 pt(15x16 像素)下繪製的。當點陣柵格比較少時,藝術處理可能會導致字型模糊不清,請小心使用。
- 減少筆劃
由於受點陣柵格數少的限制,對於有些筆劃比較多的漢字,需要壓縮變通筆形進行必要減少筆劃的處理。但需要注意的是,處理後的字型應該保留原字型特徵,即使個別字需要改變字型,也變形留「神」,做到字型逼近。下面是一些常見的減筆劃規則:
和二為一
該情況最為常見,由於點陣柵格有限,甚至無法滿足相鄰的兩橫、兩豎、兩點間的空白為一個像素,應將其和二為一。
結構相接
該情況和上述情況相似,當點陣柵格無法滿足兩個相鄰結構間的空白為一個像素時,應將它們連在一起。
改變筆劃
也就是說用簡單、占像素少的筆劃代替複雜、占像素多的筆劃。
省略筆劃
該情況只在上面幾種辦法都失敗時,才應使用。正如上面所說的,應該保留漢字的「神」,做到字型逼近。
矢量字體製作
原文此部分尚未撰寫。
簡介
參考資料
- 書目
[GB 5199-2001] 國家質量技術監督局. 2001-01-02. 資訊技術 漢字編碼字元集(基本集) 16 點陣字型.
[GB 11458.1~11458.2-89] 國家質量技術監督局. 1989-03-31. 資訊處理用漢字 15x16 點陣字模集及數據集 通訊子集.
[GB 5007.1-2001] 國家質量技術監督局. 2001-01-02. 資訊技術 漢字編碼字元集(基本集) 24 點陣字型.
[GB 5007.2-2001] 國家質量技術監督局. 2001-01-02. 資訊技術 漢字編碼字元集(輔助集) 24 點陣字型.
[GB/T 13844-92] 國家質量技術監督局. 1992-12-05. 圖形資訊交換用矢量漢字單線宋體字模集及數據集.
7-100-03477-9. 商務印書館. 現代漢語詞典. 2002 增補本.
語文出版社. 1997-4-7. 現代漢語通用字筆順規範.
GNU Free Documentation License
此部分為GFDL 1.2原文,搬運時已省略。
注釋
- Unifont、文泉驛和國標點陣間有著錯綜複雜的關係。文泉驛Unibit中的漢字部分為GB 19966-2005中的點陣字體(簡稱國標點陣),部分在國標點陣基礎上改進,部分由貢獻者原創。[1]GNU Unifont的漢字部分採用了文泉驛Unibit的1.1版本,並在此基礎上進行改進。[2]現在,文泉驛計劃早已停止更新,而Unifont仍在更新。歡迎向Unifont提交貢獻!
- 在文泉驛計劃進行的年代,國標點陣屬於強制性標準,加上質量較好,因此被文泉驛計劃大量引用。2019年,GB 19966-2005被GB/T 19966-2019代替。兩份標準中,國標點陣都具有著作權。因此,Unifont中新增的字元不能使用國標點陣,而文泉驛引用過的字元,我們認為既往不咎。
- 以現在的眼光來看,「點陣字體製作」中「簡介」一節的內容已經過時了,因為近年來畫面像素密度已經大幅增長,非點陣字體不會過於模糊,因此不必再內置點陣。但是,點陣字體在低解析度畫面和無法對輪廓做柵格化計算的地方還是很需要的。
- 雖然「製作標準」中已經規定了不加入裝飾點,但是(國標點陣還是文泉驛?)中許多字仍然有裝飾點,需要去掉。
- ↑ 文泉驛Unibit v1.1 發行說明 — 文泉驛.
- ↑ GNU Unifont§ Wen Quan Yi: Spring of Letters (文泉驛 / 文泉驛) — GNU Unifont Glyphs.