立法會資訊科技及廣播事務委員會

中文界面


引言

本文件向各委員介紹本港發展中文界面的未來路向。

背景

2.當我們把資料存入電腦時,必須根據某種預先設定的編碼方案將有關資料予以
編碼。就中文資料而言,現時有多種不同的編碼方案。香港大部分中文應用系統
均採用「大五碼」編碼方案。這種編碼方案是以繁體字為基礎。內地現時採用的
中文編碼標準稱為「國標碼」,是以簡體字為基礎,在香港未獲普遍採用。以上
兩種編碼方案均已發展改良版本。舉例說,「大五碼」的改良版本為「大五擴展
碼」;而「國標碼」亦已發展一個擴充版,稱為「國標擴展碼」。

3.「大五碼」與「國標碼」的中文字庫規模各有不足。在目前已知的60,000個中
文字當中,「大五碼」收納了其中13,000個左右。「國標碼」原來的版本收納了
6,763個中文字,而「國標擴展碼」則收納了大約20,000個中文字。上述各個編碼
方案有一個共通缺點,就是沒有收納好些在香港常用的中文字。這些未收納在上
述編碼方案的中文字,其中不少是香港自創的,又或源自廣東話。為補不足,電
腦使用者惟有自行為這些中文字編配內碼,供自己的電腦系統使用。這種做法對
獨立運作的電腦而言,並不構成問題,但當這些獨立電腦與電腦網絡相連時,這
些用自造的中文字就會在通訊及資料交換時產生問題。

4.目前,以中文進行電子通訊所面對的主要問題,是編碼標準不一,而每種編碼
標準又只收納部分已知的中文字。全球華人社會要在資訊時代和數碼網絡相連的
世界互通訊息,這個問題必須予以解決。

政府制定的措施

5.政府「數碼21新紀元」資訊科技策略的其中一項重要工作,就是制定一套開放
和共通的中文界面,方便社會各界選擇以中文為通訊媒介的人士,進行電子交易


6.為推動政府內部以電子形式通訊,政府已建立一套中文字庫(名為「政府通用字
庫」),收納在本通用但並未納入「大五碼」內的中文字。現時「政府通用字庫
」有大約3,000個中文字,大部分屬於香港特有的中文字,例如地址及廣東話口語
化用字。自一九九五年以來,在推行政府辦公室自動化計劃時,我們一直採用「
大五碼」,輔以「政府通用字庫」。我們亦已將「政府通用字庫」放置於政府網
站(http://www.info.gov.hk/gccs),讓公眾人士隨意下載,這套字庫因而獲越來越多
本地用使用,互聯網用戶每月從政府網站下載該套字庫的次數高達約5,000次。
現時,資訊科技署與法定語文事務署正合作更新該套字庫,以收納新造的中文字


7.此外,電子傳媒及資訊服務協會(由出版界大部分主要出版商組成的非牟利組
織)與香港中文大學訊息網絡研究所正攜手進行「標準香港字庫開發計劃」。該
項計劃的經費來自工業支援資助計劃,目的是制定一套適用於業界的標準廣東
話用字,供本地出版商使用,及方便以中文進行電子通訊。現時在該計劃下,
出版商、廠家、互聯網服務供應商及其它有關團體正合作制定一套標準的廣東
話用字,供所有出版商免費使用。此外,該計劃亦會發展一套電子過濾軟件,
讓本地出版商可用以將原來根據其本身字庫編制的資料,轉換為採用電子傳媒
及資訊服務協會所訂的標準用字。這套標準亦將會透過互聯網及唯讀光碟的方
式發送,公諸於世。

8.雖然我們已進行上述的各項工作,但我們最終還是要制定一套編碼方案,以
求盡量收納所有的中文用字。在國際標準組織(ISO)的統籌下,我們正與其他政
府和機構合作發展一套名為ISO 10646的國際編碼標準,以單一套通用字集收納
亞洲各種語文的漢字。目前該套標準已收納20,902個中文字,新的版本將會收納
約60,000個中文字。我們在國際標準組織的架構下,正積極爭取把香港常用的中
文字納入該套國際標準之內。在向國際標準組織提出建議的過程中,我們已廣泛
諮詢本地團體的意見。我們相信,這套新的ISO 10646標準(預計於二零零零年開
始分期推出)公布後,將會成為包羅所有已知編碼方案字庫的超級字庫,並作為各
編碼方案間轉換及交換資料的基礎。目前電腦在處理中文字上所受到的限制,屆
時將可獲得紓緩。

市民使用公共服務電子化計劃

9.我們現正為推行公共服務電子化計劃進行籌備工作,以期透過使用開放及共通
界面的資訊基礎設施,以電子方式為市民提供公共服務。第一期計劃定於二零零
零年下半年內推出。由於中文是香港大部分市民的母語,因此發展中文界面對公
共服務電子化計劃能否成功推行,十分重要。我們需要採用一套通用中文字集,
方便政府部門與市民之間互通資料。此外,我們亦須提供簡易工具,讓市民在透
過該計劃處理各類政府事務時,能夠以中文作為溝通媒介。

10.由於香港市民主要使用繁體中文字,因此推行公共服務電子化計劃初期,我
們會以繁體中文字作為市民使用該計劃的界面。故此,我們擬採用「大五碼」字
庫,輔以「政府通用字庫」的最新版本,作為公共服務電子化計劃的中文字集,
以作資料交換之用。至於現時政府部門內並非使用「大五碼」的電腦系統,則可
利用轉換工具與公共服務電子化系統互通資料。

11.我們亦會要求將來的公共服務電子化計劃承辦商在其所提供的系統裝設具備使
用ISO 10646標準的功能。這樣可以保持彈性,容許我們於有需要時,以該計劃的
基礎設施配合同時使用繁體和簡體中文用字,並可盡量減少為應付ISO 10646標準
將來的更新版本而需對公共服務電子化計劃下的系統作出改動。

中文輸入

12.中文輸入法可以分為三類:利用鍵盤輸入字形、利用鍵盤輸入字音,及無需
鍵盤的輸入方式。選擇採用某種中文輸入法屬於個人選擇,主要是基於該種輸入
法的效率和用是否得使用而定。使用公共服務電子化計劃的人士如有自設的
設施例如個人電腦,可以自由選擇適合自己的輸入法。而我們在公眾地方安裝讓
市民使用公共服務電子化系統的設施時,將會考慮採用下列輸入法:

  1. 利用鍵盤輸入字形:「倉頡」及「簡易」兩種輸入法,屬同類輸入法
    中最常用者;

  2. 利用鍵盤輸入字音: 漢語拼音及廣東話拼音輸入法;及

  3. 無需鍵盤的輸入方式: 採用筆觸式輸入法或其它定位接觸設備。

13.此外,公共服務電子化計劃所提供的界面,會讓使用該計劃的人士於輸入姓
名時採用中文商用電碼(即顯示於身分證上的電碼)。由於在公共服務電子化計劃
下許多服務均要求使用人士輸入姓名,這種輸入方式將可方便用獲取有關服
務。

諮詢資訊基建諮詢委員會

14.我們已徵詢資訊基建諮詢委員會的意見。該委員會支持我們在本文件所建議
有關發展中文界面的路向。

中文界面

15.透過發展「政府通用字庫」、為訂定ISO 10646國際編碼標準提出建議、支
援本地業界和學術機構就中文用字而籌辦的活動、及推行公共服務電子化計劃
,我們會致力發展一套標準中文字集和一個通用中文界面,以方便利用中文在
香港以內及與世界各地的華人社會進行電子通訊。在建立這個中文界面時所發
展的標準和技術,有助鼓勵私營機構發展中文電子貿易的工具和系統。這些發
展可協助香發展為一個互聯網資訊中心。


資訊科技及廣播局
一九九九年一月