中文輸入法簡介、發展及困難

18
中文輸入法簡介、 發展及困難 wanleung - [email protected] 10th June 2012 Update Oct 2013

description

中文輸入法簡介、發展及困難 A Talk in Gnome Asia 2012 and Hong Kong Open Source Conference 2013 Gnome Asia 2012 : http://www.youtube.com/watch?v=W_Y0u5XukD8 HKOSC 2013 : http://www.youtube.com/watch?v=wKKrEuZyYRI

Transcript of 中文輸入法簡介、發展及困難

Page 1: 中文輸入法簡介、發展及困難

中文輸入法簡介、發展及困難

wanleung - [email protected] June 2012

Update Oct 2013

Page 2: 中文輸入法簡介、發展及困難

自我介紹

本名: wanleung ([email protected])Hong Kong Linux User Group 2011-? 副主席

90年代末千禧年初活躍於台灣遊戲討論區推廣自由軟體。

因興趣關係自97年開始使用GNU/LINUX。初試Redhat5。

有興趣之項目:架站,中文化,PC Game on Linux (Win32 like)

英國畢業返港後一直從事Linux雲端後台開發工作。

Page 3: 中文輸入法簡介、發展及困難

現時常見輸入法軟體

fcitx gcinhimeibusrimescimuim(以字母排列)

Page 4: 中文輸入法簡介、發展及困難

GNU平台中文發展

Linux中文延伸套件計劃 CLE - 1998百花齊放年代. 文鼎字型, xcin, 各類私有輸入法

SCIM ~2003 (Fedora Core 5 2006)

ibus ~2008

Page 5: 中文輸入法簡介、發展及困難

中文輸入法發展之困難 - 文化

大陸地區 - 簡化字;現代漢語拼音;大陸地區用語

台灣 - 正體字; 國語注音; 台語用語

香港 - 正體字; 英語拼音(威妥瑪); 粵語及香港用語

澳門 - 正體字; 萄語拼音; 粵語及澳門用語

新(星)加坡和馬來亞 - 簡化字; 英語拼音, 有教授華語之正規學校才會教授現代漢語拼音; 星馬、福建話、潮州話、廣州話用語.海外 - 正體字; 客家、台山、粵語、台語、福建話、潮州話

Page 6: 中文輸入法簡介、發展及困難

中文輸入法發展之困難 - 文化

大陸地區 - 漢語拼音、五筆

台灣 - 注音、嘸蝦米、新酷音、倉頡(速成)、大易...香港 - 倉頡(速成),筆劃(如筆順五碼),大易,粵拼(英文拼音)澳門 - 倉頡(速成),筆劃(筆順五碼),大易,粵拼(萄文拼音)新(星)加坡和馬來亞 - 漢語拼音, 倉頡(速成),筆劃(如筆順五碼), 英語拼音(?).

Page 7: 中文輸入法簡介、發展及困難

中文輸入法發展之困難 - 方法

形意檢字法: 如倉頡, 五筆, 大易

利用漢字特有之結構, 綜合不同特有字根之不同配搭作分類.

好處: 重碼少 (即同碼字少),打字快,不需學習現代漢語拼音或國語注音

缺點: 學習時間長久,執筆忘字不能打

Page 8: 中文輸入法簡介、發展及困難

中文輸入法發展之困難 - 方法

發音檢字法: 注音, 拼音, 粵拼...

以字之聲母韻母作為檢字方法

好處: 只要學習過國語注音或漢語拼音,會讀字就會打.缺點: 國語同音字多, 選字慢. 無學過拼音方法, 無法使用.

Page 9: 中文輸入法簡介、發展及困難

中文輸入法發展之困難 - 方法

筆劃檢字法: 筆順, 筆順五碼, 部首...

用人人都會的寫字方法, 用筆順檢字. 又或用傳統字典部首加筆劃數方法檢字.

好處: 人人都會用.缺點: 寫字筆順可能因人而異,而筆畫數亦因人而異; 不同的筆順輸入法有不同的輸入字完, 不統一.

Page 10: 中文輸入法簡介、發展及困難

中文輸入法發展之困難 - 方法

大陸地區: 受教育的新一代會漢語拼音, 但老一代不會

台灣地區: 受教育的新一代會國語注音, 但老一代不會 香港、澳門: 不會任何漢語拼音或國語注音,且不會粵拼國際音標, 粵拼輸入比較難製作.星洲大馬: 受教育的新一代會漢語拼音, 但老一代不會

Page 11: 中文輸入法簡介、發展及困難

中文輸入法發展之困難 - 習慣

ibus-table之問題: 1. 無視各地區輸入法特有習慣

2. 無視 形意檢字法 和 發音檢字法 之分別

Page 12: 中文輸入法簡介、發展及困難

中文輸入法發展之困難 - 習慣

輸入法獨有習慣, 如注音輸入法和拼音輸入法之不同.注音: 不看字序, 聲母、韻母, 不用順序輸入, 輸入後會自動處理, 輸入兩個韻/聲母, 會改正韻/聲母; 每次只出一字.可入輸入聲調過濾字, 以減少選字.

拼音: 有字序. 必需先聲母後韻母, 像英文串字, 不能錯序; 詞語可像英文一樣連打, 不用分兩字.

Page 13: 中文輸入法簡介、發展及困難

中文輸入法發展之困難 - 習慣

倉頡速成: 使用者會習慣 記 選字序

自動排列 常用字 於前 : 一個災難.

倉頡, M$、MAC、gcin系、scim都有 萬用字 系統,輸入 萬用字 會變成速成, 而ibus-table則 缺萬用字 系統.

馬來之友是倉頡五代, M$, MAC之倉頡輸入碼表, 包含正體字、簡化字及日本新字體.

Page 14: 中文輸入法簡介、發展及困難

中文輸入法發展之困難 - 習慣

ibus-table 在選字柜有正簡過濾

發音檢字: 字多, 正簡同字同音, 過濾做法

正確

形意檢字: 字少, 正簡不同碼, 過濾做法 災難

而其過濾, 無個人設定參數, 只有系統參數.

Page 15: 中文輸入法簡介、發展及困難

中文輸入法發展之困難 - 其他

關聯詞: GCIN系有類似, 但不同於WINDOWS及MAC的關聯詞, 不方便.

關聯詞用詞地區, 兩岸四地星馬用詞不同.

Page 16: 中文輸入法簡介、發展及困難

中文輸入法發展之困難 - 其他

打正出簡, 打簡出正.

日文漢字之輸入.

Page 17: 中文輸入法簡介、發展及困難

香港?

Page 18: 中文輸入法簡介、發展及困難

Q & A