标准“五笔字型”(86 版)速成教材 ·...
Transcript of 标准“五笔字型”(86 版)速成教材 ·...
2
标准“五笔字型”(86 版)速成教材
一、五笔字型的基础知识
五笔字型是由王永民先生于 1978—1983 年在河南南
阳研究发明的高效“形码”汉字电脑输入技术,被新华社
誉为“中国文化史上其意义不亚于活字印刷术的发明。”五
笔字型采用标准英文键盘,以“木子—李、日月—明”这
样的“积木组字”方式,在 25个键位上输入汉字,不但重
码少效率高,而且因为完全依“字形”输入,输入几乎等
同于写字,所以,会输入就会写字,不会发生“提笔忘字”
的汉字文化危机而有利于汉字传承。
本教材讲解标准五笔字型 86版(优化 86版)。
(一)汉字的五种基本笔画
笔画写成字根,字根构成整字。笔画、字根、整字,是汉
字结构的三个层次。
当笔画或字根被优选为编码的基本单位时,也被称为“码
元”。
1982 年,王永民先生给汉字的笔画下了一个科学的定义:
在书写汉字时,一次写成的一个连续不断的线段。
笔画分为 5 种——横、竖、撇、捺、折。可以将五种单笔
画分别用 1、2、3、4、5 作为代码。如下表所示:
3
代码 笔画 名称 走向 变 形
1 一 横 左右 (提笔)
2 丨 竖 上下 亅(竖左钩)
3 丿 撇 右上左下
4 捺 左上右下 丶 (点及卧点)
5 乙 折 带转折
提示:①提笔“ ”是横的变形笔画,归为“横”。
②竖左钩“亅”是竖的变形笔画,归为“竖”。
③点“丶”和卧点是捺的变形笔画,归为“捺”。
④一切带转折、拐弯的笔画都归为“折”,用“乙”代表。
(二)汉字的三种字型
习惯上,我们把构成汉字的基本笔画结构,称作“字根”
或“部件”。当“字根”或“部件”用于汉字编码时,又把它
们叫做“码元”,意思是“编码的元素”。
根据构成汉字的各个字根之间的“位置关系”,可以把汉
字分为三种字型(“字型”不同于“字形”:“字型”是指结构
特征,“字形”则指字的外观):
1 型字:左右型——字根左右排列
2 型字:上下型——字根上下排列
3 型字:杂合型——字根互相包围或交叉套迭
4
代 号 字 型 图 示 字 例 特 征
1 左右型 汉湖
封结
字根之间可有间距,总
体看是左右排列。
2 上下型 字莫
花华
字根之间可有间距,总
体看是上下排列。
3 杂合型
国凶
进司
乘果
字根之间虽有间距,但
不分上下左右;或者浑
然一体,不分块。
在给汉字编码时,“字型”及其代号将非常有用。
(三)5 区 25个键位的五笔字型键盘
汉字是由字根(码元)构成的,如:
氵又→汉 木子→李 日刀口灬→照
只要在五笔字型的键盘上,依次按字根所对应的键,好像
搭积木一样把字“组合”起来,就等于将汉字输入了。
所以,用五笔字型输入汉字,基本上就是“拼形组字”!
王永民先生将构成汉字的字根,也即用于为汉字编码的
“码元”,优选归纳为 130 种,有规律地分配安置在除 Z 键以
外的 25个英文字母键上。形成了五笔字型的 25键“码元键盘”。
五笔字型键盘分为 5 个区,区号从 1 到 5;每一个区,各
5
有 5 个键位,位号也是从 1 到 5;位号从键盘中部向左右两端
排列。区号与位号搭配组合,共形成 5×5=25 个代码,即:11,
12„„54,55。每个“区位号”与一个英文字母相对应,并在
每个键位上选出一个有代表性的字根,作为键名。区位号、键
名与字母的对应关系如下:
第一区(横区):GFDSA,主要放置横起笔的码元
第二区(竖区):HJKLM,主要放置竖起笔的码元
第三区(撇区):TREWQ, 主要放置撇起笔的码元
第四区(捺区):YUIOP, 主要放置捺起笔的码元
第五区(折区):NBVCX,主要放置折起笔的码元
反过来,“一”开头的字根,王 五 十 干 石 厂 丁 艹
匚„„都在第 1 区;
“丿”开头的字根,禾 ⺮ 手 斤 八 勹 儿 金„„都在
金 35Q
人34W
立
42U
言41Y
月33E
白 32R
禾31T
之45P
灬火44O
水43I
工
15A
木14S
日
22J
目21H
大13D
土12F
王11G
田24L
口23K
纟
55X
山25M
已51N
又54C
女53V
子52B
第 3 区:撇起笔 第 4 区:捺起笔
第 1区: 横起笔
第 5 区(折起笔)
第 2 区:
竖起笔
6
第 3 区;
也就是说,只看字根的第一个笔画,(一般来说)就知道
它在哪个区,如:山 日 田 甲„„在第 2 区,言 文 门 宀
辶„„在第 4 区。
掌握这个字根“按首笔分区”、“按次笔划位”的字根摆放
规律,使人们能很快记住字根在什么键位上。
(四)五笔字型键盘的码元分布规律
五笔字型键盘的码元,是有规律地分布在 25 个键位上的:
(1)码元的首笔代码与区号一致。
如:“王、土、大、木、工”的首笔画是横,代号为 1,
它们都在第 1区。
(2)码元的次笔代码与位号基本上一致。
如:“王、土、大”的第二笔的代号分别是 1、2、3,它
们在第 1 区的位号是 1、2、3;“女、厶、母”的第二笔的代
号分别是 3、4、5,它们在第 5区的位号是 3、4、5。
(3)单笔画的个数与其所在键的“位号”一致。
如:“一、丨、丿、丶、乙”一个笔画,都在各区的第 1
位,“三、 、彡、氵”三个笔画,都在各区的第 3位。
二、五笔字型编码法
英文单词可以分解为一个个字母,再按字母输入。汉字
没有字母,却有字根;也可以把汉字拆成一个个字根,再按一
7
定的规则输入电脑。这个过程就叫做“汉字编码”,意思是把
汉字编成输入代码。
(一)键名汉字编码
键名,就是各个键左上角的字根,也是助记词中每一句的
首字。五笔字型用了 25 个键,每个键都有一个键名。键名第
一个笔画的代号,与区号都相一致。它们的构字能力较强,具
有代表性。
键名的输入方法是:把所在键连打 4 下。例如:
王:GGGG 工:AAAA
(二)成字码元编码
除了“键名”外,凡本身是汉字的码元(字根),叫“成
字码元”或“成字字根”。
成字码元的输入方法是:
先把这个码元所在的键打一下(俗称“报户口”),然后再
依次打它的第一笔、第二笔及最末一笔。最多 4 下,不足 4 下,
补打一个空格键。例如:
例字 报户口 第一笔 第二笔 最末笔 编码
干 干
F
一
G
一
G
丨
H FGGH
力 力
L
乙
N
丿
T LNT
文 文
Y
丶
Y
一
G
丶
Y YYGY
8
也 也
B
乙
N
丨
H
乙
N BNHN
另外,我们对五种单笔画 “一丨丿丶乙”的输入方法作
了特别规定:先打“两下”该笔画所在的键,再加打两下“L”
键。如:
一 GGLL 丨 HHLL 丿 TTLL
丶 YYLL 乙 NNLL
说明:以上五个单笔画中,“一”为特常用字,还特别地
“享受”一级简码:打一个“G”,再打空格即可。
(三)合体字的取码
凡是“码元表”上没有的字,也就是“键外字”,都可以
认为是由字根“拼合”而成的,这类字称之为“合体字”或“多
元字”。其取码方法应当遵循以下“五项规则”:
① 书写顺序
一般情况下,分解汉字、编码输入,要按正确的书写顺序
进行。如:
新:立 木 斤 (顺序正确)
立 斤 木 (顺序错误)
中:口 丨 (顺序正确)
丨 口 (顺序错误)
燕:廿 口 灬 (顺序正确)
廿 口 灬 (顺序错误)
9
② 取大优先
拆分汉字时,要以字根(即码元)为基本单位,要求是“再
增添一个笔画,便不能构成码元”为限度,优选拆取出“笔画
尽可能多”的码元参加编码,叫做“取大优先”,能拆成大的,
就不拆成小的。如:
失: 人 (正确)
大 (错误)
丿 二 人 (错误)
年: 丨 十 (正确)
一 丨 十 (错误)
③ 兼顾直观
在编码时,为了使码元(字根)的特征明显易辨,有时就
要暂时牺牲一下“书写顺序”和“取大优先”的原则,形成极
个别的例外情况。
例如,“国”字,按“书写顺序”,其码元拆分应是:“冂
王丶一”,但照这样编码,不但有悖于该字的字源,也使得码
元“囗”不能直观易辨。
所以,我们只好违背一下“书写顺序”,按“囗王丶”的
顺序编码。
同样的例子还有:
自:丿目 (正确,似乎没有“取大优先”,但直观性很好。)
(错误,虽“取大优先”,但缺乏直观,且又太散。)
10
④ 能连不交
一般来说,对汉字分解取码(拆分)时,码元(字根)之
间“连”比“交”更为“直观”,更易于辨认。
所以,当遇到既可以按交叉拆分,又可以按连接拆分时,
也就是有几种取码的可能性时,取“连”的应比取“交”的优
先。例如:
天:一 大(正确,“一”与“大”视作相连接,比较直观。)
二 人(错误,“二”与“人”交叉在一起了,不太直观。)
⑤ 能散不连
有时候,不是单笔画的几个码元(字根)的结构关系,在
“散”和“连”之间模棱两可。如:
矢: 大 (正确)
大 (错误)
两个码元按“连”处理,就是杂合型,按“散”处理,就
是上下型。对这种情况,我们规定:
只要不是单笔画,散、连都可以时,一律按“能散不连”
判别,视作“散”的关系。
(四)合体字的编码
1、“多元字”的编码
所谓“多元字”,是指有 4 个以上码元(字根)组成的字。
这种字,“按书写顺序取第一、二、三及最末一个字根”,俗称
11
“一二三末”,共编 4 个码。如:
戆:立. 早. 攵. 工 贝 心.
42 22 31 51
U J T N
齄:丿. 目. 田. 一 木 日 一.
31 21 24 11
T H L G
2、“四元字”的编码
“四元字”指刚好有 4 个码元(字根)组成的字。这种字,
“依照书写顺序,把 4个码元取完”即可。如:
照:日 刀 口 灬
22 53 23 44
J V K O
模:木 卄 日 大
14 15 22 13
S A J D
3、二元字和三元字的编码
只有二个或三个码元(字根)组成的字,叫二元字或三元
字。它们的编码方法是:
输入全部字根后,再追加一个“末笔字型识别码”,简称
“识别码”。
12
“识别码”是由汉字的“末笔”代号和“字型”代号交叉
复合在一起,形成的一个附加编码。这是在键数很少的情况下,
把笔画特征信息和字型信息,充分地利用于编码之中,有效减
少重码的一个科学创造!
前面介绍过,笔画有 5 种,字型有 3 种,识别码共有 5×
3=15 种,如下表所示:
“识别码”的作用和用法,可参考以下实例。
1、左右型(1 型)的字,字根打完之后,识别码就等于
补打一个末笔画:
沐:氵 木 ( 相当于“沐”的末笔画)
43 14 41
I S Y
字
末 型
笔
左右型 上下型 杂合型
1 2 3
横 1 11 (G) 12(F) 13(D)
竖 2 21(H) 22(J) 23(K)
撇 3 31(T) 32(R) 33(E)
捺 4 41(Y) 42(U) 43(I)
折 5 51(N) 52(B) 53(V)
字
13
汀:氵 丁 ( 相当于“汀”的末笔画)
43 14 21
I S H
洒:氵 西 ( 相当于“洒”的末笔画)
43 14 11
I S G
2、上下型(2 型)汉字的末笔字型识别码,相当于把字
根打完之后,补打由两个末笔画构成的码元。如:
字:宀 子 ( 相当于“字”的两个末笔“二”)
45 52 12
P B F
参:厶 大 彡 ( 相当于“参”的两个末笔“ ”)
54 13 33 32
C D E R
3、杂合型(3 型)汉字的识别码,相当于把字根打完之
后,补打一个由三个笔画构成的码元。如:
朱: 小 ( 相当于“朱”的三个末笔“ ”)
32 43 43
R I I
申:日 丨 ( 相当于“申”的三个末笔“ ”)
22 21 23
J H K
14
注意:包围型的字,规定取被包围部分的末笔作识别码。
如:
国:末笔应取“丶”,识别码为 43(I)
远:末笔应取“乙”,识别码为 53(V)
(五)词汇的输入
1、二字词:
每字各取前 2 个码,共 4 码。如:
国际:囗 王 阝 二 (LGBF)
电脑:日 乙 月 文 (JNEY)
2、三字词:
前两个字,各取第 1 码,最后一个字,取前 2 个码,共 4
码。如:
计算机:讠 ⺮ 木 几(YTSM)
生产率:丿 立 亠 幺(TUYX)
3、四字词:
每个字各取第 1 个码,共 4 码。如:
光明日报: 日 日 扌(IJJR)
知识产权: 讠 立 木(TYUS)
15
4、多字词:
取前 3 个字和最后一个字的第 1 个码,共 4 码。如:
中华人民共和国:口 亻 人 囗(KWWL)
三、简码和容错码
(一)简码
一些常用字,除按全码可以输入外,也可以只输入全码的
前 1 个、2 个或 3 个码,这样就形成了一、二、三级简码。
1.一级简码(又称“高频字”)
把每个键只打一下,再打一个空格键,即可打出 25 个最
常用的汉字,每键一个。各区位对应的高频字是:
位
区 号
号
1 2 3 4 5
1 11 G
一
12 F
地
13 D
在
14 S
要
15 A
工
2 21 H
上
22 J
是
23 K
中
24 L
国
25 M
同
3 31 T
和
32 R
的
33 E
有
34 W
人
35 Q
我
4 41 Y
主
42 U
产
43 I
不
44 O
为
45 P
这
5 51 N
民
52 B
了
53 V
发
54 C
以
55 X
经
位
区
16
2.二级简码
二级简码是指只输入全码的前 2 个码,再加空格便可输入
的字。一般也都是比较常用的字。享受二级简码“待遇”的字
有 500 多个,如:
事:一口(GK) 能:厶月(CE)
给:纟人(XW) 张:弓丿(XT)
3.三级简码
三级简码是指只输入全码的前 3 个码,再加空格便可输入
的字,也是常用字。有三级简码的字有 1000 多个。如:
欣: 斤 人(RQW) 恰:忄人一(NWG)
稀: (TQD) 晴: JGE,省了识别码)
说明:有些字由于编码需要,有时候可以同时具有三种简
码的“待遇”,如“经”:XCAG,输入 1 个码、2 个码、3 个码
及全码都能打出。但这种情况并不多见。
(二)容错码
什么叫容错码?一般人“容易”弄错的码,我们“容许”
你按错的打,谓之“容错码”。有些字的笔顺或字型一时不易
确定,这时,不妨按几种可能的编码都试一下。如:
官:宀 丨 (正确码)
宀 丨 (容错码)
燕:廿 口 丬 灬 (正确码)
廿 丬 口 灬 (容错码)
17
18
五笔
字型(
86版
)字
根键
位图
注:
该字根
键位图及其字根的排列设计受著作权法保护,未经作者许可,不得引用、复制、印刷或发行。