郑码输入法中有许多思想与五笔字型思想非常相似,包含普及型郑码,大字集简繁体郑码,港澳繁体郑码输入法等,郑码在汉字编码字符集范围、词库容量、字词平均码长、动态字重码率及符合语言文字规范等方面都取得了突出的成绩。郑码输入法规范、易学、快速、通用,用同一编码规则不但可以输入2万汉字,还可以输入68000个和10万个汉字。
郑码输入法中有许多思想与五笔字型思想非常相似,很难说谁借鉴了谁,总之都是发明者对中国文字做了大量研究的结果。在郑码中对于汉字的笔画也规定为“按一定走向连续完成的一笔”,也分为五种,分别是:横、竖、撇、点、折(也分别包括横提、向左的竖钩、捺等形近的变体);对于汉字的形成认为是分为笔画、独体字与合体字三个层次;也认为字根是汉字形体的基础单元;郑码中的字根也分为成字字根和非成字字根两大类;也认为汉字合体字的字型中可以分为左右型、上下型和包围包孕型(这与五笔字型中的非类略有区别,实际上五笔字型中的杂合型字大部分是这里的包围包孕型);也按笔画分类分区排列键位;一个汉字(或词组)最多也是键入四键;也有像五笔字型中的一级简码那样的高频字;也有二级简码。
为了适应不同用户的需求,郑码输入法又分为《普及型》和《标准型》两种。这两种方法所用的基本字根的分类排列规律是一致的,编码规则也没有多大的差别。《普及型》的编码规则较简单,较易学,适合一般办公人员或年龄偏大的用户使用,但重码略多;《标准型》的编码在基本字根的代码方面有不同,除第一主根外每个基本字根都被扩充了一个位码,减小了重码字,并适用超过2万字的中、日、韩国际标准汉字大字符集。
汉字是方块图形文字,每字由一至数个单元构成。例如“师傅”的“傅”字由单元“亻、専(音fù)”构成,其中的“専”又由单元“甫、寸”构成,可见“亻、甫、寸”是构成“傅”字的基础单元,构字单元的排列顺序,用图形可表示为(见图1.1)。如果把“亻”换成“氵”,在上面加“⺮”头便构成“簿”字;换成“艹”头又成为“薄”字。以“薄”为例,构成“薄”字的基础单元是“艹、氵、甫、寸”。而基础单元由笔画构成,例如“寸”由笔画“一亅丶”构成。 用于汉字编码,将构字的基础单元叫做“字根”或叫做“部件”,构字的最小单元是笔画。也就是说,“薄”字由“艹、氵、甫、寸”4个字根构成;“札”字由字根“木”和笔画“(折)”构成。对这些字根我们并不陌生,因为许多字根就是我们熟悉的部首。
《郑码》给一部分字根安排了代码,这部分字根叫做“基本字根”。将基本字根和笔画的代码按一定规则代入即得到汉字的编码。例如:有基本字根“氵V、甫F、寸D、艹E、⺮M、亻N、木F、又X”和笔画“乚(折)Z”,得到汉字的编码:“薄EVFD、簿MVFD、札FZ、权FX、树FXD、符MND”。这就是《郑码》编码的基本原理。
用键盘输入编码,通过机内码转换可在显示屏看见输入的汉字,同时可用打印机或激光发排机将汉字输入,印在纸张或胶片上,这样便完成了汉字输入和输出的全过程。
第一条:要按照《郑码》的基本字根总表上所列出的基根(包括形近根),把汉字分解成基本字根才能编码。如果没有合适的基根,就要进一步分解成笔画。例如:补--衤卜恳--艮心滤--氵虍心书--乛丨丶
第二条:汉字分解后,基根和笔画排列的顺序叫做“根序”。根序的确定有三种情况:l.左右字、上下字以及由单笔画组成的字,根序与规范的书写顺序一致(见上例中的“补、恳、滤、书”四个字的分解)
汉字输入 / 24.01 MB
汉字输入 / 36.1 MB
汉字输入 / 50.3 MB
汉字输入 / 75.74 MB
汉字输入 / 176 KB
软件评论
请自觉遵守互联网相关政策法规,评论内容只代表网友观点,与本站立场无关!
2015-04-24 17:35 支持(18) 回复