元码输入法

http://www.mhym.com

汉字编码学

作者:吴宗怡(北京)

一、汉字四维模型

传统的汉字教学是“音、形、义”三位一体的,在当今信息时代,已不能满足人们对汉字快速信息化的要求。因此,汉字教学模式应在传统三维的基础上,通过编码语法添加第四维——编码。

信息时代的汉字教学模型应是“音、形、义、码”四位一体的。

信息时代汉字四维模型

二、汉字编码的目标

汉字编码的目标应该是:在全部兼容中国人已有汉字知识(音、形、义)的基础上,加尽量少的规则(或称编码语法),实现 流畅的快速输入;并且,汉字编码反过来有助于提升中国人的汉语水平。

具体地讲,汉字编码的彻底解决方案须具备如下几个条件:

1、编码思维与语言思维应一致。

2、单字、字符和词组重码 应能满足高速盲打的需要。 

3、不能有过多的死记硬背的东西。 

4、编码方案应是开放的、可扩展的。 

5、汉字如需拆分,应符合汉字本身的整体性特征。 

6、一套方案应能适应不同应用场合,如:手机、南北地域等。

7、汉字编码应有助于提升汉语水平。

三、汉字编码中的几大误区

1、恋恋不舍拼音

认为拼音是人们不学自会的,相信通过编程或加大词库或整句输入等能解决汉字输入的感觉和效率问题。其结果就象汉字拼音化改革一样,终究难成“正果”。

2、强调“简单”

其一,将汉字简单地看成是由笔画构成的,会写汉字就会输中文。这种编码思维也可以把重码做到比较低的程度,似乎是中文信息化的“正解”。但实践表明,笔画编码难以满足人们对中文快速信息化的要求,其症结在于汉字在人脑中的储存是按部件或块的方式进行的,笔画编码思维违背人类认知心理的规律。

其二,选尽量少的部件,以减少记忆量。《规范》中定义了560个基础部件,若只选其中125个或更少的部件作为编码元素,其余未选部件没有定义只能拆分为更小的部件或笔画。这种编码思维首先增加了区分已选与未选的学习量,其次也难以维护汉字的整体性。

3、“零学习”概念

“零学习”或“1分钟学会”或“5分钟学会”是许多输入法的“广告”词,用于强调其“易学”的特征。姑且不管其真实性,对于全体中国人要相伴一生的中文输入技术来说,并没有实质性意义,问题的关键是学的会以及使用的感觉和效率。

4、“封闭”式设计

除元码输入法外,几乎所有的输入法都是“封闭”式的。“封闭”式的缺点是难以精通,会输1000字,不保证能输入20000汉字。

相反,“开放”式设计原理,若会一字,就会一大片,会一大片,就可以精通中文输入法,即使有10万汉字或更多,也能自然而然地轻松输入,即使是一幅画,也可以有编码。

四、汉字编码学的内容

1、元码是汉字编码的基本要素。

2、采用韵首移位方式来弥补元码内在的缺陷。

3、“取大”法则是二分汉字时的基本规则,以维护汉字的整体性和层次性。

4、二分后的结构由细分规则判断是否要继续拆分: 首部字不分;尾部“上下”或“左右”结构可分;尾字元码与整字元码相同时,尾字可分(也叫“取尾”分散)。

5、部件定义为汉字拆分后所形成的相对完整的结构。部件一般情况下按已有的习惯发声,不易认读的部件定义为部件 类(交、连、串、戈、止)。

6、可以恰当地定义功能键解决字符、人名或称呼、地名、常用词等的快速输入问题。

7、可以将“拼音”和“字典”作为辅助输入技术,用于解决不会写或不会念的字的输入问题,实现学会写不不会写的字和念不会念的字。

8、词组应采用动态词组管理,如:自动添加、自动调频、自动隐藏、人工添加、人工调频、手动删除等。

9、键盘布局应与英文100%兼容,并可以确定空格键为主上屏键、分号(;)键为辅上屏键、豆号(,)和句号(.)键为重码翻页键、斜杆键(/)为万能键、波纹键(~)为 导航菜单键。

发表日期:2005-02-10  更新:2008-07-10

版权所有(C)2001-2008  北京天元鸿学有限公司 更新:2008年07月10日