模糊元码输入法

http://www.mhym.com

 

跟我学元码(Follow me)

第一讲 “取大”法则

论战到现在,已觉乏味了。没有了新意,没有了激动人心。今天开始将从元码的核心思维出发,让您陆续了解用元码输入中文时,您可能会用到的思维方式。掌握这些思维方式,可以做到快速进入元码的大门。

元码输入法不强调记忆字根或部件,强调在理解的基础上的活学活用,以及举一反三。

编码思维之一:“取大”法则

“取大”法则是您进入元码大门的金钥匙,是您接受元码思想的第一堂课。

何为“取大”法则呢?“取大”法则在汉字编码时,什么时候用呢?

1、“取大”法则是汉字拆分的基本规则,了解本法则,你就能正确掌握元码中的汉字拆分方法。

2、一般情况下,汉字可以按直观一分为二,并将含首画的部件放在前面,不含首画的部件放在后面。例如:

如→女口→rn或rnk

般→舟殳(shū)→bzs

您在确定两个部件哪个在前、哪个在后时,主要看首画在哪个部件,就将那个部件放在前面,不含首画的部件就放在后面。

3、元码中二分汉字时,不考虑书写顺序,不要求构成部件是连续的笔画。例如:

因→囗(方框)大→yfd

戊→戈丿→wgp

这种不考虑书写顺序的拆分汉字的方法是按认知心理学中的“完形”理论为基础的,按汉字本身具有的整体性来拆分汉字。拆分结果一般与中国人的习惯一致,大部分也与许慎的《说文解字》中的拆分结果一致。因此,可以还原汉字本身具有的整体“美”。

4、有时,一个汉字可能会有二种或二种以上的拆分方式,这时,按“取大”法则优先取含笔画最多的拆分结果。例如:

矢→丿天→spt

市→丶帀(zā)→sn

5、注意与五笔编码思维的差别:五笔中也有“取大”优先的规定,但其思维方式与元码不同,五笔中要考虑书写的顺序,并按书写顺序优先取笔画最多的字根。例如:

矢→大、市→亠巾……

【练习】练习下列字的拆分和编码:

竟、西、酉、束、柬、媾、思、别、集、尊……

第二讲 “取尾”分散

先回答楼上的贴子吧。

fxylsqw先生的性子真子“急”了些,一口就想吃个大胖子,“跟我学元码(Follow Me)”才开了个头,就想全部精通元码输入法了。

先生所引用的示例的确是标准的元码编码,里面除含有“取大”法则编码思维外,还有其他几个编码思维:“取尾”分散、部件结构、“取补”分散等等。这些编码思维将在论坛中陆续展开,只是一时来不及写而已。希望先生继续关注这个讲座。

就“取大”法则作如下说明:

柃→木令→木今丶→lmjn

这里,涉及另一个编码思维,叫“取尾”分散(当尾字音首与整字音首相同时,尾字可以再分。)上例中,柃(líng)与令(lìng)音首都是“l”,原始的编码是:柃→木令→lml,这时,没有采用分散重码技术。由于,汉字中有很多的形声字,声部也常常放在后面的,这一现象导致整字音首与尾字音首相同的情况很多,因此,若不采用“取尾”分散技术,重码很高,使第三键变成了“傀儡”。

如先生引述的例子中:粮粒楼栏橹栎榴榈榄榔骡粝柃栌棂骊阆栳骝栳榔……这种情况与拼音编码类似了,若不处理,元码迷们是不绕我这个“模糊”的。

“取大”法则的影子在哪儿呢?“令→今丶→lj”是也。

汉字拆分除以上“取大”法则、“取尾”分散外,另外还有两小点要注意一下:

上下或左右结构的字中字是可分的。例如:

程→禾口王→chk

盟→日月皿→mrym

部首尽量不分。例如:

集→隹(zhūi)木→jzm

般→舟殳(shū)→bzs

“取尾”分散再加上以上两条合起来叫做细分规则。

第三讲 拆分小结

理论于2004年11月26日这一天全部研制到位,这里有我的好友田铜砚(云南)先生的一份功劳,是他“固执”的坚持,以“简明”为主,使这一天早日到来了。否则,仅靠我一人的智慧,虽然前面只是隔着一层薄薄的纸了,也无法捅破的。

我想还是就事认事的方式来解释试一试,是否能做到更加“深入浅出”。

元码中已将字根概念淘汰了,全部替换为部件了。因为,象五笔中的“五尾鱼”其实不是字根,只是出于编码上的需要人工定义的,因此,叫部件更合适。

元码中的部件是不限数目的,对于目前仅仅20902个汉字或符号来说,一定也是有限的。但是,要将全部部件列示出来是不可能的。所以,先生看的字根表只是其中的一部分,其余部件需要按部件结构的模糊思维靠自己判断的。例如:

也→乂乚→yi

这里,“乂”不是字根,只是代表部件结构“两笔相交i”。

鼎→目~→dmv

这里,“~”代表部件结构“模糊对称v”。

承→~~→cpv

这里,“p”代表部件结构“部件交重p”。

……

在先生的例子中,“令”在“领→令音→lly”和在“拎→扌今丶→loj”中的处理不一致,且“令、今”等字在字根表中也没有列示,觉得有些疑惑。这若按封闭式编码思维来看待确是如此,因为,输入法作者没有定义,用户就不可以按自己的理解来编码了。

元码是开放式的编码系统,“令”在“领”中已到了拆分的底层了,不要再往下拆分了;而“令”在“拎”中,却要继续拆分为“今丶”。这时由元码的细分规则确定的。

⑴ 上下或左右结构可分。⑵ 部首不分。⑶ “取尾”分散。

更具体地分析:

“令”不是“上下或左右结构的字,所以,一般情况下就可以不分了,可以直接编码了。如:翎→令羽→llv。但是,“令”字在“拎、岭、龄、玲、羚、苓、蛉、聆、囹、铃、呤、柃、伶、泠、怜……”中,都有“取尾”分散的问题,都要转换为可分字来处理。元码中若您就是不想分散重码,也可以直接编码,如:拎→lol*、龄→lcl*……,这里,带“*”只是表示这是容错性质的编码。不能直接打“*”的。

“部首不分”中的部首是模糊的,一般在具体的字中,判断部首或不是部首时比较容易些。另外,先生也可以参看《现代汉语词典》中的相关资料。元码中的字中字都可以不分,都会有编码,若无重码时,您可以认为那就是“很好”的编码了。例如:

照→昭灬→zzh

因为,“照”按“zzh”打,也挺好的。您就可以坚持这么打。若先生一定要将“昭”拆分为“日召”处理,那是按规则编码,为本系统的标准编码。

照→日召灬→zrzh

“灬”为四点火。

再说说“召”字。

“召”字在“照”字中是拆分的底层了,因为,“照”字首先二分为“昭灬”,“昭”字是左右结构,可以再分为“日召”。二分、细分后就到底层了。

但是,若“召”字在“昭”中,则首先二分为“日召”,“召”字为上下结构的字,再细分为“刀口”,这样,“昭”字拆分为“日刀口”。当然,“昭”字是一个可以二分干净的字,元码中全部提供“昭”按二分直接编码的容错性质的编码“zrz”。

可分与不分,不分又可分,在元码中是会相互转换的,这是元码开放式编码原理的一部分,与传统的封闭式编码原理的不同。元码中一切都是动态的,不象五笔中,全部预先先规定好,然后,大家就按这个规定,并且按书写笔顺优先取大往下拆分。

我自笑先生也许还疑问,元码的这种拆分方法是“活”的,不如传统的“死”的好。

若我们来分析两种拆分方式的利弊的话,我可以简单作如下归纳:

⑴ 元码中可以处理无限数目的部件;五笔只是处理125个或234个。

⑵ 元码中可以按汉字本身具有的整体性和层次性来拆分汉字;五笔按已定义的字根来拆分汉字。

⑶ 元码可以实现“自由”打字的境界,因为,您不受作者定义或未定义的约束;五笔可以实现“自如”打字的境界,因为,您在碰到不是作者定义的部件时,或是在作者定义了您不知道的部件时,您必须拆分为更小的部件或笔画,或抓瞎。

⑷ 元码的“活”的设计,让系统具有充分的可扩展性;五笔的“死”定义,使系统进化遇到困难。

……

元码思想的表述确实是一个大的课题,这在一定程度上反应了事物在发展中阶段式前进的特征。与诸位大侠、高手、同道、打字迷们探讨,应有助于元码的理论的不断完善,也许有一天能真正做到“深入浅出”的。

第四讲 “取补”分散

今天心情很好,咱们接着聊聊“取补”分散的话题。这可是元码中最重要的编码思维之一,在您理解的基础上,还要求多多练习,掌握25个补码字,并做到自动舍音首取韵首。

元码输入法中需要您特别注意的是几个元音字母(aoeiuv)的编码任务的安排。这不可以想当然。在经过反反复复的计算和测试后,定义下列25字为补码字,并要求在取码时从音首移位至韵首:

见到“上三山长羊”类,就打“a”,见到“水竖川与雨”类,就打“u”,其余类推。例如:上→a,三→一二→ah、王→三丨→wau……

在《模糊元码练习器》中,按F10键进入补码练习页,参考标题栏中的提示,认真研究以上25个补码字,做到自动舍元取补。

25个补码字,使系统的重码降至非常理想的程度,花一些时间去理解和练习,让您终生受益,在适当练习的基础上,从五笔的“自如”打字的“打字工具”阶段,进入元码的“自由”打字的“打字玩具”阶段。因为,元码打字就象游戏一样,让您着迷。

元码迷,

爱元码,

就象老鼠爱大米。

元码迷,

爱元码,

就象爱着梦中美丽的lover。

第五讲 部件结构

部件的选取和键盘定位问题,是所有封闭式输入法争论的焦点。选多少个,多好或是少好,用什么键位来处理,怎么去联想(如五笔、表形……),最后,封闭类输入法的胜者当然是王永明先生的五笔字型啦。

如果大家还在这块一亩三分地里争来争去,就别再争了,因为,大家都认同王先生的五笔画的有序化方式了,已有定式了,就让五笔为“王”好了。

不过,毕竟五笔还要让您记忆125个或234个“臭虫”,对于许多人来说,这是过不去的门槛。过了这个卡,还有那个关……

部件是由汉字拆分后形成的,理论上说,部件数目是无限的。苦主打的比方很好:“这就好像一千个人有一千个不同的样子,我们单纯用圆脸、方脸、瘪脸去套,都还会有很多的漏网之鱼,那么怎么把它们一网打尽?只有把他们总归为男人和女人,漏网的几率才会少一些”。

用模糊的智慧,可以把地球上60亿人,概括为男人、女人,或是白人、黑人、黄色人种……,若非得一个一个去记忆,真是一辈子都没指望了。

元码输入法按模糊判断将部件归为8个重要的部件结构,其余小的部件结构在碰到时掌握就可以了。

⑴ “模糊对称v”:⺮癶卝夗双北…如:

笔→bvm,朝→cvy,登→dvd,祭→jvi,业→yvh,背→bvy。

⑵ “部件交重p”:聿禺夬朿巿冘 …如:

春→cp,肺→fyp,妻→qpn,啄→zkp、枣→zpe、枕→zmp。

⑶ “两笔相连l”:卜丆丩…例如:

占→zlk、而→el、年→nl、收→sl,乡→xlp

⑷ “一笔串两笔c”:艹廾卄…如:

茂→mcw,弄→nwc,廿→nch、举→jxc、专→zcn、戈→gcn。

⑸ “两笔相交i”:十七乂廴…如:

卉→hic、艾→aci、左→zig、建→jpi、也→yi。

⑹ “有戈组合g”:戈弋戋戉…如:

找→zog,代→drg,贱→jbg,栽→zgm,越→yog,彧→ygkh。

⑺ “有止组合z”:止疋疌⺪⻊…如:

扯→coz,蛋→dzc,捷→joz,疏→szu,卸→xze,跳→tz。

⑻ “有钩组合o”:勹尢冂卂旡…如:

勾→gos,用→yoc,迅→xo,既→jgo,畏→wto,钩→oj或gjos。

仔细研究以上8个部件结构,掌握部件按模糊思维的归类方式,就离精通元码输入法不远了。又如:

那→~(有钩组合)阝→no

乡→~(两笔相连)丿→xlp

也→乂(两笔相交)乚→yi

龜→丿~(所有未定义的部件)→pp(元码字典)

鼎→目~(模糊对称)→dmv

脊→~(模糊对称)月→jvy

捷→扌疌(有止组合)→joz

栽→(有戈组合)木→zgm

专→卄(一笔串两笔)丶→zcn、书→scn、戈→gcn

带→丰(一笔串三笔)冖巾→df、戋→jfn、伟→wrf

…………

部件结构是元码开放式编码原理的核心,具有举一反三的特点,让您学一字,通一片,通一片,就能一通百通。

开放式编码原理可以处理无限数目的部件,让您打字时不必当心我“模糊”有没有定义某个“臭虫”,开动您的智慧,开动您的举一反三的想象力,您会发现,您也是很聪明的,也是会思考的。

开放式编码原理能够最大限度地维持汉字的整体性和层次性,充分还原汉字在哲学和美学意义上的整体“美”。

第六讲 符号

汉语中的符号包括常用的标点符号、数学符号、特殊字符等等,也是文本中常常出现的。若将符号看成另类,需要专门的方法来输入的话,打字的流畅性也会大打折扣的。

元码中目前对394个符号作了定义,大大提高了打字的效率。例如:

 

字符

编码

注释

vc

comma

vd

顿号

vj

句号

vm

冒号

vf

分号

vt

叹号

vw

问号

对标点符号定义,使打字节奏在输汉字与输标点时一致,可使文本外观更加整齐美观。

███████████████████████████████

▁▂▃▄▅▇█▔▔▔▔█▇▄▁◢◣____▁▂▃▄▅▇█………

第七讲 功能键

功能键可以说是音码类的专利,形码中编码空间都已耗尽,不能采用功能键的编码原理。

功能键可用于解决一些特殊的问题。例如:

地名是一大类名词,可以设“e”键为地理键(earth)。例如:

北京→eb、香港→ex、日本→er、俄罗斯→ee……

类似地,“u”可用于人名、“v”键除用于符号外,还有空间可用于常用词、“i”键用于上下文连接的词、“o”键用于序数词等等。

功能键的使用可以大大提高中文输入的效率。再如:

第一→ody、爸爸→ub、可以→ik、因为→iyv、所以→isy、起来→vql、开始→vks……

第八讲 元码数字

元码数字指十一个字母用于表示一、二、三……。

定义下列十一个字母为元码数字。

Y

E

A

S

W

L

Q

B

J

I

O

元码数字用于序号和拼音的编码,例如:

第一(ody)、第二(ode)、第三(oda)……

ā(vay)、á(vae)、ǎ(vaa)、à(vas)……

第九讲 小结

元码自1999年开始研制,至2004年11月26日止,全部编码规则研究到位,其间整整用了五年的时间。

元码目前只是一株幼苗,但已不是弱者了。中文信息化问题的彻底解决,需要大家的共同努力,我相信,在传统的拼音和五笔基础上,开辟全新的一类编码思维——元码思维,必将为沉寂的中文输入法界注入一弘清澈的活水,但愿我们能共同迎来中文输入法的春天。

感谢诸位同道、大侠们的关爱,不足之处在所难免,也请诸位多多包涵。

(完)发表日期:2005-3-28,与《五笔爱好者论坛》同发。

版权所有(C)2001-2005  北京首书林文化有限公司 更新:2005年08月13日