|
模糊元码输入法 |
||||||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||||||
|
第一讲 “取大”法则 论战到现在,已觉乏味了。没有了新意,没有了激动人心。今天开始将从元码的核心思维出发,让您陆续了解用元码输入中文时,您可能会用到的思维方式。掌握这些思维方式,可以做到快速进入元码的大门。 元码输入法不强调记忆字根或部件,强调在理解的基础上的活学活用,以及举一反三。 编码思维之一:“取大”法则 “取大”法则是您进入元码大门的金钥匙,是您接受元码思想的第一堂课。 何为“取大”法则呢?“取大”法则在汉字编码时,什么时候用呢? 1、“取大”法则是汉字拆分的基本规则,了解本法则,你就能正确掌握元码中的汉字拆分方法。 2、一般情况下,汉字可以按直观一分为二,并将含首画的部件放在前面,不含首画的部件放在后面。例如: 如→女口→rn或rnk 般→舟殳(shū)→bzs 您在确定两个部件哪个在前、哪个在后时,主要看首画在哪个部件,就将那个部件放在前面,不含首画的部件就放在后面。 3、元码中二分汉字时,不考虑书写顺序,不要求构成部件是连续的笔画。例如: 因→囗(方框)大→yfd 戊→戈丿→wgp 这种不考虑书写顺序的拆分汉字的方法是按认知心理学中的“完形”理论为基础的,按汉字本身具有的整体性来拆分汉字。拆分结果一般与中国人的习惯一致,大部分也与许慎的《说文解字》中的拆分结果一致。因此,可以还原汉字本身具有的整体“美”。 4、有时,一个汉字可能会有二种或二种以上的拆分方式,这时,按“取大”法则优先取含笔画最多的拆分结果。例如: 矢→丿天→spt 市→丶帀(zā)→sn 5、注意与五笔编码思维的差别:五笔中也有“取大”优先的规定,但其思维方式与元码不同,五笔中要考虑书写的顺序,并按书写顺序优先取笔画最多的字根。例如: 矢→大、市→亠巾…… 【练习】练习下列字的拆分和编码: 竟、西、酉、束、柬、媾、思、别、集、尊…… 第二讲 “取尾”分散 先回答楼上的贴子吧。 fxylsqw先生的性子真子“急”了些,一口就想吃个大胖子,“跟我学元码(Follow Me)”才开了个头,就想全部精通元码输入法了。 先生所引用的示例的确是标准的元码编码,里面除含有“取大”法则编码思维外,还有其他几个编码思维:“取尾”分散、部件结构、“取补”分散等等。这些编码思维将在论坛中陆续展开,只是一时来不及写而已。希望先生继续关注这个讲座。 就“取大”法则作如下说明: 柃→木令→木今丶→lmjn 这里,涉及另一个编码思维,叫“取尾”分散(当尾字音首与整字音首相同时,尾字可以再分。)上例中,柃(líng)与令(lìng)音首都是“l”,原始的编码是:柃→木令→lml,这时,没有采用分散重码技术。由于,汉字中有很多的形声字,声部也常常放在后面的,这一现象导致整字音首与尾字音首相同的情况很多,因此,若不采用“取尾”分散技术,重码很高,使第三键变成了“傀儡”。 如先生引述的例子中:粮粒楼栏橹栎榴榈榄榔骡粝柃栌棂骊阆栳骝栳榔……这种情况与拼音编码类似了,若不处理,元码迷们是不绕我这个“模糊”的。 “取大”法则的影子在哪儿呢?“令→今丶→lj”是也。 汉字拆分除以上“取大”法则、“取尾”分散外,另外还有两小点要注意一下: 上下或左右结构的字中字是可分的。例如: 程→禾口王→chk 盟→日月皿→mrym 部首尽量不分。例如: 集→隹(zhūi)木→jzm 般→舟殳(shū)→bzs “取尾”分散再加上以上两条合起来叫做细分规则。 第三讲 拆分小结 理论于2004年11月26日这一天全部研制到位,这里有我的好友田铜砚(云南)先生的一份功劳,是他“固执”的坚持,以“简明”为主,使这一天早日到来了。否则,仅靠我一人的智慧,虽然前面只是隔着一层薄薄的纸了,也无法捅破的。 我想还是就事认事的方式来解释试一试,是否能做到更加“深入浅出”。 元码中已将字根概念淘汰了,全部替换为部件了。因为,象五笔中的“五尾鱼”其实不是字根,只是出于编码上的需要人工定义的,因此,叫部件更合适。 元码中的部件是不限数目的,对于目前仅仅20902个汉字或符号来说,一定也是有限的。但是,要将全部部件列示出来是不可能的。所以,先生看的字根表只是其中的一部分,其余部件需要按部件结构的模糊思维靠自己判断的。例如: 也→乂乚→yi 这里,“乂”不是字根,只是代表部件结构“两笔相交i”。 鼎→目~→dmv 这里,“~”代表部件结构“模糊对称v”。 承→~~→cpv 这里,“p”代表部件结构“部件交重p”。 …… 在先生的例子中,“令”在“领→令音→lly”和在“拎→扌今丶→loj”中的处理不一致,且“令、今”等字在字根表中也没有列示,觉得有些疑惑。这若按封闭式编码思维来看待确是如此,因为,输入法作者没有定义,用户就不可以按自己的理解来编码了。 元码是开放式的编码系统,“令”在“领”中已到了拆分的底层了,不要再往下拆分了;而“令”在“拎”中,却要继续拆分为“今丶”。这时由元码的细分规则确定的。 ⑴ 上下或左右结构可分。⑵ 部首不分。⑶ “取尾”分散。 更具体地分析: “令”不是“上下或左右结构的字,所以,一般情况下就可以不分了,可以直接编码了。如:翎→令羽→llv。但是,“令”字在“拎、岭、龄、玲、羚、苓、蛉、聆、囹、铃、呤、柃、伶、泠、怜……”中,都有“取尾”分散的问题,都要转换为可分字来处理。元码中若您就是不想分散重码,也可以直接编码,如:拎→lol*、龄→lcl*……,这里,带“*”只是表示这是容错性质的编码。不能直接打“*”的。 “部首不分”中的部首是模糊的,一般在具体的字中,判断部首或不是部首时比较容易些。另外,先生也可以参看《现代汉语词典》中的相关资料。元码中的字中字都可以不分,都会有编码,若无重码时,您可以认为那就是“很好”的编码了。例如: 照→昭灬→zzh 因为,“照”按“zzh”打,也挺好的。您就可以坚持这么打。若先生一定要将“昭”拆分为“日召”处理,那是按规则编码,为本系统的标准编码。 照→日召灬→zrzh “灬”为四点火。 再说说“召”字。 “召”字在“照”字中是拆分的底层了,因为,“照”字首先二分为“昭灬”,“昭”字是左右结构,可以再分为“日召”。二分、细分后就到底层了。 但是,若“召”字在“昭”中,则首先二分为“日召”,“召”字为上下结构的字,再细分为“刀口”,这样,“昭”字拆分为“日刀口”。当然,“昭”字是一个可以二分干净的字,元码中全部提供“昭”按二分直接编码的容错性质的编码“zrz”。 可分与不分,不分又可分,在元码中是会相互转换的,这是元码开放式编码原理的一部分,与传统的封闭式编码原理的不同。元码中一切都是动态的,不象五笔中,全部预先先规定好,然后,大家就按这个规定,并且按书写笔顺优先取大往下拆分。 我自笑先生也许还疑问,元码的这种拆分方法是“活”的,不如传统的“死”的好。 若我们来分析两种拆分方式的利弊的话,我可以简单作如下归纳: ⑴ 元码中可以处理无限数目的部件;五笔只是处理125个或234个。 ⑵ 元码中可以按汉字本身具有的整体性和层次性来拆分汉字;五笔按已定义的字根来拆分汉字。 ⑶ 元码可以实现“自由”打字的境界,因为,您不受作者定义或未定义的约束;五笔可以实现“自如”打字的境界,因为,您在碰到不是作者定义的部件时,或是在作者定义了您不知道的部件时,您必须拆分为更小的部件或笔画,或抓瞎。 ⑷ 元码的“活”的设计,让系统具有充分的可扩展性;五笔的“死”定义,使系统进化遇到困难。 …… 元码思想的表述确实是一个大的课题,这在一定程度上反应了事物在发展中阶段式前进的特征。与诸位大侠、高手、同道、打字迷们探讨,应有助于元码的理论的不断完善,也许有一天能真正做到“深入浅出”的。 第四讲 “取补”分散 今天心情很好,咱们接着聊聊“取补”分散的话题。这可是元码中最重要的编码思维之一,在您理解的基础上,还要求多多练习,掌握25个补码字,并做到自动舍音首取韵首。 元码输入法中需要您特别注意的是几个元音字母(aoeiuv)的编码任务的安排。这不可以想当然。在经过反反复复的计算和测试后,定义下列25字为补码字,并要求在取码时从音首移位至韵首:
见到“上三山长羊”类,就打“a”,见到“水竖川与雨”类,就打“u”,其余类推。例如:上→a,三→一二→ah、王→三丨→wau…… 在《模糊元码练习器》中,按F10键进入补码练习页,参考标题栏中的提示,认真研究以上25个补码字,做到自动舍元取补。 25个补码字,使系统的重码降至非常理想的程度,花一些时间去理解和练习,让您终生受益,在适当练习的基础上,从五笔的“自如”打字的“打字工具”阶段,进入元码的“自由”打字的“打字玩具”阶段。因为,元码打字就象游戏一样,让您着迷。 元码迷, 爱元码, 就象老鼠爱大米。 元码迷, 爱元码, 就象爱着梦中美丽的lover。 第五讲 部件结构 部件的选取和键盘定位问题,是所有封闭式输入法争论的焦点。选多少个,多好或是少好,用什么键位来处理,怎么去联想(如五笔、表形……),最后,封闭类输入法的胜者当然是王永明先生的五笔字型啦。 如果大家还在这块一亩三分地里争来争去,就别再争了,因为,大家都认同王先生的五笔画的有序化方式了,已有定式了,就让五笔为“王”好了。 不过,毕竟五笔还要让您记忆125个或234个“臭虫”,对于许多人来说,这是过不去的门槛。过了这个卡,还有那个关…… 部件是由汉字拆分后形成的,理论上说,部件数目是无限的。苦主打的比方很好:“这就好像一千个人有一千个不同的样子,我们单纯用圆脸、方脸、瘪脸去套,都还会有很多的漏网之鱼,那么怎么把它们一网打尽?只有把他们总归为男人和女人,漏网的几率才会少一些”。 用模糊的智慧,可以把地球上60亿人,概括为男人、女人,或是白人、黑人、黄色人种……,若非得一个一个去记忆,真是一辈子都没指望了。 元码输入法按模糊判断将部件归为8个重要的部件结构,其余小的部件结构在碰到时掌握就可以了。 ⑴ “模糊对称v”:⺮癶卝夗双北…例如: 笔→bvm,朝→cvy,登→dvd,祭→jvi,业→yvh,背→bvy。 ⑵ “部件交重p”:聿禺夬朿巿冘 …例如: 春→cp,肺→fyp,妻→qpn,啄→zkp、枣→zpe、枕→zmp。 ⑶ “两笔相连l”:卜丆丩…例如: 占→zlk、而→el、年→nl、收→sl,乡→xlp。 ⑷ “一笔串两笔c”:艹廾卄…例如: 茂→mcw,弄→nwc,廿→nch、举→jxc、专→zcn、戈→gcn。 ⑸ “两笔相交i”:十七乂廴…例如: 卉→hic、艾→aci、左→zig、建→jpi、也→yi。 ⑹ “有戈组合g”:戈弋戋戉…例如: 找→zog,代→drg,贱→jbg,栽→zgm,越→yog,彧→ygkh。 ⑺ “有止组合z”:止疋疌⺪⻊…例如: 扯→coz,蛋→dzc,捷→joz,疏→szu,卸→xze,跳→tz。 ⑻ “有钩组合o”:勹尢冂卂旡…例如: 勾→gos,用→yoc,迅→xo,既→jgo,畏→wto,钩→oj或gjos。 仔细研究以上8个部件结构,掌握部件按模糊思维的归类方式,就离精通元码输入法不远了。又如: 那→~(有钩组合)阝→no 乡→~(两笔相连)丿→xlp 也→乂(两笔相交)乚→yi 龜→丿~(所有未定义的部件)→pp(元码字典) 鼎→目~(模糊对称)→dmv 脊→~(模糊对称)月→jvy 捷→扌疌(有止组合)→joz 栽→(有戈组合)木→zgm 专→卄(一笔串两笔)丶→zcn、书→scn、戈→gcn 带→丰(一笔串三笔)冖巾→df、戋→jfn、伟→wrf ………… 部件结构是元码开放式编码原理的核心,具有举一反三的特点,让您学一字,通一片,通一片,就能一通百通。 开放式编码原理可以处理无限数目的部件,让您打字时不必当心我“模糊”有没有定义某个“臭虫”,开动您的智慧,开动您的举一反三的想象力,您会发现,您也是很聪明的,也是会思考的。 开放式编码原理能够最大限度地维持汉字的整体性和层次性,充分还原汉字在哲学和美学意义上的整体“美”。 第六讲 符号 汉语中的符号包括常用的标点符号、数学符号、特殊字符等等,也是文本中常常出现的。若将符号看成另类,需要专门的方法来输入的话,打字的流畅性也会大打折扣的。 元码中目前对394个符号作了定义,大大提高了打字的效率。例如:
对标点符号定义,使打字节奏在输汉字与输标点时一致,可使文本外观更加整齐美观。 ███████████████████████████████ ▁▂▃▄▅▇█▔▔▔▔█▇▄▁◢◣____▁▂▃▄▅▇█……… 第七讲 功能键 功能键可以说是音码类的专利,形码中编码空间都已耗尽,不能采用功能键的编码原理。 功能键可用于解决一些特殊的问题。例如: 地名是一大类名词,可以设“e”键为地理键(earth)。例如: 北京→eb、香港→ex、日本→er、俄罗斯→ee…… 类似地,“u”可用于人名、“v”键除用于符号外,还有空间可用于常用词、“i”键用于上下文连接的词、“o”键用于序数词等等。 功能键的使用可以大大提高中文输入的效率。再如: 第一→ody、爸爸→ub、可以→ik、因为→iyv、所以→isy、起来→vql、开始→vks…… 第八讲 元码数字 元码数字指十一个字母用于表示一、二、三……。 定义下列十一个字母为元码数字。
元码数字用于序号和拼音的编码,例如: 第一(ody)、第二(ode)、第三(oda)…… ā(vay)、á(vae)、ǎ(vaa)、à(vas)…… 第九讲 小结 元码自1999年开始研制,至2004年11月26日止,全部编码规则研究到位,其间整整用了五年的时间。 元码目前只是一株幼苗,但已不是弱者了。中文信息化问题的彻底解决,需要大家的共同努力,我相信,在传统的拼音和五笔基础上,开辟全新的一类编码思维——元码思维,必将为沉寂的中文输入法界注入一弘清澈的活水,但愿我们能共同迎来中文输入法的春天。 感谢诸位同道、大侠们的关爱,不足之处在所难免,也请诸位多多包涵。 (完)发表日期:2005-3-28,与《五笔爱好者论坛》同发。 |
||||||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||||||
|
版权所有(C)2001-2005 北京首书林文化有限公司 更新:2005年08月13日 |