Posts Tagged ‘输入法’

云输入法启示

Friday, November 6th, 2009

搜狗发布云输入法后,正面的赞扬主要有:
1、跨平台;
2、无需安装;
3、识别率高,整句输入有优势。

但刚刚推出的产品问题也不少:
1、只能在浏览器中使用;
2、浏览器地址栏、部分网站文本区域无法使用;
3、与传统的本地输入法软件相比,实用功能差太远,如模糊音、自造词、快捷键自定义等等;
4、响应速度慢,没有流畅的感觉。

虽然还达不到取代本地输入法的程度,但不可否认这个产品很有想法。而我最看重的是,云输入法这种模式也许正是整句输入法翻身的好机会。

目前中文输入法主要分为两类:
整句输入法包括微软拼音、智能狂拼、黑马神拼、自然码等,其哲学是:让用户在输入一个整句的时候不用打断思路,一次性输入整句文字的拼音再做后期调整,最终目标是几乎不用调整;
词组输入法是主流,包括智能ABC、拼音加加、紫光华宇、搜狗、谷歌、QQ等,其哲学是:以词组或词组群为单位输入,保证用户能够最快速的选中正确的词组。
两者在技术上的根本区别在于语料库的处理和整句算法。
词组输入法通常只需要关心词组的使用频率,即使有上下文关联功能也比较简单。而整句输入法的算法更接近人类的自然思维模式,但依靠庞大的语料库、用户整句输入历史数据分析才能得到可以接受的结果——这就导致整句输入法的体积非常庞大,智能狂拼曾经要用一张光盘装,自然码使用的黑马神拼语料库在200MB 以上,微软拼音也有将近100 MB,这大大影响了整句输入法的普及,语料库体积和整句正确率成为了整句输入法的基本矛盾。

而依照云输入法的思路,整句输入法完全可以将语料库的存储、用户语言习惯的分析交给服务端完成,客户端只是一个输入输出的界面,或者是断网时可以满足基本需要的词组输入法。

于是,将只剩下一个问题要关注:用户隐私。

小鹤双拼

Sunday, July 6th, 2008

练熟了自然码双拼方案,又发现不少人说小鹤双拼的声韵搭配、键盘布局更合理,本来心想自然码双拼方案已经为各大主流输入法支持,如果更换成其他方案,适应性是个问题,比如自然码、谷歌拼音的界面就不支持自定义双拼方案,其他的输入法都需要新增编码方案。

好在小鹤双拼的主页上给出了部分输入法现成的方案配置文件,直接替换即可。
而小鹤双拼与自然码方案的13个差异应该比较好适应吧?上手自然码双拼方案的时候,一天时间就足够记住对应关系,一周时间就可以比较熟练了。


小鹤双拼的编码方案

其实不觉得双拼的速度比全拼快很多,击键虽然少了,爽快感也跟着少了,好处则是,不用再输入拼音分隔符,手写的时候可以当作速记的一种办法,也可以用于便捷的加密。

智能狂拼测试版

Tuesday, June 10th, 2008

听说智能狂拼新版本已经进入半公开测试阶段,于是下载了080606的α版本。
整体来说存在不少问题,不建议安装使用:
1、界面方案不稳定,可能暂时出现缓冲行、状态栏、候选句子和字无法显示的问题;
2、自定义编码方案生成之后只能够删除重新生成,不能修改;
3、候选句子、模糊音功能暂时无效;
4、引号等标点的自动配对问题很多;
5、部分设置随机生效失效;
6、有的无关偏僻字会进入首选句子,比如 fou 出现了“不”,ru 出现了“女”,yu 出现了“吾”。

相比3.3的版本,目前看得到的改进点有:
1、Tab 进如英文输入状态之后也可以直接输入数字了,中英文数字标点混合输入的能力有了加强,相应的,切换是否显示候选数字的快捷键没有了;
2、支持通过邮箱同步配置,不过因为还是测试版,所以没有试用这个功能;
3、新增了声母定位和字母候选方式;
4、修正了3.3版本中普遍存在的“初始化错误”问题;
5、识别成功率有了提高。
其他新功能见这里(页面还没有做好)。

主流拼音输入法功能比较

Sunday, January 13th, 2008

总是看到许多人为了争论哪个输入法最好而相互骂得不可开交,简直恨不得把不用自己喜欢的输入法的家伙统统踹死。其实输入法这东西和其他任何工具(比如浏览器、手机、相机)一样,只有适合自己的才是最好的,非要说服别人和自己作出同样的选择,只是一种近乎病态的心理了。

EditGrid 做了一个“主流拼音输入法功能比较”的表格,把3款整句拼音输入法和5款词组输入法一起比较,比较的目的不是要弄个什么总积分出来分个高下(毕竟就连最简陋的智能 ABC 也有高手用出了境界),而是给部分还没有尝试其他输入法就开始无端贬低的人和希望找到真正适合自己的输入法的用户。
其中的自然码和智能狂拼严格来说已经游离在主流之外了,但功能和理念突出,而且整句只有微软一家也太冷清了;智能 ABC 虽然功能简陋,但仍然用户众多;QQ 拼音输入法出来不久,功能不多也没什么特色,因此没有列出;非 Windows 平台的输入法既非主流,功能上也不在一个档次,暂时不对比。

因为个人的精力有限,以及有几个输入法我自己不用,因此这份表格还远没有完成,必然存在大量的错误和遗漏,尤其是各输入法的特色功能。我想,最好的办法还是交给大家讨论。
目前的表格是锁定了的,EditGrid 用户可以在“留言”的那个工作页写下补充意见,由我来正式修改。如果更新量大,没有人恶意捣乱,再逐步开放编辑权限。

新华拼音输入法

Wednesday, January 2nd, 2008

在和人讨论输入法的时候,有人提到了新华输入法功能很强大,于是抽点时间试用了一把:

输入法属于属于词组输入法范畴,一次输入不超过20个汉字,优点和特色有:
附加功能相当强大,可输入拼音日文偏旁部首繁体,支持粤语语音辅助输入;
支持全拼、双拼、简拼、笔画输入,支持自定义双拼编码;
支持英汉输入,输入英文,可选择对应的中文翻译;
支持根据声调、词性筛选,提高识别率;
可以成组输入中、英、日文的同音词、同类词、同类符号
可以查找同义词、反义词笔画、读音、正序词组、逆序词组(紫光干脆增加了通配符功能,够狠!);
繁體輸入的準確率比搜狗、穀歌、拼音加加要好(搜狗3.1版已經修正了一些繁體詞組錯誤了);
候选字词与联想的长词分开,既可以减少翻页,也可以快速输入长词。

缺点和不足则是:
按键自定义不够灵活,如翻页键还是老式的+-,.[],不能够选择 Tab;中英文切换虽然可以选择 Ctrl,却会占用热键,导致其他的功能失效;词性筛选的快捷键只能在已有方案中选择;还有如删除自造词、候选长词上屏、快捷搜索等快捷键根本无法自定义。这对于智能 ABC 或微软拼音的用户来说可能不是什么大问题,但是对习惯了各个新兴输入法丰富的自定义选项的我来说就比较麻烦了,好在适应的速度还算快。
同样的,其他输入法好用的特色功能它也缺少,如回退清除错词(搜狗、加加、紫光都开始用了)、自动纠正;
自定义短语的编辑和使用很不方便,必须手工导入,调用时还要使用专门的识别键;
附加功能开得越多,响应速度就越慢,还需要优化才行;
不支持以字为单位移动光标,只能一个字母一个字母的移动,输入长词时不方便修改;
词库比较落后,又不能够直接导入其他输入法的词库。

总体的感觉是:附加功能很多,但调用方法太复杂,反不如其他输入法利用自定义短语实现来得有技巧,核心的功能又不够方便和强大,自定义选项不足。

本文用自然码输入法混合新华输入法输入。