什么是整句输入法?

长期围观本 blog 的读者应该知道,我写过不少关于整句输入法的东西,是智能狂拼的拥趸,虽然因为兼容性(2代)和稳定性(3代)的原因,没有用它当主力输入法,而且现在智能狂拼的开发基本停滞,但我始终相信整句输入法是有市场的,随时准备转回使用满意的整句输入法。

看到知乎上有人问:中文输入法中的「整句输入」特性指的是什么,真的对中文输入有很大帮助吗?觉得有必要为不熟悉整句输入法的人宣传一下。

整句输入法的概念应该要追溯到中文之星智能狂拼、黑马输入法、微软拼音输入法这些前辈。当时提出整句输入的概念,是想追求一个现在看来都很难完美实现的目标,同时也作为最大的卖点:一次输入整句话的文字,不用任何修改,直接上屏,除了构成文字的必要元素对应的击键,不需要额外的击键和修改,也不会因为频繁的选词影响思路,总而言之,流畅而准确

但现实是残酷的,智能技术是缓慢发展的,到目前为止,还没有任何整句输入法能够达到上述的水平,在不远的未来也还看不到什么希望,而随整句输入法而来的其他问题,比如长句定位和上屏之前的修改,反而使大部分用户抛弃整句输入法,选择词组输入法。

但,词组输入法毕竟还是不能完全满足用户对“流畅、准确”的终极心理需求,各种增强方案,如直接和间接辅助码、智能联想和词频调整、矩阵候选界面、模糊音和简拼支持、双拼方案、意群词库、智能断词、细胞词库、人名识别、云端识别等等,层出不穷,其实只是因为需求缺口还在。

回到原始的问题上来,我觉得整句输入法具体应该包括以下几点:
词和字的自动选择必须要结合上下文智能判断,如果单纯只是按词频确定,就等于完全不按空格键选词的词组输入法,这里的上下文可以是同一篇文章中的上下文句子,可以是语料库、云端中的句子,也可以是不同情境下的历史文字。站在更高的高度尝试分析、理解用户的输入习惯,预测输入意图,这才是整句输入法与词组输入本质的区别
待上屏(即不需要用户事后再修改,可以智能自动调整的部分)的句子应该要足够长,比如若超过10个字就必须先上屏,那大部分的句子根本就无法完整输入再上屏,这就和意群输入差不多了。
中英文、标点符号混合输入一同上屏:外文、标点符号也是整句中常见的元素,如果一遇到外文和标点符号就先上屏再说,那也和词组输入没有什么区别。不过至今还没有完美实现这一特性的整句输入法,比如我喜欢在中英文间插入空格,仅有智能狂拼3能够勉强做到,但还做得不够好。

符合以上条件只能算最基本的整句输入,实际上,如果不提供辅助手段弥补整句输入的缺点,便不能算作实用的整句输入,这也是智能性不足约束下的无奈之举,例如:
长句定位和修改功能:在达到长句识别率百分之百正确之前,整句输入法都要面临返回定位和修改的问题,在这方面,智能狂拼是最有创新意识的,下标快速定位、声母快速定位、快选候选句子、间接辅助码等等,都是不错的尝试。
排除智能自动功能的干扰:有的时候本来一句话中只有一个词是不对的,可是将其改正之后,因为上下文智能匹配功能发挥作用,其他更多的词反而又自动改错了,所以需要提供手段告知输入法哪些是不需要其插手的,这方面有分段确认、提供关闭智能匹配的选项等办法。
语境参与智能判断:智能狂拼3在挣扎着求突破的时期曾经提出过语境切换的概念,但实现手段还非常原始,搜狗输入法最近的智慧版也提出了情景感知的概念,同样还有很大的局限。


通讯录服务应有的变革

看到《触宝拨号怎么做“第三代来电显示”》这篇文章,想到了深藏心底已久的一个想法。

其实电信运营商手中掌握了更全面用户的身份信息,完全可以考虑打通一下用户之间的联系,在通讯录管理方面做更多文章。

为什么一定要记住联系人的号码?人一多,就算是短号也不好记忆。
在通讯录中看到的不应该是一串数字,也不是电子邮件那样因为重名太多只好另选名字导致容易记错的英文字符串,而应该是面向人类的语言,是你想到某人时自然而然就蹦出来的身份的文字描述,比如 YouKnowWho at Minitrue、发小黑皮、老板张大民、观海听涛奥巴马,猪如此累。
用户不需要关心底层的实现是怎样的,只知道根据通讯录能够找到对方就行。

想像一下,手机一碰,或者生成一次性二维码让对方识别,我的联系信息就授权运营商开放给对方查询了,同时运营商也记录下我将联系信息开放给谁。
若限定是商务来往,通过运营商发过去的就只有商务邮箱地址和工作用的手机号码。
要是还不够熟,也可以只发给对方一段代码,运营商根据此代码仅提供指向我联系方式的“链接”或永久绑定的伪号码,呼叫过去,对方并不知道真实的被叫号码是多少,邮件、短信也同理。
倘若双方绝交,只要告知运营商收回对方查询调用权限即可,完全没必要在移动端设置黑名单,甚至更换自己的手机号。
而如果哪天真要更换、增减联系方式了,也只是告知运营商“逻辑号码”原来指向的“物理号码(同时包括现在运营商定义的逻辑和物理号码)”变了,再也不需要一个个地通知所有联系人,还担心有遗漏。

至于查号,也不需要本地保存数据库,商户注册开通电话、手机时告知运营商开放联系信息就行(这一点其实现在的运营商查号服务就应该提供查询的应用,阻碍也许是收费不便),更换地址和联系方式后,以前保存了联系信息的客户也不会丢失。

其实这就像即时通讯软件 ID 从一串数字到注册邮箱再到实名的演化一样,但即时通讯软件的问题是本身就是远程的独立的交互场景,缺少移动场景那种面对面沟通,从一回生到二回熟,先面交再神交,才发展到交换联系方式的过程。
而且这样的通讯录管理变革应该覆盖所有的人人交互领域,没有电信运营商参与是不完整、不彻底的。


高端用户

经常看到身边的人购买商品或者服务时,为了节省一点点的金钱,不惜花费大量的时间、精力,比如说,要购买品质相差无几的商品,为了几元、几十元钱的差价,连续数天时间来回奔波,不断地搜集信息、比价、挑剔。

可能你会想了,能够节省几十元、几元钱,那也是很了不起的,确实该有这样的意识。

是,我无意否认涓滴不遗的节流意识,但我总觉得,投入的时间和精力成本实在太高了,这些人用节约这些支出所花费的时间和精力,能否创造更多的价值,即使减去付费的成本,仍得到更多的收入呢?
而如果总是在两者之间选择前者,说明其本人认为投入相同的时间、精力,用于节流比开源收益更多。

如果身边绝大多数人都不惜用大量时间和精力换取节省一点点金钱,整体来看可不可以认为,要么是其生产效率很低,要么是其产出与回报严重不成比例?

从这个观点说开去,我又想到所谓“高端用户”的定义。

对商品或服务提供者来说,“高端用户”定义最简单直接的就是“给钱最多的用户”,或者各种折算成在某种统计方式下“给钱最多的用户”,要么就是人为划分的阶级,比如一线城市白领阶层之类的,但我觉得那些把商品或服务提供的价值看得比付出的费用重要得多的用户,才算是高端用户。

这么说很拗口,可其中确实有很微妙的差别:
一、他要认识到你的产品和服务的价值,他是为了这个才付钱使用的;
二、在他看来,产品和服务带来的价值,或者为之节省的时间、精力或其他资源,比金钱宝贵得多。

共同之处在于第二点,只要用户愿意付费,那么说明他认为花钱是值得的。

举个例子,许多移动用户宁愿花许多时间等待心仪的应用降价、免费,或者寻找和下载盗版资源(排除支付便捷性、安全性等因素影响),这部分人只有成为高端用户的潜质——如果未来他们收入增长或者观念改变的话。

但这还只区分了付费用户与免费用户。如果某个用户追着买你的新一代产品,花钱如流水,他就是高端用户吗?
未必。

若是站在苹果的角度,我才不会把那些因为跟风、虚荣而高价买 iPhone 的用户当作高端用户,哪怕他们有钱到愿意买 I AM RICH。
他们可能能够贡献超出平均一大截的收入,但他们不是为了产品的价值理念而付费。

这就是那个微妙的分歧所在:

生产商品,提供服务,根本目的不是创造利润,而是实现你所创造的价值——利润只是消费者认同价值的主要指标和维系生产者生存、提升生活质量的必要条件,并非终极目标。
如果你单纯用“钱多”来界定用户是否高端,有可能会被那些不差钱但和你的目标完全没有交集的用户带到沟里去,他们不在乎花钱,但更不在乎融于产品中的信念

不过话说回来,在实践中能够量化的指标才有意义,如果无法按以上的标准判断什么是高端用户,那就先先充分理解自己的产品或服务吧,记住不要被错误的对象带到沟里就行了。


|