也谈谈给 blog 打分

老白最近在说给 blog 打分的事情,不管到底该怎么打分,对订阅数量很多的人来说,一套自动给 blog 排名、筛选的机制看来是急需的了。

说到打分,我觉得有三点需要重点谈一谈:

第一是作弊。
当你把投票权交给用户的时候,怎样才能够保证其中不会有人疯狂地作弊,使得打分结果出现严重偏差?一个机制首先要有效防范人性恶的一面,才够资格让人信赖,否则的话就要靠其他人的力量--比如说站点管理员--来制衡。但很多时候就算投入人力也无法制约,比如经常能够见到有人到论坛中请人帮忙投票,这种投票是无法防范的。

第二是方便。
说实话,看完文章后愿意打分的用户是少之有少,毕竟要看这么多文章工作量也实在太大,搞不好到最后只有作弊者愿意打分了。所以,要让用户参与评价,“投票”方法越方便越好,最好的当然是不劳用户自己动手,比如未完成在《RSS阅读排序与过滤的7种方式》中介绍的几种统计分析方式。

第三是排名的合理性。
个人以为像 Google Rank 那样一个大杂烩式的排名是不适合 blog 的,因为每个人的口味偏好都不相同,大多数人认为最好的 blog 并不一定就是我最喜欢的,所以,需要根据某一部分与你偏好差不多的特定人群来决定排序。这不是一个简单的打分就能够实现的,也不是仅仅一个 blog 排序页面能够展现的。

既要防范作弊,又要方便操作,还要能够细分数据,符合这三个条件的,我首先就想到了 Last.Fm

在你听音乐的时候,Last.FmAudioScrobbler 插件在后台就已经把歌曲信息上传到了服务器,你听过哪支乐队的哪支歌曲,就决定了在 Last.Fm 上显示的统计数据。这样提交信息的成本几乎是0,只要第一次配置正确了,后面的工作完全不用操心,而作弊比不作弊的成本高太多,又没有什么好处,可以说基本不会有人作弊。

Last.Fm 提供的统计数据也是非常详尽的,无论是根据歌曲寻找同好,根据同好寻找歌曲都非常方便,还是按照风格等分类寻找资源,都不在话下,只要用户数的规模够大,即使是品位另类的人也不用担心找不到有用的信息。

回到 blog 打分这个话题上面来,我想其实完全可以借鉴 Last.Fm 的方式。Blogger 对应的就是乐队或歌手,blog 相当于专辑,因为一个 blogger 可能有多个 blog,而一篇 post 即相当于一首歌曲。

生搬硬套也不行,至少有以下几个问题:

第一,是根据阅读 RSS Feed 还是根据浏览的页面进行统计,是通过类似 Bloglines 的在线订阅服务、为离线阅读器开发插件还是为浏览器开发插件来收集信息?不论用什么方法,都要注意保证用户学习的东西别太多,这个是吸引尽可能多的用户的基础,而用户数足够多的时候,即使只是一部分 blog 读者,其产生的统计数据也足够作参考了。

第二是音乐文件有现成的 tag,blog 大概只有 URL 和 RSS Feed 地址能够作为标识,所以处理的时候会复杂一点;音乐文件有时间长度的概念,听完自然就切换到下一首,很少有人会同时听数首或者反复播放同一首歌,可你很难知道一个用户阅读 feed 或者 post 的准确时间,可能他只是忘记关闭窗口,或者先阅读其他文章,过一会儿再切换到这一篇。

第三,用户规模不容乐观。
相对于传统用户,订阅、浏览 blog 的用户本来就不算多,和使用电脑听音乐的用户数也有很大差距。
订阅 blog 数量太多,需要有服务帮忙筛选的人只占其中一小部分。
愿意寻找优秀的 blog 的人比愿意寻找感兴趣的音乐的人更少。
愿意安装插件、换用服务的用户比例也不会高,即使并不麻烦。
用户不多又会带来难以吸引新用户的恶性循环。

想到这里,到底还是和操作系统捆绑有优势啊…

当然 Last.Fm 也有不足之处,如要么根据某支乐队、某支歌曲,要么根据某个用户听过的所有歌曲预测相关的资源,却不能够根据某个用户的部分歌曲集合预测,假如我想找同时喜欢 U2、Beatles、Eels 和 Akira Yamaoka 的 Silent Hill 系列音乐的用户--这个预测不应该被其他乐队、歌手的信息干扰,如 James Blunt--那么现在的 Last.Fm 是无能为力的。
同样的道理,我经常阅读的 blog 既有 IT 类的又有人文类的还有娱乐类的,如果另一名用户在后两类 blog 中的选择与我口味相近,我该怎么找到他呢?

如果这个 blog 评价系统行得通,那么针对不同类型用户的分类广告也就好做一些了。另外如果是基于 feed 进行信息收集,也许可以实现这样的功能,blog 作者能够知道谁、多少人正在通过 feed 阅读他的 blog。

posted: 2006/04/02
under: 灯泡短路, 软硬挨踢