`
weimou66
  • 浏览: 1244705 次
文章分类
社区版块
存档分类
最新评论

说说博客匹配、推荐与搜索系统

 
阅读更多

现在要找到一个跟自己相像的人并不容易,特别是当你思想比较独特的时候。然而博客等个人主页型网站的规模化,为我们提供了更多的信息与偶遇的机会。有的时候确实会看到一两个人的博客后感觉如此清新,相知恨晚。我就有这样的经历,在一次偶然的机会中,看到一个人的新浪博客,她的内容或许不是真正吸引我的元素,但她的音乐列表却是独特的,她爱听的歌几乎全部都是我爱听的歌曲,无论这些歌我听过或没听过。这样的例子很多,并且并不局限于博客,很多网页,那些你所不知道的网页,都是能够让你一见钟情、相见恨晚的网页,但是你却不知道,这就是信息整合的问题,搜索引擎在努力、门户网站在努力、社交网络也在努力,但这确实是一个非常大而且复杂的问题。在这篇文章中,我主要想说的是社交网络上基于博客(日志等)的匹配与推荐,把你可能一见钟情与相见恨晚的博客推荐给你。

我相信已经有人在思考这方面的问题或已经着手去解决了,但我至今没有看见好的解决方案,在人人上、新浪上。解决这方面问题需要的领域支持无非是自然语言理解与模式分类,因为既然基于文字的匹配,最简单的方法自然是统计词频,通过词频建立每个博主的“博客向量”,将博客向量最相近的博客推荐给你,并且利用如今已近比较成熟的技术,通过你喜欢的人的喜欢来揣测你的喜欢,就能够实现最基本的博客推荐了。但问题在于,利用简单的词频统计算法得到的“博客向量”似乎是很“愚蠢”很机械的,没有人再判断两个人的性格喜好的时候只利用词频统计的方法吧,我想。因此,高级的自然语言理解的知识就能够发挥作用了,通过该领域的技术能够分析抽象出更高层次的参数,比如博主的性格,博主关注的话题、博主对某一话题的观点,再通过模式分类技术将这些参数进行模型化,从而就能够实现较为人性化的博客推荐了。或许就可以这样,我输入“我相信技术改变未来”,然后系统将返回跟我持有最为相似观点的博客,当我需要某方面的支持的时候,我就可以直接用自然语言提问,系统通过搜索就能够返回这个问题的答案或最有可能解决这个问题的博客,这样即便我找不到问题的解本身,但我可以找到最有可能帮我解决这个问题的人。当然,既然这都能做到,自然也可以做到,当你无聊的时候,你就可以通过这个系统“很有目的”的浏览陌生人的博客,去发现那些能够让你一见钟情、相见恨晚的博客。

我相信世界上大多数在使用计算机的人并没有因为它而转变自己的思想。我们“曾经”是如此孤立的个体,物质上、“精神”上,但是计算机的出现,信息不在只是大脑中的神经与电流、不只是书本上的文字、不是事件发生的现场,而已经成为网络上的比特流,这种比特流可以无处不在,可以与人事物融合。因此问题已经不是原来的物理阻隔,而是当你拥有时候如何处理。可以预见到,随着传感器技术的发展,所谓的机器已经能够得到人们通过五官所得到的所有信息,以至必然更多的信息,而且这些信息以比特流在网络中可以几乎无障碍的传输,只要我们有足够智能的处理手段,机器像人一样智能将不再遥远,而这种市场的需求绝对是空前的。问题的关键不在于能不能得到,而是得到了你该怎么办。这方面的问题就太广了,就此打住吧。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics