输入关键词,然后得到准确搜索结果,就是搜索引擎科技?用户对此习以为常,但这不是全部。
看过《盗梦空间》的人都知道,梦境是有层次的。实际上,需求也有类似的情况。最表层的可能就是我们意识中的“精准需求”,明白的知道自己想要什么,比如“北京天气”,“北京到上海的航班”等。但是,除了少部分可以被“精准表达”的需求外,大量用户需求更深入的藏在潜意识中。随着移动互联网的发展,通过手持智能设备访问互联网的用户越来越多。移动互联网用户或是不知道自己想要什么,或是输入困难,导致需求表达的模糊性。这就是IR(Information Retrieval)信息检索领域所研究的“泛需求”和“潜在需求”。关于满足精确需求和模糊需求的方法,我们可以把它看成是填空题和选择题的关系。填空题需要用户自己准备答案,而选择题是IR技术引擎给你准备好了选项。
周末天气不好,在家看场电影吧?那啥啥听说不错?可惜一部电影的名字也记不起了,于是念头一动,搜索“名著改编的电影”……恩,《悲惨世界》!
(搜索“名著改编的电影”百度框计算自动给出靠谱推荐)
现在,你搜索“三亚”,百度结果中除了百度百科词条,还会给出三亚的景点及最近一周的天气预报;你搜索“室内绿色植物”,百度会直接回答你有吊兰、龟背竹、龙舌兰、散尾葵、鸭脚木……
什么是潜需求?你搜索“雅安”,第一想到的是抗震救灾新闻和百度百科释义。但是其实这个时候了解当地天气也是极其重要的,于是天气就是潜需求。比如搜索“范冰冰”,百度给出了范爷的基本信息和最新动向,而与之关系密切的成龙、赵薇、佟大为也都可能是你潜在有意关注的对象。
“对,就是这个!”当你还只有个模糊的问题在脑海中,不清楚自己明确的需求时,百度通过新的IR技术让你收获惊喜。作为新锐的IR技术引擎,百度搜索已经不再是“说一是一”的机器,利用知识库和机器学习技术,它已经懂得“举一反三”。整合理解搜索人的询问,并智能表达的能力。
(百度“范冰冰”关联推荐:其他人还在搜成龙、赵薇、佟大为、王学圻等)
百度推荐引擎技术揭秘: 统计学习理论和云计算的交叉火力
上面说了这么多新IR技术在产品体验层面的感知,在其背后支撑就是百度推荐引擎。在日前举办的百度技术沙龙上(http://www.infoq.com/cn/zones/baidu-salon/),百度个性化推荐部门的资深工程师深入披露了百度推荐引擎技术的实践和思考。
了解到,百度推荐引擎实现了两大核心功能。第一是过程优化,比如原来用户要从A找到B再找到C,最后找到D,如今有可能直接让用户找到D,这样带来的好处是节约了时间,提升了搜索效率;第二是兴趣发展,即原来用户只找到A,但B、C、D实际上都和A有关联。它在一秒钟之内就能完成推荐,但是背后却是整个搜索基因的图谱在支持。这是非常复杂的技术过程:一方面需要广泛的应用统计学习理论进行数据建模和挖掘,另一方面,需要利用云计算技术解决计算规模和计算性能的问题。
一切复杂的技术都是为了更便捷的用户体验。百度推荐引擎技术团队在融合内容推荐和协同过滤的基础上,引入了“隐语义模型”(Latent Factor Model),用于用户偏好的挖掘和扩展,并能从搜索日志中挖掘用户偏好的最自然描述。为了改善计算性能,缩短更新延迟,百度推荐引擎应用大量实时增量式算法和流式计算技术,因此,在整体效能上比传统推荐引擎更加强劲。当然,对于普通用户来说,只要能直观体会到百度懂你,就够了。
百度推荐引擎的雄心:走向深度开放,拥抱垂直领域开发者
推荐引擎是基于云计算的新IR技术,但显然它不仅仅可以完善百度搜索体验。业内有一种看法认为,如果推荐引擎技术普及到更多网站或APP产品服务等,将极大提升整个互联网行业产品的用户体验,让互联网进入到“脑控”时代,触发“懒人经济”。
互联网经济经历了“眼控”的第一代分类目录,“指控”的第二代搜索引擎。而在第三代推荐引擎到来之时,所有的行为将是“脑控”,系统可以智能猜中用户所需所想,推荐引擎也将带来信息关联度、有效性与精准度的性提升。一个“不搜即得”的时代来了。
在电商网站上买了一套礼服裙,会自动为你推荐首饰,还将为你推荐晚会礼仪须知;在机票预订后,会为你推荐预约叫车服务……推荐引擎技术一旦向全行业开放,各网站接入个性化推荐技术的门槛降为零,无论你在使用哪个互联网服务,更多合适的内容应用,将在合适的时间、地点,以合适的方式出现在你的面前。各个网站的应用黏性更大,中国互联网真正合纵连横。届时,沃尔玛津津乐道的“啤酒与尿布”的故事,将在互联网领域上演。据悉,百度已有开放自身推荐引擎技术的计划。我们翘首以待。