市面上搜索类产品众多,那么我们常用的百度、必应、搜狗等是靠什么脱颖而出呢?本文将介绍几款主流搜索引擎的产品体验,以及搜索用户的心理行为分析,最后总结出搜索前台和运营后台的设计方法,和我一起往下看吧 一、当今热门搜索产品体验 这次选择三款热门搜索网站体验,分别是百度、搜狗、必应。 模糊匹配对比第一次在三个网站中输入火会出现什么效果呢? 百度和搜狗,模糊搜索结果会出现:最近发生的新闻大事,或者近期高考结束会显示很多大学,以及和人们热点动漫、生活常识、星座、股票等,结果与国人的生活场景相契合必应,模糊搜索结果虽与生活关系较少,但也是当今一些热门内容 搜索结果对比在三个浏览器中搜索肚子疼 页面是由若干个框应用内容URL组成。国内搜索结果区,第一页主要以:广告、视频链接新闻链接、国家级官网热门官网、自身产品相关的网站(百度百科、搜狗百科等)等组成。可对结果进行时间、网站文件类型、站点等维度的筛选。必应搜索结果区的内容全部扒自外网,几乎没有自家的其他产品,只取精华,运用自家算法,提高了内容的准确度,提炼出用户更想看到的内容。页面右侧是框应用区,主要展示与用户Query相关的信息(相关作品、相关人物、相关知识等等),以及全网的一个热搜排行榜。必应的搜索结果区没有广告 二、搜索用户行为与心理预期分析 1、前端页面与系统联系 用户在前端页面搜索框中,输入关键词,传给后端代码,识别关键词,通过多路召回策略(下文技术方面会讲到),运用相关算法对结果进行排序,最后在前端页面呈现用户满意的结果。 2、用户行为与用户心理预期 情况一:用户知道自己想搜什么(人找物) 用户可能会准确输入自己想搜的内容,但可能会搜错字、搜百姓体、同义词等,在输入和搜索时,系统需要立即做出响应,push符合用户心理预期的结果。 系统根据用户输入,主动推荐模糊匹配内容;在用户搜索时,根据用户搜索,优先反馈符合用户预期的结果 情况二:用户不知道自己想搜什么(物找人) 这个时候需要系统主动推荐当前热点内容,或者反馈其他用户的搜索内容,来揣测用户的心意。 两种通常结合使用,实现搜索即服务。搜索排序内容与业务挂钩,前期应做好充分的用户调研和用户画像。 三、搜索前台设计总结 将用户行为拆解成:搜索前、搜索中、搜索后 举例:网易云搜索 搜索前:搜索框置顶,风格简洁明了;暗文主动推送相关热搜词,或根据用户喜好推送歌曲歌曲 搜索中:点击搜索框,进入搜索界面:展现历史记录,或者主动向用户推荐热搜榜单,满足第二类用户需求模糊匹配,会识别拼音、英文,命中词颜色变化 搜索后:如果是歌手,会用动态框应用展示歌手信息;命中信息颜色高亮,结果支持排序 四、搜索后台设计总结 搜索后台用于数据管理、运营分析。管理人员负责维护一些核心榜单数据,或者对搜索词进行管理;运营人员需要通过一些数据,来分析自家的搜索系统做得好不好,有什么地方是不足的,对产品、算法优化等提出意见。 搜索引擎面向大量的C端用户,及时收集用户反馈是重中之重。用户访问量高、访问深度深、跳出率低、收藏多的页面有着很大的排序优势。点击率高、翻页率高、点击位置的平均值高的列表页,说明还有待优化对于用户搜索的新词、未被查询到的词汇需要做收集,有必要时可扩充检索库数据五、搜索产品所需要的技术 1、多路召回 通常我们的搜索系统数据量达到百万级及以上,所以需要采用多路召回的方式采用不同的策略、特征或者简单模型,分别召回一部分候选数据,然后再把这些数据混合在一起供后续排序模型使用的策略。 2、数据标注 对于百万级的数据,我们通常会用AI技术对数据进行分类,以此来辅助改造和优化业务流程,减少处理时效、提高工作效率,数据标注对目前大数据行业来说十分重要。 数据标注的大致流程如下:首先建立一套标注标准,给数据进行人工打标,然后训练模型,根据数据的增加来逐步完成模型迭代,最后实现AI自动标注。 3、排序算法 随着互联网信息的爆炸式增长,搜索引擎为了不断提高用户查询效率与反馈信息的质量度,需要对自身算法进行不断地调整与升级。 排序算法有很多,比如:TrustRank算法、BadRank算法、谷歌熊猫算法、谷歌企鹅算法、百度绿萝算法、百度石榴算法等,虽然我不太懂技术,但一个好的排序结果可以从以下几个维度去考量:与文本内容匹配度高的优先时效性高的优先社会影响力高的优先点击率高的内容优先 。。。 智能搜索系统与业务息息相关,最最重要的是洞察用户需求,了解用户心理,来对召回策略、排序算法策略、此词汇权重值进行优化,以此达到用户的心理预期。前期需要项目经理和产品经理对用户进行深度调研,了解用户需求,精准用户画像,中后期也需要及时收集用户反馈,对系统进行不断优化,学会对数据进行分析。