我要加黑客qq免费接单黑客 ***

访客4年前黑客资讯1074

搜索关键字智能提示是一个搜索应用的标配,主要作用是避免用户输入错误的搜索词,并将用户引导到相应的关键词上,以提升用户搜索体验。

美团CRM系统中存在数以百万计的商家,为了让用户快速查找到目标商家,我们基于solrcloud实现了商家搜索模块。用户在查找商家时主要输入商户名、商户地址进行搜索,为了提升用户的搜索体验和输入效率,本文实现了一种基于solr前缀匹配查询关键字智能提示(Suggestion)实现。

需求分析
1.支持前缀匹配原则
在搜索框中输入“海底”,搜索框下面会以海底为前缀,展示“海底捞”、“海底捞火锅”、“海底世界”等等搜索词;输入“万达”,会提示“万达影城”、“万达广场”、“万达百货”等搜索词。
2.同时支持汉字、拼音输入
由于中文的特点,如果搜索自动提示可以支持拼音的话会给用户带来更大的方便,免得切换输入法。比如,输入“haidi”提示的关键字和输入“海底”提示的一样,输入“wanda”与输入“万达”提示的关键字一样。
3.支持多音字输入提示
比如输入“chongqing”或者“zhongqing”都能提示出“重庆火锅”、“重庆烤鱼”、“重庆小天鹅”。
4.支持拼音缩写输入
对于较长关键字,为了提高输入效率,有必要提供拼音缩写输入。比如输入“hd”应该能提示出“haidi”相似的关键字,输入“wd”也一样能提示出“万达”关键字。
基于用户的历史搜索行为,按照关键字热度进行排序
为了提供suggest关键字的准确度,最终查询结果,根据用户查询关键字的频率进行排序,如输入[重庆,chongqing,cq,zhongqing,zq] —> [“重庆火锅”(f1),“重庆烤鱼”(f2),“重庆小天鹅”(f3),…],查询频率f1 > f2 > f3。


解决方案
1.关键字收集
当用户输入一个前缀时,碰到提示的候选词很多的时候,如何取舍,哪些展示在前面,哪些展示在后面?这就是一个搜索热度的问题。用户在使用搜索引擎查找商家时,会输入大量的关键字,每一次输入就是对关键字的一次投票,那么关键字被输入的次数越多,它对应的查询就比较热门,所以需要把查询的关键字记录下来,并且统计出每个关键字的频率,方便提示结果按照频率排序。搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。
2.汉字转拼音
用户输入的关键字可能是汉字、数字,英文,拼音,特殊字符等等,由于需要实现拼音提示,我们需要把汉字转换成拼音,java中考虑使用pinyin4j组件实现转换。
3.拼音缩写提取
考虑到需要支持拼音缩写,汉字转换拼音的过程中,顺便提取出拼音缩写,如“chongqing”,"zhongqing"--->"cq",”zq”。
4.多音字全排列
要支持多音字提示,对查询串转换成拼音后,需要实现一个全排列组合,字符串多音字全排列算法如下:


相关文章

丁薛祥在看望中央和国单亲妈妈歌曲家机关青年联合会第一届

  丁薛祥在看望中央和国家机关青年联合会第一届委员会全体委员时强调 团结组织广大青年奋进中华民族伟大复兴新时代   新华社北京12月22日电 12月22日,中央和国家机关青年联合会第一届委员会第一次...

流金水好用吗 IPSA流金水使用感受

流金水好用吗 IPSA流金水使用感受

IPSA流金水一直都特火的,但是大家都由于价钱缘故沒有下手,那麼IPSA流金水用起來好么,我就而言说IPSA流金水的应用体会吧。 商品总体 接到有一个礼盒装,开启里边便是流金水啦,外包装盒是磨...

excel如何快速批量求和,excel教程

大家还不掌握excel迅速大批量求饶的实际操作吗?其实不是很难,这儿小编就共享excel迅速大批量求饶的方式內容,有必须的盆友不必错过了哦。       大家还不掌握excel迅速大批量求饶的实际操作...

微信公众号留言区,读者为什么不能相互评论?

微信公众号留言区,读者为什么不能相互评论?

评论是平台内容不行或缺的构成部门,评论区不只有作者和评论者的深度交换,也会呈现评论者之间的深度交互。可是微信公家号的评论区,只支持作者和读者之间的彼此交换,读者之间却不能彼此评论,这是为什么呢? 有...

我要学做红烧肉(怎样学做红烧肉)

红烧猪肉可以说是一道受欢迎的菜。去餐馆和餐馆是必须的。由于饮食文化和地理环境的原因,红烧猪肉的方法略有不同,但一点也不影响它的味道。煮熟的红烧肉又肥又薄,又甜又软,入口即化。 但是红烧猪肉怎么会好吃...

instagram怎么保存图片安卓(ins照片内嵌什么意思)

在好久好久之前以前读过一篇文章,详细介绍了在 iPhone 手机上及其安卓机上如何保存原画面质量的 instgram 照片,但是伴随着時间的变化,插口的变化,许多 方法都早已无效,以后依然有很多小伙伴...