【搜索算法】靠item标签召回,超越ElasticSearch+分词的baseline
要超越ElasticSearch+(item名)分词的baseline,如果都要求 有相关性的item(有token匹配),其实就是相当于优化分词,而分词优化的极限就是把 item名和query词 切分成字级token。所以标签召回,只能是相当于 扩充更多的 推荐的item。搜【健身】,搜出【哑铃】就相当于是推荐出的item。比如搜【杠铃】,搜出【哑铃】可以,
·
要超越ElasticSearch+(item名)分词的baseline,如果都要求 有相关性的item(有token匹配),其实就是相当于优化分词,而分词优化的极限就是把 item名和query词 切分成字级token。
所以标签召回,只能是相当于 扩充更多的 推荐的item。
比如搜【杠铃】,搜出【哑铃】可以,但ElasticSearch本来也能搜出【哑铃】,
搜【健身】,搜出【哑铃】就相当于是推荐出的item
总结,想超越 ElasticSearch+分词 的baseline,如果非要加 强相关/有query-item token匹配 的item召回方法,那无异于 就是在优化分词,所以实际还是要向 辅助搜索的推荐item 的方向做。

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)