搜索

热搜: 活动 交友 discuz

“向量召回”是什么,最新玩法揭秘--鬼脚七。

0
回复
125
查看
[复制链接]

75

主题

75

帖子

150

积分

注册会员

Rank: 2

积分
150
发表于 2021年 09:58| 显示全部楼层 |阅读模式 |主动推送
 
[写在前面]6月22周二,开新一期线上会员课程。标签叠加玩法至此终结。全新体系--向量召回爆搜闭环玩法 将给大家见面,这是一个颠覆认知重构搜索的知识体系框架、今天咱们就谈一点,玩法的底层逻辑部分。正文
什么是向量可能到现在大部分人也没搞明白,更别提什么是向量召回了。
向量的概念:
向量是既有大小又有方向的量。
用这句话解释好像也解释不清是什么。
要讲清什么是向量这一点,还是要多少讲一些算法上的知识。
大家知不知道,当用户搜索查询词搜索产品时,系统会通过Query理解(query是用户表达真实意图的方式)。
但是用户并不清楚搜索引擎的原理,所以系统第一关需要设计更好的系统来理解用户的Query。
这个系统(Query planner)叫做查询意图分析,简称QP系统工程。
QP系统,获取的信息主要就是通过用户查询关键词和客户身份识别,
QP就是对这两部分信息进行分析,具体怎么进行意图分析的我们课上再做详述。
大体步骤是经过Query改写、计划分发、结果重排这三个部分
用户的Query通过Query改写会针对类目预测、特征提取、人群个性化特征 以及语意扩展改写及用户个性化信息挖掘进行深度算法分析,通过搜索查询词和用户行为精准分析出搜索意图。
将搜索意图转化为机器(搜素引擎)能够理解的查询语法,从而获取用用户意图最相关的搜索结果,这个Query特征分析的语义转化就是向量。
也就是说Qp查询意图分析要和分析出的结果进行语意转换后购物意图要一致统一。这就是为什么我一直说向量解决的是语义相似度的问题
Qp意图分析和向量是精准的相似购物意图这样解释向量不知道大家心里是否有了“概念”。
上述有提到:
Qp获取信息就两类信息:
1:查询词
2:客户用户身份识别
Qp通过察“言”(用户行为)观“色”(关键词),可以精准分析用户的搜索意图。QP服务在搜索链路中具有举足轻重的地位,是支撑用户进行个性化搜索的重要手段,是标签产生的重要路径。
如果,
用坑产思维去做关键词,做坑产递增会发生什么........
初始得到的Qp意图分析就不精准,语意转化后向量更不会精准,
推荐式搜索时代是召回机制,系统就会根据向量召回,说到这你能理解什么是向量,向量的意义所在了吗?
向量可以单向召回,也可以多路召回。
向量的取值也可以多元化,
可以是词频 if-idf值,
也可以是用户行为向量表达(点击率,收藏率、加购率、转化率等),
还可以用ID类特征输入到模型中
也就是说向量取的实时值不一样,背后代表的方向就不一样。
咱们学习不用那么复杂,
但是你要简单知道词向量相似度是通过 余弦定理的余弦值来判断的
这个我们也会在课堂中细讲。
召回机制重点就是
1:词召回:
2:向量召回
向量召回和词召回只要解决词向量的语义相似度问题就行。
你可以模仿任何用户行为,模仿查询关键词,先不说QP意图分析这一关,就算这一关过了,语意转换后的向量问题你怎么解决?
系统可是根据向量进行召回的,可不是你模仿的购物意图。

如果你承认现在的淘宝搜索流量分配机制是召回机制
坑产思维下的一切产物都逃脱不了只是模仿QP意图分析,
在统计模型时代肯定会大爆发,销售额决定关键词的展现量。
但是现在是召回机制
是通过QP意图分析后语义转换后得到的成交方向就是向量
向量既有方向又有大小的量  
方向就是成交方向
可能是属性、可能是风格、也可能是修饰词,
背后就是一个需求市场
这里总结向量的概念是为了大家好理解,
但是算法上的两个向量的相似度就是余弦相似性。
你再去玩坑产现在的市场反应,二周爆四周掉完,以及搜索怎么都不动,都是因为向量的问题,只要刷永远解决不了向量的问题。
大数据也好,标签也罢;本质都是为了还原消费者真实的需求。
研究竞品、研究市场、无非就是确定“满足用户的需求”
确定后也就确定了市场,确定了人群和确定了标签。
意图的识别就要通过直通车+查询词的行程的数据进行预判和确认,
咱们反推其他平台,快手也好,抖音也罢,为什么叫兴趣电商就是通过用户在平台上的行为轨迹数据分析出用户意图对什么内容和产品感兴趣然后进行推荐。
时至今日阿里其实也是走的这一步,只是很多人还没有从以往的认知中走出来。
淘内从2018年推荐流量大于搜索流量开始就应该变了,只是算力跟不上也就是17,18,19年得到飞速发展推荐式算法越来越精准和人性化,大部分人还非给平台要搜索,思路本来就不对,天天骂淘宝缺流量?
你就没有想过其实是你的思维已经有问题了。
搜索是种子,通过搜索判断我这个产品适合什么样的向量是布局多路还是玩垂直基于产品真是承接力。
给大家举个例子:比如卖连衣裙 碎花 雪纺  圆领这三个属性就是三个方向也就是三个向量,就看你产品能不能在这三个向量上有比较好的点击反馈。
反馈好就是你的,不好、哪怕流量再大在符合你的产品属性也不要布局
因为不适合你,你的产品承接不住。
向量就是最能快速转化的一个方向上的购物意图                          


此图是搜素引擎工作流程在引擎的构建过程中,首先进行分列,在每个分列中单独完成召回(这就是为什么要“入池”),粗排和精排的过程,最终从每列中选出分数最高的N个产品,并在顶层进行聚合,选出分数最高的N个商品,即可完成整体的排序过程。
从搜索引擎工作流程可以得知:
必须先在一个分列垂直入池进行排序进入前十,
在进入第二个分列的布局排序,当在进入前十,再去布局第三个分列进入前十........
只有你标题中拆分的分列你都能拿到前十的时候才会再顶层聚合进入下一个阶段的最终排序......
如果想那大流量是不是分列越多越好?但是如果想玩既定市场,玩小众、是不是分类越少越好呢?
这里大家可以深挖一下,看明白了你也就知道你的搜索束缚的原因了。
一个分列就是一个搜索意图,不同的搜索意图必然搜索量大,但也掺杂着巨大风险
多有分列都反映一个搜索意图就可以最大化的扩展购物意图拿最大化的流量,这才叫精准扩展。
搜索和手淘推荐的根本区别也就是在于购物意图的精准性和丰富性。
垂直也好,扩展也罢核心就是不失精准。
精准的含义有两层:
一:为人气值服务,看点击率和收藏加购率为意向标签
二:为坑产服务,就看转化率为转化标签。
所以分列的布局也就是分词的布局就大有讲究了
购物意图精准统一了或者精准且丰富,后面就是数据应用闭环系统的应用。
有精准的拉新,也要有高效的收割
有人群流转,也要有场景的转换挖掘潜在需求,促进新转化关系。
针对人群分层,更要有差别化区分,
最终完成大数据应用循环系统,有源源不断的精准购物意图流量,
通过人群流转成为店铺新客,老客,在流转为潜客,
针对不同人群进行差别化的营销,
最后完成一个以访客实时购物链条为闭环,以信息流双循环的闭环应该营销系统。
七掌柜--鬼哥
标签:向量召回

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright   ©2009-2021  趣淘课Powered by©Www.QuTaoKe.Cn技术支持:趣淘课电商    ( 琼ICP备2021004202号-3 )|网站地图