仅凭算法模型,就能够达成直播推荐的业务目标吗?这个说法纵然美妙,然而在实际业务场景当中,通常却是行不通的。

人的理解是基础

在精准推荐这儿,关键的首部步骤是理解用户,我们得将用户基础属性的情况展开相关分析,这里面包含着年龄、地域等方面,更为关键的是基于平台内其本身的行为轨迹进行了解分析,这些行为覆盖囊括从搜索的关键词开始算起,到浏览商品的详细情况,再至发布闲置物品一事,以及最终涉及到的有关交易记录流程,这一系列都融合在一起共同组合得以建构构建起来用户画像所需要的核心数据。

除去基础属性,用户互动行为很关键,点赞行为是关键行为之一,评论行为是关键行为之一,收藏行为是关键行为之一,由这些互动行为衍生的兴趣标签也关键,这些特征数据靠离线计算产出后经归一化处理,处理后同步到人群圈选平台,方便运营人员借助交逻辑操作组合目标人群包,借助并逻辑操作组合目标人群包,借差逻辑操作组合目标人群包。

构建兴趣标签体系

在所能够获取的当中,相对容易的是用户在基础层面上的行为特征表现,然而倘若想朝着深入方向对待,以理解用户的兴趣偏好体现的相关内容,那么在某种情形下,从总体事实上看就需要构建面向专门所涉及方面的标签体系,在实际状况里,在闲鱼这种特定的业务场景下,往往得从零开始构建一套体系相关内容,在构建体系过程中,能成为兴趣标签核心关键的要素是分析查看用户历史行为产生的文本信息之类,同时还要找出该文本信息与预设领域关键词的关联性。

在最先阶段之时,运营人员会着手去整理呀,于各垂直领域当中的关键词库呢,同时对此呀,技术方面要处理文本存储问题,需做到能够快速检索,而且还要包括相关度计算呀,就这样三个问呀题来存在啦,最初的时候喔,我们确实好好考虑过哟,运用已然成熟的搜索引擎方案啊,可是呢最后啊,却遭受到种种限制呀,像预算方面以及实际实施成本这呢些因素,致使不得已呀,最终做出了选择呀,选择了离线呢这种方式喔,去关联用到用户与兴趣标签这样的一条选择路径啦,虽然当下喔呈现的实时性呢它是 T+1这个状态咯,但是呢最终喔达成的结果呀,是能够拥有快速上线的噢这样一个目标啦。

直播内容的解析

理解直播的内容本身,同样缺少不了那一方面,它涵盖了这一条内容,其项目是解析直播间标题,与之有关联的另一类是封面图这部分,在实时当中可看见互动评论此类,当中包含商品链接这一系列信息,借助自然语言处理,还有图像识别这类技术,能够萃取出,关于直播内容有主题分类,同时具有情感倾向,另外包括的关键物件,给后续匹配内容,打下相应一定的基础。

比如,存在一个直播间,它频繁出现“潮玩”这一关键词,它不止一次出现“盲盒”这一关键词,它时常出现“限量”这一关键词,并且此处的用户互动极其热烈,处于这般情形下,系统就会给它贴上“潮流玩具收藏”的强关联性标签,这些内容领域的标签,跟上用户兴趣的标签,一同搭建起“人”与“货”之间精准衔接的桥梁 。

资源位的精准匹配

在恰当的“场”(页面 资源位),将理解后的“人”(即用户兴趣人群)与“货”(优质直播间)进行匹配,这是达成业务目标的关键,不同的资源位,如首页瀑布流、频道焦点图,其曝光效率和用户意图差异很大。

算法模型要基于实时流量,在有限曝光额度里,开展动态评估,从而挑选最优直播间,填进各个资源位。这个过程,既要考虑用户与直播相互间的静态匹配度,也要全面衡量直播间的实时热度,还得顾及主播等级,更要考量平台运行策略等诸多因素。

离线与在线的协同

存有整个投放系统条件,该条件需求离线流程与在线流程紧密配合,运营配置的规则蕴藏于关系型数据库之中,在同步之后,借由离线计算任务达成用户和直播关系的初步关联此一动作,从而生成可投放的候选集,这些数据随后被引入在线图数据库内,以促使推荐算法能够进行实时调用 。

这种架构确保了系统,有利于离线计算的稳定性,有利于深度处理的能力,凭借构建长期兴趣画像,它并且还能凭借在线服务的低延迟,响应应用户实时行为的变化,从而达成推荐的动态调整 。

数据驱动的持续优化

推荐系统上线并非终点,而是迭代起始,我们需构建一套完整的数据监控系统,如此才可追踪,如点击率,观看时长,转化率这类核心指标的变动情况,还要借助A/B测试,来对比不同策略所产生的效果,进而寻找到系统存在的瓶颈之处。

比如,发现了一些状况,其中有某些长尾兴趣的标签,其覆盖的程度不足,这使得部分小众领域的直播推荐,所产生的效果不佳,经过了对标签生产流程的优化,紧接着引来了更多维度的行为信号,我们便按步骤进行提升,进而使整体推荐的覆盖比率以及满意的指数得到完善 。

构建推荐系统时,有没出现过算法模型与实际业务发挥的效果、其起的作用相互脱离的状况,是这样的情况吗,不是吗,能否技术对应这边和运营之间在如何平衡关系,采用什么方法去平衡呢,欢迎大家在评论范围分享个人的经验及见解,要是觉得这段文字给自己带来启发,一定不要忘记点赞和分享呀 !

闲鱼直播业务增长遇难题,运营与算法结合能否破局?