编辑导语:在上一篇中,我们讲到了运营必须了解的内容分发策略——打压与推优;本文详细介绍了推荐算法解析,比如我们平常在刷抖音时,你会发现他给你的推送都是你感兴趣的;本文对此做出详细分析,我们一起来看一下。
推荐算法可谓目前社区产品内容分发的标配,尤其是有抖音珠玉在前,精准的推荐效果和巨大的商业成功甚至让许多模仿者对个性化推荐近乎迷信。
作为运营,我们虽然不需要参与算法的设计与coding,但若能对其背后的工作逻辑有一个基本的理解,更有助于我们完成策略干预与算法优化等工作,在与产品、研发同学沟通时也不至于因知识盲区而闹出笑话。
一、推荐算法的工作流程
推荐算法在工作时有四个步骤:获取数据、召回、排序、结果展示。
1. 获取数据
数据是推荐的依据,是算法决定将什么样的内容推给谁的根本,主要包括用户数据与内容数据。用户数据有基本画像(如年龄、性别、地理位置等)和行为数据(如播放、点赞、评论、分享等);内容数据有基础数据(如标签tag、发布者权重等)和热度数据(播放、点转评等)。
2. 召回
数据库存有海量的内容,考虑到计算负荷与实时性的要求,算法不可能在用户每刷新一次时,都对数据库中所有的内容计算分值排序一次;所以通常会通过特定的规则召回指定数量的内容,视社区内容体量而定,这个数量通常为几百到几千。
3. 排序
算法从数据库中召回的内容良莠不齐,而产品的目的则是将好的内容优先展示给给用户,故而需要对召回的内容做统一的打分排序。
4. 结果展示
将排序的结果映射到前端的槽位展示,即是用户所看见的内容信息。
二、推荐算法的类别
目前主流的推荐算法,主要有流行度推荐(热度推荐)、基于内容推荐、协同过滤这三种逻辑;辅以人群推荐、标签推荐、运营干预等更简单的灵活策略。
算法的本质是“猜你最想看什么”,其中热度推荐负责找出当下最热门的内容;协同过滤与基于内容推荐负责找出你可能感兴趣的类型。
社区在应用算法时通常会将上述几种逻辑分别加权然后混合计算,在技术受限或不需要个性化的社区场景也有单独使用热度推荐的情况,如B站的【热门】tab,皮皮虾的排行榜等。
后文将对几种推荐逻辑分别进行解析。
三、热度推荐
热度推荐即是根据内容的产生时间、播放、点赞、评论、分享等交互数据计算出时下最流行的内容,其数学原理相对简单,举个例子:
如图即为某个社区产品帖子的热度计算公式,不必对公式恐惧,其原理很简单,其中:
1)views:浏览量,对浏览量
编辑导语:对于运营者来说,内容至上是不变的真理。无论采取什么运营手法,都需要内容的支撑才能收获良好的效果。然而内容运营并不仅仅只围绕内容生产,内容被消费才有意义,于是核心就是采取好的策略去筛选和分发生产的内容。本文作者就为我们介绍了运营必须了解的内容分发策略之一——打压与推优。
内容是一个社区产品最直观的价值体现,也是连接社区生产者与消费者的桥梁纽带。
但社区内容运营的工作远不只是围绕内容生产,酒香也怕巷子深,能被消费的内容才是有意义的内容,故而核心就在于如何筛选和分发这些已经生产出来的内容。
无论你是否从事内容分发的工作,都需要对其逻辑有所了解。
对此可以将之拆解为5个问题:
由这些问题可以归纳出三个工作方向:打压与推优、推荐算法、分发场景,本文重点解析打压与推优的逻辑。
有人可能会质疑,社区产品的使命不就是让每个生产者的内容都能被看到吗?为什么会有“让谁的的内容被看到”这种命题?
人人平等是慈善,做生意就一定有歧视。毕竟我们要做并不是发现每一条优质内容,而是让发现优质内容的概率与效率变高。
无论是冷启动社区,还是抖音快手这种顶流,流量都是有限的,把流量分给有优质内容生产能力的用户:一方面可以提高流量的利用效率;另一方面也可以提高被消费的内容质量,是内容推荐工作的第一步。
为了精准定位有价值的生产者,可以将之按价值由低到高分为6类:黑名单用户、流失用户、低活用户、新用户、活跃用户、KOL。
这一类用户已经触发过社区的内容安全规则,比如发布过违规内容或者账号行为异常等。其作为生产者的价值最低,是重点打压对象,平台通常不会给他们的内容任何流量,严重者甚至封禁账户或发布功能。
指长时间未有登录行为的用户,因其对平台的黏性较低且有再次流失的风险,故而要提高其内容曝光的门槛,可参考如下指标:
满足标准后,才会给予曝光的机会,并观察其后续表现。
总体来看,此类用户生产的内容质量较差,试探、尝鲜类的内容较多。
但其作为源头活水,为达成发掘潜在活跃用户与KOL的供给和提高留存的目标,会分给其少量流量。
对这一部分用户实行的策略是“有限的机会平等”,对他们发布的