一、用户画像概述
什么是用户画像?从中文概念来讲用户画像与英文概念中的用户角色(User Persona)非常相近,是用来勾画用户(用户背景特征、性格标签、行为场景等)与联系用户需求与产品设计的,旨在通过从海量用户行为数据中炼银挖金,尽可能全面细致地抽出一个用户的信息全貌,从而帮助解决如何把数据转化为商业价值的问题。
用户画像的应用是非常广泛的。一个主要原因是用户画像是一种能将定性与定量方法很好结合在一起的载体。定性化的方法通过对用户的生活情境、使用场景、用户心智进行分析来对用户的性质和特征作出抽象与概括。定量化可以对特征做精细的统计分析与计算,获得对于用户较为精准的认识,便于在数值排序的基础上实现核心用户的发掘与突出。
二、用户画像数据来源
用户画像是由各个子画像综合计算而来的一个最终的整体结果。子画像作为中间结果并不会删除,而是作为重要的画像解释和应用数据保存下来。
(注:以视频推荐为例的用户画像计算引擎示意图)
从数据的角度看用户画像就是一个对原始数据二次计算重构后的新数据,对计算增加了负担,对存储也增加了负担。所以一开始必须经过逻辑设计,从而才能确定数据结构方面的设计。
从可视化的角度来看,不同于以往的传统统计模式(如某个视频某个月的观看量按时间轴统计图),用户画像可能会开启一个以用户为核心牵引的新的入口呈现模式。如图所示,沿着可解释路线,每个标签单击进去就是详细记录和细节,从抽象到细节逐步去体现用户画像数据结构,而这对于服务商来说,更加直观和更有帮助。
2.1 用户属性
用户属性用来描述一个用户的“个性”,从而与其他用户加以区分。因此,为实现精准及个性化的推荐,系统通常对每个用户都有一个用户属性的建模,其中包括用户的基本信息,如用户的性别、年龄、年收入、兴趣爱好、活跃时间、所在城市等。用户属性可以用于基于人口统计学的推荐。
2.2 用户行为
在推荐系统中,简单的使用用户属性存在以下问题:首先用户属性是相对静态的数据实时性不够;其次,基于用户属性的推荐结果过于粗糙,因为用户较难与具体的推荐内容之间建立联系(如我们很难断定某商品一定不会被某年龄段的人喜欢)。针对用户属性存在的局限性,推进系统通常会部署特定的模块来捕捉用户的使用习惯、记录用户使用记录,来建立兴趣模型,从而针对用户的爱好进行个性化推荐。
用户的一次使用行为,包括人物、时间、地点、事件等要素。每一次的用户行为,本质上是一次