用户画像的构建方法论
产品 用户画像    2019-03-08 11:26:52    29    0    0
admin   产品 用户画像

一、用户画像概述

什么是用户画像?从中文概念来讲用户画像与英文概念中的用户角色(User Persona)非常相近,是用来勾画用户(用户背景特征、性格标签、行为场景等)与联系用户需求与产品设计的,旨在通过从海量用户行为数据中炼银挖金,尽可能全面细致地抽出一个用户的信息全貌,从而帮助解决如何把数据转化为商业价值的问题。

用户画像的应用是非常广泛的。一个主要原因是用户画像是一种能将定性与定量方法很好结合在一起的载体。定性化的方法通过对用户的生活情境、使用场景、用户心智进行分析来对用户的性质和特征作出抽象与概括。定量化可以对特征做精细的统计分析与计算,获得对于用户较为精准的认识,便于在数值排序的基础上实现核心用户的发掘与突出。

二、用户画像数据来源

用户画像是由各个子画像综合计算而来的一个最终的整体结果。子画像作为中间结果并不会删除,而是作为重要的画像解释和应用数据保存下来。

Clipboard Image.png

(注:以视频推荐为例的用户画像计算引擎示意图)

从数据的角度看用户画像就是一个对原始数据二次计算重构后的新数据,对计算增加了负担,对存储也增加了负担。所以一开始必须经过逻辑设计,从而才能确定数据结构方面的设计。

Clipboard Image.png

从可视化的角度来看,不同于以往的传统统计模式(如某个视频某个月的观看量按时间轴统计图),用户画像可能会开启一个以用户为核心牵引的新的入口呈现模式。如图所示,沿着可解释路线,每个标签单击进去就是详细记录和细节,从抽象到细节逐步去体现用户画像数据结构,而这对于服务商来说,更加直观和更有帮助。

2.1 用户属性

用户属性用来描述一个用户的“个性”,从而与其他用户加以区分。因此,为实现精准及个性化的推荐,系统通常对每个用户都有一个用户属性的建模,其中包括用户的基本信息,如用户的性别、年龄、年收入、兴趣爱好、活跃时间、所在城市等。用户属性可以用于基于人口统计学的推荐。

2.2 用户行为

在推荐系统中,简单的使用用户属性存在以下问题:首先用户属性是相对静态的数据实时性不够;其次,基于用户属性的推荐结果过于粗糙,因为用户较难与具体的推荐内容之间建立联系(如我们很难断定某商品一定不会被某年龄段的人喜欢)。针对用户属性存在的局限性,推进系统通常会部署特定的模块来捕捉用户的使用习惯、记录用户使用记录,来建立兴趣模型,从而针对用户的爱好进行个性化推荐。

用户的一次使用行为,包括人物、时间、地点、事件等要素。每一次的用户行为,本质上是一次随机事件,可以描述为什么用户,在什么时间,在什么地点,观看了什么电影。

“什么用户”涉及对用户的标识:时间则包括两个重要信息,时间戳与时间跨度,其中,时间戳标识用户行为的发生点,时间跨度则标识了用户行为的持续时间,地点体现了用户行为的渠道,便于做推荐结果的推送;观看的内容则直接指示用户的偏好,对于精准推荐至关重要。相比静态的用户属性,用户行为能够更为准确地描述用户特征,是推荐系统中涉及用户画像最为重要的数据来源。

三、用户画像特性

3.1 动态性

从数据来源分析,用户画像具有较强的动态性。用户属性涉及人口统计特征相对比较稳定,然而用户的观影行为是随时间持续增加的,用户在系统内的每次观看行为都会使得现有的用户画像丧失时效性。

此外,用户会受到周围环境,其他用户等的影响,从而改变其观念偏好所有这些都将决定了用户画像不可能一成不变,而是实时动态变化的,这就要求我们设计合理有效的动态更新机制,从而精准的刻画用户画像。

3.2 时空局部性

用户画像的动态性是其不可避免的具有时空局限性。

首先,在时间上,用户画像的目标是通过精准的刻画用户,从而提供个性化的服务。因此,用户画像对于时效性非常敏感。

其次,在空间上,不同的应用领域有不同的侧重点。例如营销领域的用户画像主要侧重用户的消费习惯,而在视频推荐领域用户画像则主要侧重用户的观影喜好,因此需要针对各自的特点设计相应的用户画像,没有哪个用户画像一经构建就可以适用于所有的应用领域。

四、大数据对用户画像的利与弊

大数据在给用户画像带来机遇的同时也带来了前所未有的挑战

机遇:在大数据时代,用户群及其行为的数量在迅速增加,丰富的数据来源为构建高度精准的用户画像提供了可能。大数据时代,可以获得用户的方方面面的行为数据,从而较大程度的接近权样本可以更为精准地勾勒用户,推荐结果也更加精确,大大提升用户的体验。

挑战:大数据的出现,首先是数据的异构性与不准确性,即使经过数据清洗和纠错,数据仍有可能存在缺失和错误。在进行数据分析时要正确的对这些缺失和错误数据进行处理也是一个挑战;其次如何处理大规模且迅速增长的数据也成了一个极具挑战性的问题。值得注意的是,用户画像具有较高的时效性,这就要求我们重新思考如何设计、建造和运行处数据处理模块使其高效运转,包括查询处理算法、查询调度、数据库设计、并发控制方法和恢复方法。

另外,用户画像的获取不可避免地要收集用户的个人信息,因此数据隐私是用户画像应用中另一个引人关注的重大问题。

五、用户画像建模

在推荐应用中,为了使推荐结果满足用户个性化的需要,需要对用户画像进行建模,从而分析用户行为习惯、兴趣偏好等重要商业信息,提供大量的数据基础。用户画像建模的核心是对用户潜在的意图和兴趣进行表示和存储,根据用户的基础信息、产品信息、访问信息、行为偏好以及隐式兴趣等归纳出可读、可计算的用户模型。通俗地说,用户画像建模往往就是用户信息的标签化,以便为后面的推荐算法提供更加精准的语义信息。

用户画像通常包括定性画像和定量画像两个部分,其中定性画像主要包括用户的基本特征、行为刻画、兴趣模型和产品表征等,定量画像主要包括用户基础变量、兴趣偏好等可量化的数据特征。

5.1 用户定量画像

在定量用户画像的建模中需要重点考虑用户画像的颗粒度,即用户画像应该细化到何种程度。颗粒度越小,用户画像越细化,对用户的刻画就越精细,也就更加有利于提高推荐系统的准确性。然而用户画像的颗粒度也不是越小越好,颗粒度越小,就要求获取用户越细化的数据,一方面提高了用户画像建模的成本,同时也会导致用户画像适用性降低,因此用户画像的颗粒度需要有一个度。

在这一步可以首先采取问卷调查的方法了解用户的使用场景、关注内容等。在此基础上设计用户画像,对于把握用户画像颗粒度有一定的参考意义。确定了用户画像的颗粒度,就可以通过表单或借助技术手段来捕捉用户行为,存储和分析用户数据,获得定量的用户画像。通过表单是最为直接的一种显示收集方式。

5.2 用户定性画像

标签化是用户定性画像的核心,标签化的用户画像既方便人们的理解,又方便计算机分析和程序化处理。标签化之后,首先,计算机可以自动完成分类统计功能。其次,计算机也可以根据这些标签进行深度挖掘。例如可以利用关联规则计算用户年龄和喜欢电影类型的关系,还可以利用聚类算法分析喜欢科幻类型电影用户的年龄段分布情况,将标签信息与用户的视频浏览点播行为数据相结合,就可以进一步预测用户的喜好,这对于搜索引擎广告投放等应用领域有着显著的意义。

在使用标签表示用户定性画像的基础上,还可以进行用户调研,根据目标、行为和观点的差异将用户区分为不同的类型,在每种类型中抽取出典型特征。例如一些个人基本信息,家庭、工作、生活环境描述,赋予一个名字、一张照片、场景描述,就形成了一个典型用户画像。人物角色一般会包含与产品使用相关的具体情境、用户目标或产品使用行为描述等,为了让用户画像容易记忆可以用具体的名字、标志性语言、几条简单的关键特征进行描述,一个产品通常会设计3~6个标签代表所有的用户群体。

由此可见,标签是用户定性画像的基础,如何表示、解释、推理、验证标签是用户画像的关键。


本文方法论总结自牛温佳、刘吉强、石川等著的《用户网络画像》一书。

上一篇: 启示录:打造用户喜爱的产品

下一篇: 组织发展-OD和HR实践者指南

29
登录 后评论.
没有帐号? 现在注册.
0 评论
Table of content