众调网
发起问卷
众调网

首页 >  用户画像数据建模方法 > 金融行业使用大数据为客户构建360度画像以及具体实现方案

金融行业使用大数据为客户构建360度画像以及具体实现方案

  作者

是一家利用大数据技术为金融行业提供客户全生命周期

通过对昨天的帖子分析,我们可以看出用户对于金融企业的重要性,分析客户的数据,首先就得建立用户的画像,整理用户的行为习惯等个性化的信息,将用户进行分群分类。

今天,小编就给大家带来《金融行业使用大数据为客户构建360度画像以及具体实现方案》,通过自己的学习和总结,帮助大家从零基础开始了解客户画像的一套知识,并将其应用在金融行业中,帮助企业实现数据的整合和上层应用。同时,其他行业的企业,也可以使用同样的方法,来处理用户的数据。希望大家也多多提出宝贵意见,互相交流学习~~

目录

一、何为客户画像

二、金融行业客户数据特点

三、为什么要建立客户画像

四、如何建立客户画像

五、基于客户画像可以展开哪些上层应用和服务

六、总结和反思

一、何为客户画像

用户的个体画像是指根据用户的全网的浏览和购买行为,抽取出典型特征,形成了一个用户的个体画像。个体画像认为每个客户都有自己独特的需求和兴趣,所以,可以将单个客户视为独立的市场,并据此提供不同的服务,或对现有服务优化。个性画像主要用于高价值客户的服务。

下图一,就展示了个体客户的画像:

图一:个体客户画像

对于客户画像,除了个体画像外,企业还需要建立一个全网的整体客户画像,这样便于从更高层面进行客户的管理和企业的规划,下图二中,展示的是全网的整体客户画像,即群体画像。

图二:群体画像

二、金融行业客户数据特点

1.结构化的数据,不侵犯用户隐私

银行的大多数数据是结构化数据,比如您来银行办过信用卡、转帐、按揭,这些数据都是交易数据,并没有你的消费数据,也没有你搜索网站的搜索习惯的数据,这些数据其实我们可以通过数据库经过数据安全的清洗,不侵害你隐私情况下客户你完整的行为,判断你有融资的需求或者理财的需求,所以会更加精准向你推送在线的网络融资或者网络互联网理财的产品,这就需要使用大数据来整理用户的行为,对用户数据建立客户视图来进行处理加工。

因此,我们可以通过大数据海量的搜集、拼接、筛选、挖掘、分析去支持银行做更精准的客户分析、客户画像,勾勒出客户更加丰满和多角度的行为特征。

2.数据真实度很高

在银行等金融行业,存储的用户的数据,大都是身份证、姓名等真实数据,数据质量高于别的行业,这些大量的真实数据,可以很好的用于客户用户的画像,若是能结合外部的数据,打通全网,形成360度客户视图,将产生不可估量的价值。

中国征信体系的数据是不完整的,中国的征信体系里面大概有8.2亿人的数据,这里面有5亿人只有一个身份证号,有3.2亿人是有数据的,这些数据基本只有银行的数据,比如他信用卡到期没有还款或者按揭到期没有还,中国还有5亿人没有进入这个征信体系。现在大量互联网公司在去挖掘和搜集海量客户在互联网上的数据,尽量让征信信息更加完整、多维度,未来银行做风控时也会更多利用第三方数据补充社会征信体系不能提供的数据维度。

三、为什么要建立客户画像

客户的全网画像可用于客户生命周期管理,在流失会员挽回、活跃会员扩大销售,以及潜在用户开拓方面,都有非常大的作用。下面以流失会员挽回和潜在用户开拓两方面为例,讲述全网画像的用法。

1.潜在用户积极开拓

(1)高价值用户查询

根据xxx零售商实际运营情况,确定哪些用户是高价值的用户,然后根据购买偏好,计算全网范围内哪些用户和这些用户相近,即判断为潜在的高价值用户。

(2)所推商品目标客户查询

想要推广某一类目,或者某一类商品时,先确定该类目商品的目标用户群,然后全网范围内筛选出类似的用户群体。

2.活跃会员扩大销售

(1)高价值客户预测

对于新用户,判断客户的终身价值,并作重点维护。

(2)客户忠诚度提高分析

研究流失率低的用户群体的特征,从而针对性制定营销策略,提升忠诚度。

(3)重复购买率提升

研究重复购买的用户群体的特征,从而针对性制定营销策略,提升重复购买率;

(4)客户arpu值提升

客户的购买价值提升,通过购物篮挖掘等方式,得到关联购买较多的搭配,然后通过页面推荐、营销搭配等方式,提升客户的arpu值。

3.流失会员激活挽回

(1)流失会员站外购买偏好分析

通过分析流失会员的站外购买偏好,绘制流失会员的用户画像,发现网站现有问题,然后优化;

(2)站内站外购买偏好对比

对流失会员的站内和站外购买偏好对比,从而更深刻的发现网站的问题所在;

(3)流失预警

研究流失用户特征,对现有会员进行流失预警;

四、如何建立客户画像

建立客户画像,应该从具体的业务场景出发,结合数据表现,归纳学习出基准的规则或方法,然后通过反复迭代的学习过程,生成符合既定约束条件的最优化方案,然后把此方案泛化推广到类似的场景中去。

那么,该如何实现呢?这需要使用一种类似成像技术中的像素来对人的特征进行刻画,这就是画像中的标签。

4.1整体架构

首先,我们先来看下,实现方案的架构设计,见下图三所示:

图三整体设计架构

我们可以看到总共分为五层:第一是数据源;第二层是数据采集服务,百分点有一堆数据采集服务,包括我们的数据探头,能够对用户的行为进行一个实时采集;第三层是数据预处理,主要是结构化;第四层是商品画像,这一块都是我们的用户画像服务。我们可以看到用户画像是分两大块,实时处理更偏重于预测用户画像的需求,离线处理更偏重于用户的长期偏好;第五是统一的数据接口,还有就是集群,上面可以接入各种各样的应用。

4.2逻辑架构

对于业务处理的逻辑,通过对电商、社区、移动应用、微博、微信等多种类别的数据源进行采集,然后对用户进行画像,最终在个性化推荐、用户洞察、精准营销等方面进行应用。百分点的数据源多且庞大,服务的客户超过了1500多家,覆盖行业超过了40多个。举例来说,一个网民,他在访问一个电商a,同时又访问了一个电商b,这两个电商本身的知识体系是不一样的。比如说这个用户他访问一双鞋,他在电商a上的品类可能是鞋-男鞋-运动鞋,在网站b上可能是运动-户外-男鞋,品类描述可能是不一样的。所以百分点打造了这么一个系统,叫商品画像系统。通过这个系统,所有的标签就有了一个标签规划,之后就可以去构建这个用户在全网的用户画像标签。用户画像只是一个起点,而不是一个结束。基于此,还可以打造一系列的服务,比如精准营销、个性化推荐等。

下图四,展示了逻辑架构:

图四逻辑架构

4.3具体实现

通过对上面的架构分析,我们来进行具体的实施,其中具体的数据流转过程,见下图5所示:

图五数据流转过程

具体的实现方案,如下:

1.数据源分析

构建用户画像是为了还原用户信息,因此数据来源于:所有用户相关的数据。

对于用户相关数据的分类,引入一种重要的分类思想:封闭性的分类方式。如,世界上分为两种人,一种是学英语的人,一种是不学英语的人;客户分三类,高价值客户,中价值客户,低价值客户;产品生命周期分为,投入期、成长期、成熟期、衰退期…所有的子分类将构成了类目空间的全部集合。

这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。

本文将用户数据划分为静态信息数据、动态信息数据两大类。

图六用户数据分类

(1)静态信息数据

用户相对稳定的信息,如图所示,主要包括人口属性、商业属性等方面数据。这类信息,自成标签,如果企业有真实信息则无需过多建模预测,更多的是数据清洗工作,因此这方面信息的数据建模不是本篇文章重点。

(2)动态信息数据

用户不断变化的行为信息,如果存在上帝,每一个人的行为都在时刻被上帝那双无形的眼睛监控着,广义上讲,一个用户打开网页,买了一个杯子;与该用户傍晚溜了趟狗,白天取了一次钱,打了一个哈欠等等一样都是上帝眼中的用户行为。当行为集中到互联网,乃至电商,用户行为就会聚焦很多,如上图所示:浏览凡客首页、浏览休闲鞋单品页、搜索帆布鞋、发表关于鞋品质的微博、赞“双十一大促给力”的微博消息。等等均可看作互联网用户行为。对于银行来说,我们这里暂不考虑线下用户行为数据(分析方法雷同,只是数据获取途径,用户识别方式有些差异)。用户行为,可以看作用户动态信息的唯一数据来源。如何对用户行为数据构建数据模型,分析出用户标签,将是本文着重介绍的内容。

2.目标分析

用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。如,红酒0.8、李宁0.6。

标签,表征了内容,用户对该内容有兴趣、偏好、需求等等。

权重,表征了指数,用户的兴趣、偏好指数,也可能表征用户的需求度,可以简单的理解为可信度,概率。

3.数据建模方法

下面内容将详细介绍,如何根据用户行为,构建模型产出标签、权重。一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。

什么用户:关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。

图七用户标示

以上列举了互联网主要的用户标识方法,获取方式由易到难。视企业的用户粘性,可以获取的标识信息有所差异。

什么时间:时间包括两个重要信息,时间戳+时间长度。时间戳,为了标识用户行为的时间点,如,1395121950(精度到秒),1395121950.083612(精度到微秒),通常采用精度到秒的时间戳即可。因为微秒的时间戳精度并不可靠。浏览器时间精度,准确度最多也只能到毫秒。时间长度,为了标识用户在某一页面的停留时间。

什么地点:用户接触点,touchpoint。对于每个用户接触点。潜在包含了两层信息:网址+内容。网址:每一个url链接(页面/屏幕),即定位了一个互联网页面地址,或者某个产品的特定页面。可以是pc上某电商网站的页面url,也可以是手机上的微博,微信等应用某个功能页面,某款产品应用的特定画面。如,长城红酒单品页,微信订阅号页面,某游戏的过关页。

内容:每个url网址(页面/屏幕)中的内容。可以是单品的相关信息:类别、品牌、描述、属性、网站信息等等。如,红酒,长城,干红,对于每个互联网接触点,其中网址决定了权重;内容决定了标签。

什么事:用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏等等。

不同的行为类型,对于接触点的内容产生的标签信息,具有不同的权重。如,购买权重计为5,浏览计为1

红酒1//浏览红酒

红酒5//购买红酒

综合上述分析,用户画像的数据模型,可以概括为下面的公式:用户标识+时间+行为类型+接触点(网址+内容),某用户因为在什么时间、地点、做了什么事。所以会打上**标签。用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子r,行为类型、网址决定了权重,内容决定了标签,进一步转换为公式:

标签权重=衰减因子×行为权重×网址子权重

如:用户a,昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息。

标签:红酒,长城时间:因为是昨天的行为,假设衰减因子为:r=0.95行为类型:浏览行为记为权重1地点:品尚红酒单品页的网址子权重记为0.9(相比京东红酒单品页的0.7)假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不再综合商城选购。

则用户偏好标签是:红酒,权重是0.95*0.7*1=0.665,即,用户A:红酒0.665、长城0.665。

上述模型权重值的选取只是举例参考,具体的权重值需要根据业务需求二次建模,这里强调的是如何从整体思考,去构建用户画像模型,进而能够逐步细化模型。

五、基于客户画像可以展开哪些上层应用和服务

对于金融行业来说,我们建立客户画像之后,可以基于结果进行开发以下应用和服务:

开发个性化推荐系统

精准营销系统

风险防范系统

客户信用评级系统

对流失客户的挽回计划策略实施

战略决策系统

广告投放于舆情监控

六、总结和反思

通过这两天的学习,我们从宏观和微观上进行分析了金融行业使用大数据可以进行的具体实施策略,希望能一点带面,给大家一些思考和帮助,把控住客户,以客户为中心,建立360度的客户视图,结合行业内外部数据,做到数据的全网打通,将数据流转起来,才能更好的服务于企业。

如有版权问题,请联系我们删除。

基于大数据技术的手机用户画像与征信研究
作者:丁伟 王题 刘新海 韩涵感谢丁伟的投稿,大数据文摘对优质内容一向渴求,欢迎大家投稿。内容提要:手机用户画像是电信运营商实现“数据驱动业务与运营...
基于大数据技术的手机用户画像与征信研究
百分点研发总监苏海波:构建用户画像可降低企业营销成本
提到用户画像这个词,好多人都有点印象,但是对具体概念并不清楚。眼下,大数据已经上升为国家战略,但大数据和用户画像之间是什么关系?用户画像又能达到怎样的目的?...
百分点研发总监苏海波:大数据用户画像的方法及营销
大数据应用:用户画像建模方法
如何对用户行为数据构建数据模型,分析出用户标签,将是本文着重介绍的内容。 3.2 目标分析 用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的...
用户流失预测模型 用户移动端行为数据的价值与应用
金融行业使用大数据为客户构建360度画像以及具体实现方案
首先就得建立用户的画像,整理用户的行为习惯等个性化的信息,将用户进行分群分类。...3. 数据建模方法 下面内容将详细介绍,如何根据用户行为,构建模型产出标签、权重...
是一家利用大数据技术为金融行业提供客户全生命周期
用户画像数据建模方法(转)
如何对用户行为数据构建数据模型,分析出用户标签,将是本文着重介绍的内容。 3.2 目标分析 用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的...
用户画像数据建模方法
如何挖掘真实的用户画像?
但要从两个方面理解它,一是用户画像是描述用户的数据,“用户”并不能直接定义为一个人,而需要在某个特定场景中;另一方面用户画像是数学模型,通过...
怎么才能挖掘用户的真实需求
为您推荐
众调网 众调网微信

微信扫一扫关注