加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

【独家】消费金融大数据分析方法与金融大数据分析师养成

发布时间:2021-01-19 05:27:28 所属栏目:大数据 来源:网络整理
导读:2016年10月25日晚,清华大数据“应用·创新”系列讲座—— “消费金融大数据分析方法与金融大数据分析师养成” 在清华大学FIT楼多功能厅成功举办,本期讲座邀请到瑞天欣实数据科技公司创立人之一 杨子君博士 。杨子君博士持有美国南加大(USC)电子与计算机

消费金融离不开风险的精准评估以及自动化审批。很多消费金融公司也都是愿意提倡这些的,现在我们可以秒贷了,甚至可以凭一张身份证放贷,这都是基于高度的自动化。但最难的还是风险评估,有很多时候风险评估是没有办法做到自动化的。比如说风险投资公司,如果它能够自动识别这些风险何必要人呢?所以金融大数据工程师最需要知道的第一点是大数据的边界在哪里,什么情况下我们要通过大数据分析、分析风险精准到什么程度、怎么应用,不要把大数据夸大化;第二点是数据是什么,我们知道数据是不断在变的,大数据在不断地积累迭代,能否形成体系架构来迭代提高,这是关键。

??

消费金融大数据与数据工程师


我们认为跟消费金融相关的数据包括消费人群信用数据、经营人群信用数据、收入数据、资产数据、抵押数据。


【独家】消费金融大数据分析方法与金融大数据分析师养成

消费行为的深入带来的是一代人消费观念的转变。这些年货币发行量还是很高,物价上升也比较可观,新一代年轻人如果还没有转变理念去银行借款的话,可能他未来的资产永远也赶不上。而这个理念已经开始转变,中国逐步走向消费金融为主的社会,消费金融大数据未来应用的场景和领域是非常宽广的,需要更多的金融领域的数据工程师,可是现在的储备还是非常少的,因为它的特殊性。


金融机构其实看不到数据,他们关注的是盈利,是如何选客户和营销。因此数据产品一定要返回到生产的流程里面,这样才能产生价值。


这样的大数据应用有防范欺诈风险的,防范不同的欺诈所要求的数据都是不同的,如果我们不能在数据采集、分析的过程中把它区分开来,数据产品是没有办法使用的。


【独家】消费金融大数据分析方法与金融大数据分析师养成

另外一个风险也是金融机构很关注的,叫做宏观市场的风险。每个人都离不开社会离不开这种大的经济环境,我们现在最关注的可能是未来得房价会不会跌、跌多少,我们的金融资产受到的冲击是多少,这就是经济环境的风险。通常我们认为经济环境的风险从金融大数据的角度来说更加注重从微观的数据整合到宏观的维度,它的准确度会非常高。在宏观经济领域,像穆迪、标普这种征信公司和很多其它金融机构都会联手做很多事情,比如说金融危机的时候美国经济机构做了很多宏观经济指数,这能够有指导性的作用,这也是金融大数据领域一个非常重要的应用。


【独家】消费金融大数据分析方法与金融大数据分析师养成

大数据中二八原则是无处不在的,20%的数据能够提供80%的价值。数据工程师主要的工作不是到处采集数据,而是要知道怎么样去找20%的有价值的数据。数据具有动态性,我们在不同应用里面发现这20%的数据是随之而变的,它在不同的场景有不同的价值。


同样的数据在不同的应用是不一样的,在同一个应用里面在不同的情况下它也不一样。最后数据工程师可能会产生统计模型,用以描述不同随机变量之间如何关联,例如行为的不同随机变量。但只有关联性并不够。

举一个非常经典的啤酒和尿布的例子。


Super bowl举行的时候,一些人把尿布和啤酒放在一起卖,会发现尿布和啤酒的销售量都提高了。统计模型发现了这两者的关联性,但这并不意味着这样的搭配销售具有普适性。因为这一现象的本质是这个区域里正好有一些20多岁到30多岁、爱看球类比赛的年轻人,并且他们都有孩子,出来买啤酒时可以正好买尿布。因此数据工程师不能满足于表面现象,而要发掘本质原因。数据工程师要能在玩儿数据的过程中增长自己的知识,知其然知其所以然,这样你做的产品才可能会更有效。因此大数据并不是盲目地告诉你这个东西是什么,而是要从这个数据里找到规律,这是知识,是颠扑不破的真理,这是一个合格优秀的数据工程师需要做到的。


总结来说,金融大数据工程师,只是一个工程师还是远远不够的。他首先要对金融有所了解,其次要分析数据背后的本质,哪里风险高,哪里风控做的不好,最后形成决策。举例来说,中等风险的人群实际上是很能盈利的人群,因为他有一点风险,但又不是太高。那么这些人的风险如何管理,如何定价就是金融大数据工程师要做的。数据清理、分析你发现了什么、总结出什么规律、这个规律怎么提升、怎么样迭代,这是数据工程师最重要的五个核心。此外数据工程师还需要艺术思维和匠人精神,要科学性和艺术性相结合。


Q&A


提问1:第一个问题是,我发现数据要预测时面临的最大的困难是未来变化特别快,数据无法描述未来,比如英国脱欧和负利率等,场景非常难以描述。我是做推特分析的,语言变化特别快,怎么样去处理这样的问题。第二个是,在具体使用技术的时候,刚开始我们就是做大数据加加减减而已,然后我们可能再去做模型,甚至做知识图谱,您怎么来评价这些技术本身对整个金融大数据的推动也好,它的局限性。


杨子君:大数据领域最重要的不是寻找正确的答案,而是寻找正确的问题,就是大数据到底能帮我们做什么。像你说的推特,第一个问题是,是不是大数据能解决的,也许肯定是,你是最有权利有答案的。如果确实是大数据能解决的,现在的大数据是不是足够我解决这个问题,如果不能足够解决这个问题,很可能的情况下是我的认知不够,也可能是我的数据不够。所以我觉得,在大数据领域,对于数据工程师或者设计师来说特别重要的是,要会问正确的问题。


(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读