数据挖掘这个概念早在上世纪90年代中期由IBM提出来,到现在大概已经有二十五六年的时间了,英文叫做data mining,我翻译成中文叫做数据挖掘。数据挖掘主要是从大量的数据中提取有用的信息,把这些信息结合行业知识,运用到我们的决策过程中去,这就是数据挖掘最主要的含义。
所以它包含几层含义,第一个是包括数据,包括数据的整合;第二个很重要的问题是数据的分析,也就是今天所谓人工智能里面的很多算法;第三个因为数据挖掘是一定要应用到某一个行业里面去,解决具体的问题,所以行业知识很重要;第四个是加上数据,加上分析的结果,加上行业的知识,然后把它运用到这个行业的决策过程中去,这是数据挖掘整个的过程。
刘世平:数据挖掘解决了很多金融方面的一些问题,那么它跟大数据时代是密切相关的。大数据演变的过程,应该已经有33年的历史了,最早在1987年的时候,提出了一个概念叫做数据仓库,英文叫做data warehouse。它主要是指把分散在各个地方,一个企业或一个政府里边不同地方的数据进行有效的整合,提炼出来同一系列的手段和方法把数据里边的信息能够提炼出来,然后结合行业知识用于决策的过程,所以数据挖掘更多的是在数据的分析阶段。90年代末期又有一个新的概念,叫做商业智能。那么发展到了2011年的时候才开始叫大数据。所以它是先从数据仓库,数据挖掘,商业智能再到大数据,整个这样的发展过程。而数据挖掘这些年来就会显得更加的重要。
刘世平:这个也是挺好玩的,因为在这个概念完全提出来之前,在西方实际上已经有一些分析的手段和方法,尤其是结合应用数学、统计学的一些方法和算法,解决金融机构的问题。我们日常生活或者企业的运营过程中,都会收集和整理大量的数据,举个很简单的例子,全世界最早用数据挖掘用得比较好的,是银行里边的信用评级模型。它通过数据的分析,判断一个人在未来一段时间内,他有没有可能出现违约的概率。后来包括大家都知道的像当当网,我们去买书的时候会碰到关联分析,你会发现到网上书店来买书的人,同时会把另外一些书一起买了,我们会去分析哪些书是容易被一起买的,可以把这个概率算出来。现在的应用就更广泛了,比方说我们的支付,我们中小微的贷款,我们个人的贷款,这些都是它的延续,其实方法和理论体系是一样的。
刘世平:今天的数据更多了,数据的类型更多了,这是第一个方面;第二个是我们的计算能力,存储能力加大了,我们能存的数据更多了;第三个是我们的数据分析能力加强了,以前大部分的数据我们要经过抽样分析,为什么我们不能把所有的数据都拿过来分析,因为计算机没有那么强大的处理能力,以前数据量很大的时候,你分析的时候就分析不出来,算法结果也算不出来,现在没问题,现在计算能力很强大,所以这个是跟过去一个很大的不同,应用在生活上也更加便捷了。
刘世平:数据如果能得到准确的运用实际上是可以避免过多地骚扰客户,你想想是不是这些年我们都会接到很多电话,他会问要不要贷款,要不要升学,都是骚扰性的。坦率地讲就是说他这个基础工作做得不好,举个很简单的例子,我有时候会接到一些电话,问你是不是刘世平,我说是,说你要不要考虑办一个专升本,我说你开啥国际玩笑。实际上如果他简单地调一些数据,他知道了我自己本身是博士,我已经是中科院的大学教授,我还会考虑专升本的问题吗。这就是不准确的问题,它就变成一种骚扰,所以我觉得数据挖掘一方面可以解决企业效率的问题,降低它的成本,获客成本的问题。另外一个方面,它可以减少不必要的对市民或者是客户的骚扰。
刘世平:对智慧金融的话,我觉得未来很重要的一点,实际上就是一个速度问题,一个准确的问题,公平和透明的问题。也就是说金融机构除了提升自己的效率,赚好自己的利润之外,另外还有一个很重要的社会义务,也就是公平。比方说服务三农的问题,更好地服务中小微的问题,我觉得数据挖掘能够解决很多的问题。通过数据挖掘,你更加透明和公平地去服务不同阶层的人,通过数据挖掘的方法,我们可以设计出不同的产品,不同的社会阶层都能够得到好的金融服务。
举个很简单例子,我最近在设计一款产品,解决农民的信贷问题。通过数据挖掘,利用金融的体系架构,我可以把农民逐渐变成农业产业工人。农民什么时候需要贷款?一定是他买农药,买种子,买化肥的时候,所以我们可不可以利用今天新一代信息技术,比方说利用区块链的技术,我们可以对种子、农药、化肥进行溯源的问题,让假冒伪劣产品不会在市场上留着,这是第一类。
第二个,农民生产过程中会出现哪些风险?如果碰到了自然灾害,他颗粒无收,他也就还不了贷款了。这个时候怎么办?我们能不能把金融的风险管理引进来,把保险的风险意识引进来,给农业生产加一份保险。另外一个很重要的问题,农民生产了之后,他能不能真正实现增收,收益能不能跟得上?那么我们可以引入金融期货的概念,到他卖的时候,我们提前跟粮食收购公司谈好一个价格。
在这个过程中,我引入了信贷、保险还有期货的概念,你看农民就很好办,这样的话农民只需要去管生产,他就标准地变成了一个产业工人了,这样对农民是巨大的利好,就是农业的转型升级,把信息化、大数据和金融有效地结合起来。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。