“大数据”是近年来的流行词。它通常指网络时代收集和分析巨量数据的工作。但实际上,经济学从创立时起,就一直在用“大数据”支持和检验各种理论和模型。西方最早的大规模社会经济数据收集可以回朔到1700年时的英国。从那以后,随着经济学研究方法的演进,数据的收集和分析也更加系统化和精细化。人们从数据中提炼出一个又一个的模型和理论,而这些又反过来指导数据的收集过程。经济学家,普林斯顿大学教授迪顿(AngusDeaton)就是在收集和解释经济数据领域的重要开创者。因为这些贡献,他获得了2015年诺贝尔经济学奖。获奖前的迪顿也许只在本行出名,但他有一个工作却是家喻户晓的。2010年,迪顿与卡纳曼(2002年诺贝尔经济学奖得主)发表了一个研究,指出收入与幸福度的相关性到七万五千美元为止。超过此收入,幸福度就不再增加了。
迪顿的诺贝尔奖不是因为他的一个工作,而是因为他整个职业生涯的贡献。诺贝尔官方的工作介绍中引用了他的37篇论文,其中有20篇是他独自发表的。根据诺贝尔委员会的宣言,迪顿主要是因为三个方面的工作受到表彰。
迪顿“初出茅庐”就一鸣惊人。在还是新科教授时,他在1980年提出了所谓的“几乎完美需求系统”模型。这个模型研究的是消费优先的问题。也就是说:当总消费量(金额)固定时,人是怎样分配各种消费品的数量的。社会总体消费分布的理解,显然对于经济政策和计划是非常重要的。当时通行的方法是:把整个经济的行为等同于一个“代表人”的行为。“他”根据当时的情况(各种物品的价格,自己的总消费量等)选择消费金额的分配,追求效用函数的最大化。效用函数(utilityfunction)是一个函数,其自变量是消费者的各种选择,而函数值就代表消费者的最终“幸福”程度。
而确定效用函数的形式,就是制定正确模型的关键了。如果消费者是理性的,那么这个效用函数就会满足一定的数学性质。问题是,从实际数据导出的效用函数却不满足这些性质。也就是说,经济学的基础“理性人”在这个问题上受到了挑战。而迪顿指出:问题是整体经济的行为不同于一个理性人,虽然它是成千上万个理性人的集合。迪顿进而提出了“几乎完美需求系统”模型。这个模型包含了一组很容易通过数据来确定的参数,可以描述理性和非理性的效用函数,也可以很容易地判断一组参数是否理性。这个模型可以描述个体的消费行为,也可以描写社会总体的消费分布。迪顿指出,即使在一个非常简单的情况下(所有的个别消费者都使用同样的理性的效用函数),其总体消费分布的效用函数也不一定是理性的了。这个并不复杂的模型能揭示消费分布中的一些本质问题,又具有良好的数学性质,所以至今仍被广泛使用。迪顿的那篇论文至今已被应用超过4500次。这是迪顿的第一个重大贡献:建立了一个既能忠实于数据,又足够灵活的需求模型。
初战告捷后,迪顿又在消费与储蓄模型方面做出了全面的贡献。这里研究的问题是:一个人在收入变化的时候,消费和储蓄的分配如何变化。二十世纪中期风行全球的凯恩斯主义,其依据就是个人用于消费的比例是不变的。所以当政府通过赤字运行暂时增加人民的收入时,人民的花费也会按比例增加,从而刺激需求,振兴经济。后来,自由派经济学家佛利德曼等人提出反对意见。他们的理论是:人的消费水平不是由当时收入决定,而是基于对于长期收入的估计。所以消费水平是基本稳定的,不随着收入波动。这个理论称为“永久收入”理论。如果这是正确的话,凯恩斯的经济刺激就没有作用了。
迪顿对于消费者的行为进行了细致的模型研究。他发现,“永久收入”理论虽然直觉上很有道理,但仔细分析却需要不少修正。例如,人的借贷能力并不是无限的。而现实中大多数人都生活在借贷能力的极限上。他们没有储蓄,所有收入都用于消费。另外,人对于未来收入的预期也并非不变,而是基于目前的收入。所以收入高时,人会认为将来的收入也高,所以反而减少储蓄,用来增加消费。反之到收入降低时,倒觉得苦日子是长久的,需要增加储蓄未雨绸缪。由于这两个原因,人的消费波动其实应该比收入波动更高。但是,社会总消费的数据却显示消费水平比收入水平更平稳。这个矛盾被称为“迪顿佯谬”,至今尚无确定答案。但看来问题也是在于个人行为与总体行为的不一致。
除此之外,迪顿对于数据的收集也有重大发现。理想状态下,要研究消费者行为随时间的变化,我们需要跟踪个别的消费者,收集他们在不同时间的数据,业内称之为“面板数据”(paneldata)。美国人口调查署和劳动统计署从上世纪八十年代起就收集和发表十分详尽的面板数据,涵盖人口组成,收入和消费的很多方面。但是在世界其他国家,面板数据由于成本较高,应用不是很普遍。迪顿发现,其实另一种“横截面数据”(cross-sectionaldata),也就是对一个人群在某一时间的调查(而不是跟踪个人),也能提供相同的信息,达到相同的精度。这种把横截面数据变成“伪面板数据”的技术对于推广数据统计在第三世界国家的应用起了很大作用。迪顿以数据与理论相结合,个体与宏观相印证的作风,为消费与储蓄问题的研究奠定了坚实的实证基础。这是他的第二个重大贡献。
迪顿在经济研究中非常重视数据,模型和理论分析,但他并没有迷失了经济学的根本目标:提升人民的生活品质。所以,除了数据的收集和分析之外,他还关注一个更基本的问题:什么数据最能反映人民的生活品质?迪顿发现,收入并非生活品质最可靠的表征。而在发展中国家,消费和营养是度量生活品质更好的尺度。他还开拓建立了用“穷人物价指数”反映穷人的消费水平,用主观访谈补充“硬数据”,和利用健康状况来反映生活品质等方法,对研究发展中国家经济状况的工具和手段做出了巨大贡献。
迪顿还善于创造性地使用数据。例如,为了调查人群中是否有重男轻女的行为,他需要知道家庭在男孩和女孩身上的消费是否相等。但是家庭调查中只知道总花费,无法精确到具体人身上。于是他采用了比较有孩子前后,家庭奢侈品消费水平的变化程度,来推算家庭预算中花在孩子身上的钱。对迪顿来说,数据虽然非常重要和宝贵,但毕竟只是个工具。如何从数据中得到需要的信息而不是被数据误导,这需要经济学家的知识和智慧。迪顿独具慧眼,善于从数据中发掘信息去伪存真,发展了一系列数据分析实践。这是他受表彰的第三个重大贡献。
迪顿是个学术权威,在学术圈子里非常受尊敬。但不光如此,他在全球经济活动中也是举足轻重。除了学术活动外,他还参与世界银行帮助发展中国家提升经济的努力,为此写过不少报告和白皮书。上面说到的用横截面数据代替面板数据的发明,对发展中国家推广“以数据为依据制定政策”的做法就很有帮助。他还发现了印度政府在计算贫困率时的方法错误,帮助印度政府得到更切合实际的数据。迪顿自称,他个人的目标是“研究改善人民生活的政策问题”。这一点上他的确是身体力行了。
迪顿的工作不仅是对经济学的贡献,对“大数据”领域也具有普遍的指导意义。除了具体的技术和思路外,他的基本态度是:不崇拜数据,而是真正弄明白为何收集数据,如何使用数据。特别是对数据的解释非常小心。他的论文从来不是简单的图表,而是有很多定性,直观的分析来挖掘数据背后的意义。借了这次诺贝尔奖,回顾一下迪顿和经济学几十年来“与数据共舞”的历程,在这个大数据时代是件很有意义的事情。