“大数据”似乎在一夜之间闯入了任何一个关于互联网未来的讨论,成为一个炙手可热无所不包的概念。但它是否真如许多IT行家们所言,将成为信息技术领域又一片蕴藏无限潜能的处女地?还是只是软硬件巨头们为了卖出更多产品而吹出的一个美丽泡沫?

正在大连举行的2013夏季达沃斯开辟专场,以“大数据概念是否被过度炒作”为题,请四位嘉宾分成正反两方,展开一场激辩。穿梭于各场彬彬有礼的“清谈会”之间的听者们,步入这场辩论时,无不感到意外之喜,目击到一场有趣又有料的意见交锋。

持正方观点,即“大数据已被过度炒作”观点的,出人意料地,是四位嘉宾中更年轻、更接近“技术宅男”的两位,其中一位是美国Kaggle公司总裁兼首席科学家Jeremy Howard,另一位是加纳MPedigree网络公司总裁Bright Simons。持反方观点,为大技术时代的到来欢呼的,一位是北京大学光华管理学院新媒体营销研究中心副主任苏萌,另一位是日本政治家、内阁成员山本一太。

在辩论之前,主持人先作了一次现场调查,同意“大数据是过度炒作”的听众稍占上风,占比54.5%。听众被告知,在辩论结束后还会再来一轮投票,四位嘉宾的任务就是尽可能留住支持者,让对方阵营倒戈。

辩论开始,正方嘉宾、科学家Howard起身走近听众席,一句话亮明观点:数据不在多,而在怎么用。他提出“一台电脑论”,即科学家们研究所需的数据,最好用一台电脑就能装下,否则数据处理会过于繁琐,无助于解决问题。他结合自身经验说,随着数据量的增大,研究的准确性一开始会随之上升,但很快就会趋平。

“举个例子,如果我们把所有《星球大战》铁杆粉丝的数据拿来研究,就一定能准确地判断出他们中谁会喜欢《魔戒》吗?我们发现并非如此。”

反方嘉宾、北大的苏萌教授起身应战。他请大家原谅,“为了更流畅地表达观点,我还是用中文”,引来听众理解的笑声。他说,大数据刚刚露出冰山一角,在金融、零售等领域的运用上,还远未释放它的潜能。这有三个原因:一是因为不同机构间的数据还未真正流动起来,目前还只是数据“孤岛”;二是完整的生态产业链还未形成,尽管通过行为数据分析已能够分辨出一个消费者的喜好,但从供应到购买的链条还没建成;三是因为数据分析人才仍然极度匮乏。

他说,15年前,很多人认为互联网是泡沫,今天证明互联网没被高估,5年前,很多人认为电子商务是泡沫,但今天中国已经有3亿人的电商市场,我们还有什么理由说大数据只是泡沫呢?听众席上点头频频,现实显然颇具说服力。

正方嘉宾,来自非洲加纳的Simons急于扳回局面,抛出一个引人思索的问题:“请问,我们现在真的有什么问题,是靠大数据才能解决,而靠现在技术解决不了的?”

他说,大数据不仅分散了人们的注意力,甚至是“危险”的,因为海量数据意味着决策制定将更加“集权化”,而科学本身是应当以人为本,强调自主性的。他以多年前他在一家英国银行开户的经历作为例子:一开始他与银行客户经理面对面聊天,对方认为他完全符合开户条件,可当把他的所有信息输入电脑之后,电脑却拒绝了他的开户申请,而他至今不知道自己为什么被拒。