几乎全球范围内人类已经达到统一的认知:数据,已经成为重要的生产资料。麦肯锡认为数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。IBM执行总裁罗睿兰认为数据将成为一切行业当中决定胜负的根本因素,最终数据将成为人类至关重要的自然资源。数据的真正价值,是在各种场景中被充分应用和完美释放,它堪比石油和金矿。
BBC地平线系列《大数据时代 The Age of Big Data 2013》呈现了多个数据应用场景:在洛杉矶,一项非凡的实验正在进行中;警方尝试在罪案发生之前能够预测到它们的发生。在伦敦市中心,一位交易员相信,通过数学,他找到了发财的秘方。在南美洲,天文学家尝试着为整个宇宙进行分类记录。这些是非常不同的领域;然而它们被一样事物统一起来:爆发的数据量。纪录片走访了奋战在这个数据革命前沿的不同人士,并揭示了大数据时代的可能性和灿烂的未来。
“我们每天制造的数据,比从文明肇始到2000年的总和还要多。推特、搜索引擎、科学实验和股市,这些采用空前复杂算法建立的庞大数据库,为我们带来了宝贵和大开眼界的见解。”这是源自纪录片《大数据时代》的一段概述。
从使用特殊算法来预测案件发生地的警察部门,能够预知病情的手机应用软件,到坐拥30亿美元避险资金的富豪雇佣宇宙学家、密码破译员和粒子物理学家为他制定决策……纪录片更揭示了科学家们如何使用技术和创新来搜寻数据。
不难发现,大数据已经真正意义上从概念期进入应用期。
从数据中挖掘出各种各样的模式用于预测未来犯罪,个性化广告,金融等等,天文观测等等,数据挖掘的前景很光明,但bbc拍的还是不专业,犯罪预测的例子明显夸大了算法的成果,对比实验做的有点扯,警察去巡逻了当然犯罪率会下降啊。还是金融预测的那个例子说的在理:算法并不一定要预测的100%正确,只需要正确率比错误率高就有巨大利润的可能。
印象最深的是数据挖掘第一人格兰特,从死亡人数统计中发现了这么多规律:男孩的出生率高于女孩,但男孩的死亡率同时也高于女孩,这就保证了性别的平衡。
当数据大到任何一种模式都包括的时候,我们是不是只需要做过简单的统计推断就知道以后会发生什么了呢?什么SVM,Deep Learning, 逻辑回归,决策树,EM,最小二乘,矩阵分解,梯度下降等等估计都干不过贝叶斯了吧。又想起了瓦普尼克的那句话,all your bayesian belongs to us.
Sorry,此资源仅限本站vip会员下载,请先登录
如下载地址失效,请联系我们的在线客服!帮助及声明:若需要帮助,您可以查看 帮助中心 。若本内容无意侵犯了贵司版权,请与我们联系2406067889@qq.com,我们将在第一时间处理与回复!