摘要:大数据是什么?我们为什么要关心?你已经在别人的数据库里添加了你的新数据,那个数据会针对你推送广告或你将来可能会做什么进行预测,无论你接到工作面试或是进监狱都取决于其他人
大数据是什么?我们为什么要关心?
你已经在别人的数据库里添加了你的新数据,那个数据会针对你推送广告或你将来可能会做什么进行预测,无论你接到工作面试或是进监狱都取决于其他人收集的关于你的数据。所以你应该花5分钟学习一下,大数据如何运转并在我们的周围构建怎样的世界,顺便说一下,假如你现在停止阅读该文章也会产生新的数据,也许会使你个人数据冲动性提高0.7个百分点,意味着5年时间里,一些招聘算法会拒绝你做一名航天宇航员。
接下来我来聊聊大数据,数据不是什么新鲜事物,仅是可转移形式的信息,约3万年前,中欧的一个山洞里,有人在狼胫骨里,以5个一组刻了57个划痕,和现在计数的方法一样,那就是数据。我不知道他们计算什么以及为什么计算,但无论它是什么,我们至少知道有57个,那是所知关于数据最古老的例子。称其为“数字”是因为你可以用你的手指头来数,在冰川时代,这一定是一场信息技术革命。
大数据有多大?如果要我给你个数字,它会增长变化很快,当你阅读结束时数据就会更新。十年前,谷歌每天产生2万兆兆字节的数据,去年,美国零售商沃尔玛每小时从客户身上收集2500兆兆字节数据。
大数据编成缩略词,用DATA表示数据。
D是“规模”。如果用术语的话,也可以是“多样的”或“不同的”,通过合并来自不同来源的不同类型的数据,可以得到一个多维度图片。例如:神经系统科学家保罗马修教授利用从大脑扫描到患者的全部数据感到兴奋,但是那都只能称作“大量的数据”,而大数据是当输入数据时,大脑会与患者医疗记录、住处和该地天气记录等具体个人信息一起扫描,从而判断出他们病症症的发展过程。
A指的是自动化。数据运行的方式是自动收集,每次我们在电脑上或用银行卡,或仅仅移动一下手机等操作(数据都会被收集)。事实上,几乎我们做任何事都会产生其他人可用的数据,你的手机、车、手环等,多数时候我们注意不到数据的收集。
T是时间。因为数据是在真实的时间里被收集,这些模式可以被提前用来预测未来,像火车高峰期是什么时候,我们需要多少电,疾病传播多快这类的事情。
A是人工智能。并非真的像人类的智力一般,但人工智能电脑程序使用机器,学习一样的技术找到数据图案,而你也不需要给出每一步的指令,你只需要告诉它从a排到b,就能从猫的图片到狗的图片,或从好的求职者到较差的求职者排序。人们正利用大数据做很多令人兴奋的事,追踪昆虫来抵御像疟疾和寨卡一样的疾病,在飞机发动机发生故障前提前预测,找到新的颗粒或新的抗生素。
当同样的技术应用到人类身上,事情会变得棘手,比如用大数据预测一些人再犯罪几率,能因此宣判他们有罪吗?当然,它通过整合不同数据资源,建立多维度轮廓,帮助西方政治家了解选举人,这也在当年奥巴马成功选举时应用过的。但若说奥巴马只因为大数据才赢的吗?我认为只是提供了一些投票者想要的东西,大数据只是帮助他得到关键投票人的票数,政治与信息的内容有关,却非传递它们的平台。
大数据虽然有自己的局限性,尤其是对人类而言,但它也有提升人类生活水平的无穷潜力,只要我们确保用正确方式使之处于可控范围,就能被人类更好地利用。
相关文章推荐
新网新人专享,注册领SSL证书百元神券2022-09-15
新网与亚洲诚信达成战略合作,携手共建安全云生态2022-09-06
企业网站没有SSL证书,你将面临......2022-09-27
SSL协议、TLS协议,有什么区别?2022-09-26
网站跳出率高?可能是没装SSL证书2022-09-26