大数据定义和概念

互联网 2024-04-01 阅读

《大数据时代》读后感

  我们生活在一个“概念”纷飞的年代,先前只有IBM熟谙的招数,如今已经“飞入平常百姓家”。“移动互联网”、“云计算”的概念刚刚消停,业界的专家又送来了“大数据”的概念,一时间似乎人人都变成了“大数据”专家,见面要是不提“大数据”都不好意思跟人打招呼!

  玩笑归玩笑,当我们的存储能力、计算能力和网络带宽变得充裕之后,我们先前对待数据,尤其是原始数据的态度和思维方式,将面临着很大的改变!

  其实,作者的主要观点,已经在翻译者的译者序中进行了总结:“大数据时代处理数据理念上的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果”。

  如作者所言,“采样分析是信息缺乏时代和信息流通受限制的模拟数据时代的产物”。如果可以,我们当然会使用“全体数据”而不是“抽样数据”。读到这里,我估计大学里正在绞尽脑汁设计样本抽样方法的学生、教授们,连哭的心都有!

  数据分析的及时性,在很多情况下比精确性更加重要,尤其是在商业领域。想想看,如果需要两周时间才能计算出明天某个航班的满座率,那还有什么意义?大数据计算技术,适用的不是像卫星发射、开具银行账户这样的工作,而是不要求极端精确的情况,其核心是“预测趋势”,况且原始数据也可能出现差错。

  过往千年,探究因果关系几乎是所有科学研究的原动力。甚至,这已经通过语言,融入我们的思维方式和哲学思想:“因为……所以……”,凡事都要问 “为什么”。但是,在大数据的范畴里,关注的却是相关性,而不是因果关系,或者其次才是因果关系。超市只用关心把啤酒和尿不湿放在一起,会帮助提高销售额,而不用关心其中的奥秘。如果说原因,可能很多都是人们的习惯、方便,甚至是人性,例如奶爸们习惯买尿不湿的时候给自己捎上几罐啤酒。

  在此,也有一些自己的思考:如果说搜索引擎所解决的问题表面上是帮助用户找到需要的信息,而实质是帮助企业找到拥有某项需求的客户,深层次讲是解决了《第三次浪潮》中提出的消费者和生产者分离的根本矛盾,如果再加上3D打印技术,就可以完成由消费者主导的“个性化”生产过程;而大数据所解决的是,通过对所有用户的数据进行分析,可以预测用户群整体的需求变化趋势,从而完成批量产品生产、销售的调整问题,其奇妙之处就在于无需用户“开口”说出她想要什么?一个解决的“个体需求”,一个解决的是“群体需求”。

  本书除了提出上述三项基本观点,其它的内容大多是举例说明,多少有些空泛。但是,其实大数据时代才刚刚开始,对大数据的应用也只是停留在比较浅的层面上,作者能提出这三项基本观点已属难能可贵!

大数据定义和概念

《大数据时代》读后感心得

  凡是过去,皆为序曲是大数据业者最喜欢引用的语句。大数据是现在的潮流,《大数据时代》被认为是了解大数据的初级读物。近期连续读了两遍,第二遍是为了写这篇读后感,总体而言,值得一看,但细节方面却需要讨论了。

  维基百科对大数据的解释:Big data,或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。

  有人说现在是读图时代,除去小说、心灵鸡汤以外,现在的畅销书基本都有图片,这本书是一个特例(书里唯一的图是出品方湛庐文化做的)

  首先尝试解析一下作者的三大观点,这三大观点是大数据业者很喜欢引用的三句话:

  1 不是随机样本,而是全体数据

  我想所有人都能意识到对全体数据的分析优于对随机样本的分析,但在现实中我们经常拿不到全体数据:一是对象的特性:比如炸弹的威力,你不可能把所有炸弹都炸掉来得到全体数据;二是数据的收集方法,每一种方法都有适用的范围,不太可能包罗万象;三是数据分析的角度,战斗机只能统计到飞回来的飞机上的弹孔,而坠毁的则无法统计,沃德通过分析飞回来的战斗机得出来最易导致坠毁的薄弱点;四是处理能力跟不上,就像以前的天气预报太离谱是因为来不及算那些数据。“采样分析是信息缺乏时代和信息流通受限制的模拟数据时代的产物”,作者显然只关注了一部分原因。

  从语言的理解上看,什么是全体数据,究竟是“我们需要的所有数据”,还是“我们能收集到的所有数据”,书中的很多商业案例中,处理的只是“我们能收集到的所有数据”,或者说是“我们认为的全体数据”。人对自然的认识总是有限的,存在主义认为世界没有终极的目标。书中举例“Farecast使用了每一条航线整整一年的价格数据来进行预测”,而“整整一年”就是一个采样,或者是“我们需要的所有数据”。

  从历史的角度看,国外的托勒密建亚历山大图书馆唯一的目的是“收集全世界的书”,实现“世界知识总汇”的梦想,国内的乾隆汇编四库全书,每个收集的过程都有主观因素在里面,而他们当时都认为可以收集全部的书籍,到最后,我们也没有得到那个梦中的全体。

  2 不是精确性,而是混杂性

  既然我们过去总是在抽样,那本身就是在一个置信水平下,有明确的容错度或者是偏差值。人类永远知道我们是在精确性受限的条件下工作。同时,作者本身也承认 “错误并不是大数据固有的特性,而是一个亟需我们去处理的现实问题,并且有可能长期存在”。那大数据的特征究竟是精确性还是混杂性

  由此衍生出一个问题,大数据的品质如何控制:一、本身就不要求精确,但是不精确到何种程度是需要定义的,否则就乱套了,换个角度,如果定义了容错度,那符合条件的都是精确的(或者说我这句话还是停留在小数据时代?这里的逻辑我没有理顺)。就像品质管理大师克劳斯比提出过零缺陷理论,我一直觉得是一个伪命题,缺陷是一定存在的,就看如何界定了;二、大量非结构化数据的处理,譬如说对新闻的量化、情感的分析,目前对非SQL的应用还有巨大的进步空间。

  “一个东西要出故障,不会是瞬间的,而是慢慢地出问题的”。“通过找出一个关联物并监控它,我们就能预测未来”。这句话当然是很认同,但不意味着我们可以放弃精确性,只是说我们需要重新定义精确度。之于项目管理行业,如果一个项目出了严重的问题,我们相信,肯定是很多因素和过程环节中出了问题,我们也失去了很多次挽救的机会。而我们一味的容忍混杂性的话,结果显然是不能接受的。

  3 不是因果关系,而是相关关系

  这是本书对大数据理论的最大的贡献,也是最受争议的地方。连译者都有点看不下去了。

  相关关系我实在是太熟了,打小就学的算命就是典型的“不是因果关系,而是相关关系”。算命其实是对趋向性的总结,在给定条件下,告诉你需要远离什么,接近什么,但不会告诉你为什么那样做。

  我们很多时候都在说科学,然而,什么是科学,没有人能讲清楚。我对科学的认识是:一、有一个明确的范围;二、在这个范围内树立一个强制正确的公理;三、有明确的推演过程;四 可以复制。科学的霸道体现在把一切不符合这四个条件的事物都斥为伪科学、封建迷信,而把自己的错误都用不符合前两条来否决。从这个定义来看,大数据不符合科学。

  混沌学理论中的蝴蝶效应主要关注相关关系。它是指对初始条件敏感性的一种依赖现象,输入端微小的差别会迅速放大到输出端,但能输出什么,谁也不知道。

  人类一旦放弃了对因果关系的追求,也就放弃了自身最优秀的品质:意志力。很多人不愿意相信算命是担心一旦知道了命运,就无法再去奋斗。即使我相信算命,也在探求相关关系中的因果要素。我放弃第一份工作的原因之一是厌倦了如此确定的明天:一个任务发出去,大概能预测到哪些环节会出问题,只要不去 follo这些环节十有八九会出问题。

  解析完这三大观点,下面是我对大数据理论的一些疑惑。大数据是目前风行的反馈经济中的重要一环,在金融、互联网行业的应用最为广泛,而这些行业都是大家所认为的高薪领域。很多时候我就在想,所谓无形的手所产生的趋势究竟是不是无形的。比如几家公司强推一个概念,说这是趋势,不久就真的变成趋势了。我们身边活生生的例子就是天猫的双十一和京东的618,一个巨头开路,无数人跟风,自然就生造出购物节,至于合理不合理,追究的意义也不大,因为很多事情是没有可比性的。这和没有强制控制中心的蜂群思维又不一样。

  1 数据独裁。个人意志将受制于集体意志,个人的自由在哪里?用大数据预测来惩罚人的行为又确定的违反了无罪推定的原理。

  2 所有数据都来源于过去,大数据分析出来的确定性结果是否意味着我们在重复过去?拉普拉斯的决定论已经被认为是错误的,爱因斯坦也说过“上帝不会跟宇宙玩骰子”,但霍金不同意这句话。

  3 在金融市场中,每个相关性都有对应的利润空间。如果大家都基于同样的数据(假设我们必须用全体数据,那全体数据显然是一样的),最优秀的数据算法师会得出同样的结果,市场也会反应得非常高效,导致相关性套利空间的减少和消失。历次金融市场的危机,也都是量化交易触发了相同的交易方向,导致市场失控。就像大家都认为明天会堵车而不开车,明天自然就不会堵了,海森堡的不确定性原理也这么说。

  4 涉及的隐私问题,这点在书里写了一些,我始终觉得还欠缺什么,只是没想好。

  5 数字化之后的数据保存期限,在企业的ISO管理中有对保留时限的要求,这些数据基本都是原始数据。在大数据的背景下,分析后的数据是否也需要保存?因为这也属于全体数据啊。顺便列一下数据量级的缩写:2的10次方是KB,20次方是MB,30次方是GB,40次方是TB,50次方是PB,60次方是 EB,70次方是ZB,80次方是YB。

  6 资产价值,这点书里也写了,当大数据真的被公众接受的话,会计准则如果调整也会是一个大问题。

  看完这本书,总是觉得作者说的过于绝对,也许是我的认识太浅了吧,所以最后用法演四戒做总结:

  势不可以使尽,使尽则祸必至

  福不可以受尽,受尽则缘必孤

  话不可以说尽,说尽则人必易

  规矩不可行尽,行尽则事必繁

《大数据时代》读后感

  书名中的时代二字让我陷入了深深的误区,big data就只是大数据而已。读完全书,也没有发现作者有说大数据会引领一个时代的观点,我们知道当今是一个数字化、信息化的时代,但绝不还是大数据的时代。但大数据的重要性不严而喻,生活、工作、学习中许多有关大数据的例子的确离我们很近,我们甚至就是众多大数据的一部分。那大数据对我这样一名工科大学生有什么用,对于我这一名国防生又什么用呢,这样的一本书是否能够更好的帮助我在未来的工作岗位上博得头筹,取得一番成绩!还有为了接触、利用大数据并防范大数据所带来的弊病,我又该怎么做呢?书中有这样一句话:大数据是一种资源,也是一种工具。大数据为我们提供暂时的帮助,以便等待更好的方法和答案出现。这也提醒我们在使用这个工具的时候,应当怀有谦恭之心,铭记人性之本。

  所说的谦恭之心和人性之本都强调了人在大数据时代的重要性。我们才是数据之源,我们才应是数据的受益者。当我还没读完思维变革这一部分的时候,我就在思考这样的思维变革对我会有着怎样的影响?参加过两次数学建模竞赛的我,在两次的参赛过程中,学会了许多数据处理和数学建模方法。数学模型所具有的对事件或数据的描述性、预测性、说明性是与大数据完全不同的。大数据下的思维变革不再追求数据的准确性和因果关系。如果我在数学建模提出一种产生某个结果的原因,我是需要明明白白地把其他因素的影响一一剔除。我记得在参加比赛最后关头写论文的时候,对于所研究的问题,我们必须在前面把各种变量给写进去,然后再有选择性的在可接受的条件下忽略掉很多变量的影响,但我们在很多时候却给不出一个剔除这个因素的理由。可如果你不能排除掉其它的因素的影响,整个的数学模型建立及计算过程就会太复杂甚至是不能得出一个结果。但是在大数据时代,一个结论是可以通过足够多的数据得出来的,不需要明白其中的为什么。如果真是这样,我只觉得我需要思维上的变革,可我做不到,我接受不了事物与事物之间的黑盒子。这离我太遥远。

  可我又不敢在此时否认自己将来的工作与大数据的相关性,书中第三部分——大数据时代的管理变革中就举到一个罗伯特。麦克纳马拉的例子,他是五角大楼"统计控制队"中一名精英,这个队伍让之前不知道飞机备用零件种类、数量和放置位置的军方在制定了综合清单之后,为部队节省下了36亿美元。而我的专业就是飞行器动力,我很清楚我国航空发动机的研究制造水平是深深限制了空军力量的发展。在夏季学期去黎明航空发动机厂实习的时候,许多讲解的师傅都会强调一点,发动机的每一个零件上都是有标号的。零件的工艺卡片上会记录其每一个工序的加工时间、地点,加工、组装、调试人员等的资料,这些卡片将会一直保存下去。这不仅能够方便维修和更换,在出现事故之后,还可以追根溯源,查出事故的原因。我当时就在想还好这东西产量不是很高,一台涡扇发动机仅仅叶片数量就是数千了。这样的大数据肯定还可以好好利用,帮助我们去发现科技研发和制造生产中矛盾与不足,并做出改进。但航空发动机的发展需要的更多的是技术的积累,特别是关键技术的实验数据我们还有着很大的缺失。我们不能像BAT这些互联网巨头可以轻松收集数据,航空发动机的技术积累需要一代代人在理论、实验上的积累,才有可能在这种大数据的支撑下做出真正属于自己的航空发动机。

  这种积累利用方法可能与书中作者所说的利用大数据进行预测、创新相比起来不是足够高端,但是新的方法需要人去摸索,我也愿意成为这样的第一人,我也坚信大数据能够给这样一个领域带来另一片天空。只是在航空发动机的领域我们是不能只停留在"是什么"这一步的!精心策划数据的因果关系研究和控制实验很有必要。

  最后,我提出一个疑问,那就是大数据能不能创造出另一个毕加索呢

《大数据时代》的读后感

  我主要读了第一部分和第三部分。

  第一部分是大数据的思维变革,作者舍恩伯格提出了三个观点,一是"不是随机样本,而是全体数据",二是"不是精确性,而是混杂性",三是"不是因果关系,而是相关关系",作者被誉为"大数据时代的预言家",抛出的观点是掷地有声的,下面我将谈谈我对这三点的理解。

  对于一,我们必须承认我们以往做的处理抽样数据得到结果的方法,是省时省力省钱的,而且判断结果是相对高精准的,如人口普查这一案例,如果采用全体数据进行统计分析的话,工作难度是相当大的,最后的结果也不会很满意,这是得不偿失的。但是随着数据处理技术的飞速发展,我们已经具备了处理大量数据的能力,如果在数据分析过程中采用全体数据,就能避免抽样数据可能由于选取偏见带来的非随机性,处理全体数据也必将成为一种趋势。用在国防生管理工作中,就是管理层要对每个个体都给予充分的关心与互动,对于优秀的固然要偏爱,但是对于较差的也要保持"不抛弃不放弃"的态度,让每一个个体都找到自己的定位与价值。

  对于二,作者强调通过掌握更多的数据,暂时牺牲精确性,关注更多容易被忽略的细节,来做更多的事,得到更多的结果,也就是说我们要有一定的包容错误的能力。我们在收集数据时,要主动获取更多的数据,少加一些限制性条件,然后应用我们处理大数据的能力,或许会获得意想不到的结果。作者举了一个谷歌翻译系统的例子,通过英语作为中转,进行各语言之间的转换。此处的启发就是用我们最擅长的途径,不拘泥于特定规则,来达到我们的目的,也就是说我们要先认清自己,不去刻意的模仿,找出最适合自己的一套方法。

  对于三,作者指出知道"是什么"就够了,没必要知道"为什么",乍一看这个观点觉得有点无脑,但是结合第二点就合理了,降低对精确性及原因结果的要求,通过对相关数据的广泛分析,进而得到更丰富更多元的结果。如购物时,系统的购物推荐,并不是肯定你会购买,仅仅是你感兴趣进而可能会买就足够了。其实作者对"相关关系"的强调,主要是大数据强大的预测能力,而且这种预测性能还是相当精确的。以上只是我用作者的观点佐证他自己的观点,证明其一定的合理性,但是我是不完全认同的,在航天领域,我们对成功率的要求是极高的,尤其是载人航天领域,我们必须做到万无一失,我们对每一个结果都会深究其根,找出原因。对于国防生体能成绩的分析也是如此,结果只是我们的一个评价机制,而最重要的还是产生这一结果的原因及过程。

  第三部分是大数据的管理变革,本来以为作者会讲点如何通过大数据来改革管理机制和提高管理效率,没想到作者只是讲了大数据其实就是我们的隐私的暴露,提出了要让数据采集管理公司对数据的使用负起责任的解决途径。个人感觉,一是我们在平时要意识到个人隐私的保护,而是相关法律政策的完善,真正的让大数据服务我们的工作生活,而不是一种变相的威胁。

世界互联网:李彦宏对大数据人工智能技术的演讲

  尝试证实或证伪中医理论

  在演讲中,李彦宏谈到了大数据给医疗带来的机会,他提出,其实可以用大数据的方法进行证实或者证伪中医相关理论。李彦宏谈到,由于过去十几年的积累,人们已经可以看到在大数据、人工智能方面有很多新的机会出现。这些机会有些可能在一般人的心目当中和互联网没有太大的关系,但是在他看来,诸如大数据和医疗健康就有很多方面可以结合。

  在李彦宏看来,中医理论其实是在讲养生的方法,比如著名的《黄帝内经》,但《黄帝内经》已有两千多年历史,其中哪些理论是对的,哪些是错的,都可以通过技术手段来证实或证伪。在演讲中,李彦宏提到,安徽有一位老人每日在家按摩两小时进行养生保健,颇为长寿。他认为,类似这种零星的个体经验并不能够认定为规律,但如果在全国找到几千个、几万个同样的案例,用大数据的方式进行归类分析,就能够判断个体的经验是否构成规律。

  关注癌症治疗及基因测序

  对于互联网与医疗的结合,李彦宏也提到了除中医外的其他机会,比如基因测序。“大多数的疾病都是因为基因和后天环境导致的,那么什么样的基因导致什么样的疾病?大数据也可以帮忙。”李彦宏在演讲中指出。

  今年以来,李彦宏已经不止一次在公开场合表达自己对于生命科学、癌症治疗以及基因测序的高度关注,并多次表达互联网+以及人工智能和大数据等技术对于“治未病”、证实证伪医学理论的畅想。在今年与复旦大学师生的对话中,李彦宏说:“绝大多数病跟遗传有关系,但我们不知道是什么基因导致了这个病,可能是很多基因的一个Co,导致了这个病。26000个基因、各种各样的组合就需要我们的大数据,需要我们的人工智能来计算。”

  呼吁企业家思考自己使命

  据悉,李彦宏前不久还个人捐资3000万元,支持中国的食管癌研究。他说,长期以来,中国食管癌发病率高居世界首位,而且中国的食管癌都是所谓的食管鳞癌,与美国的食管腺癌不同,没法借鉴其他国家的研究成果,李彦宏认为,“这是我们中国人的职责”。食管癌研究项目利用大数据和人工智能技术相结合,对大量食管鳞癌患者的信息加以分析进行基因测定,更有针对性地进行药物研究,推进癌症预防与治疗的进一步发展。

  “这不是公司的业务,是中国人的职责。”李彦宏说,“这个项目短期内不会有任何商业回报,所以需要用企业家个人的资金去进行研究、进行突破、进行创新。”为此,他还呼吁企业家们能够利用自己积累的资金去做一些有意思的、创新的事情,“期望我们每一个企业家都能站在时代的路口上,认真思考自己所肩负的使命,为自己的企业也为自己的人生做出更精彩的业绩”。

  人工智能将深刻改变人类

  而就在大会开幕当天,李彦宏还向国家领导人现场讲解了百度无人驾驶车的技术储备、路测实况、行业突破等内容。昨天的主旨演讲,李彦宏也以无人车为例,阐述了人工智能技术改变人们生活的巨大空间,他说,随着计算机计算能力、成本的下降,人工智能迎来了新机遇。李彦宏认为,

  人工智能有很多创新空间,不仅是无人驾驶汽车,人工智能未来对整个社会各方面都影响深远。“如果说过去的几百年工业化改变了人类,那么它主要的改变是代替了绝大多数的体力劳动;未来人工智能将会更加深刻地改变人类,它会代替绝大多数的简单、重复性的脑力劳动。”

大数据时代读书笔记

  近两周用业余时间读了《大数据时代》这本书,是听培训时杜威老师推荐的,我快速阅读了一遍,觉得受到了一些启发,发现了一些原来没有想到看到的事情。

  首先是大数据代表着数据的样本=全体,这是一个与传统统计学的显著区别。大数据有能力获得全体数据并对其进行分析。

  第二就是相关性与因果性同样重要。相关性说明了什么事情与什么什么事情有关系,如商场周围车流量的增多与商场销售额的相关性,因果性说明什么是什么的原因,如睡10个小时是有精神的原因。在大数据中,相关性要比因果性容易获得,而且相关性已经能为客户带来较大的收益。

  第三就是大数据允许存在不精确性、混杂性,由于数据量巨大,存在少量的异变不会对结果产生任何影响,如收益是1个亿与1亿零1元的差别可能决策者不关心。

  第四是大数据中的三个主要因素,思维、数据、技术,思维觉得你在哪些地方使用大数据。在这三个因素之中,会产生数据中间商,来处理加工数据并出售。

大数据时代读书笔记

  舍恩伯格的《大数据时代》,让我重新审视了"大数据"这个在信息时代异军突起的热点词汇,作为信息安全专业的我,对大数据这个词本身有着更多的热忱。

  在百度上搜索到的解释是:"大数据",或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。特点:数量、速度、品种、真实性。

  而舍恩伯格认为,大数据并不能定义一个确切的概念。他提到"大数据是人们获得新的认知,创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府和公民关系的方法。"这是一种更具有人文色彩和社会意义的诠释。

  本书中,主要从三个方面论述,即思维变革、商业变革和管理变革。而舍恩伯格更是着重阐明三大观点:

  一、更多:不是随机样本,而是全体数据。

  二、更杂:不是精确性,而是混杂性。

  三、更好:不是因果关系,而是相关关系。

  对于观点一,我不敢苟同,毕竟大数据的实现需要一定的技术支持,而显然,现在这种技术还不够成熟,同时一些简单的事情运用大数据反倒是问题更加复杂化,因此这种大叔据的繁杂处理方式更适用于一些特定的情况,比如商业预测,人类dna的研究等。

  而对第二种观点,我是十分赞同舍恩伯格所说的"大数据的简单算法比小数据的简单算法有效"。在计算机行业迅速发展中,一种新的简单可行的算法的出现,远没有计算机在运算速度和存储容量的发展快,而大数据算法似乎更能迎合这种大趋势。

  观点三中提到的相关关系在大数据中可是重量级的,它能较快找到事物规律和对应的解决措施,当然,也不能完全忽视因果关系,毕竟人们在思维上更能够接受因果关系分析出的结果,而大数据预测的需要人们慢慢的适应才能接受。当我们完成相关关系的分析而又不满足于只知道"是什么"的时候,我们就可以转而研究"为什么"了,毕竟问题的根本在于因果。而舍恩伯格的全体数据和相关关系是大数据时代下的一种捷径。

  但是在信息时代,信息安全问题的日趋凸显,数据独裁与隐私保护之间的矛盾更是立于风口浪尖,成为众矢之的,舍恩伯格在本书的最后章节曾试图寻找一种解决方式来摆脱这一种困境,但最终没能做到,但是他提出"大数据并不是一个充斥着算法的和机器的冰冷世界,人类的作用仍无法被完全代替。"这里表明人在数据时代同样的重要,数据是为人类服务的,也就该人类驱使下完成相应的目的。

  在这样的大环境下,常引起我更多的思考和担忧。

  大数据时代对于我们同是机遇与挑战,一些国家已开始步入大数据时代的行列,并在各个领域开始研究和使用。而对于我国庞大的人口,以及较大的领土面积,都可以在大数据时代为我们提供数据的保障,而能否面临挑战,在大国之间的新一轮角色角逐间崭露头角,我们更需要解决技术等方面的问题,更应在政策上逐步开放各领域的数据,保证数据来源、权限等问题得到解决,不断学习先进的计算机技术,缩小与其他国家的差距。

  工业化、信息化,我们都向世界交出了一份让世界不能小觑的答案;

  大数据时代的数据化我们又将怎样在新的风暴中所向披靡,如果大数据时代是一种必然趋势,那这就是我们这一代人的责任,是我们新的战场!

大数据时代作文

  一年四季,桃花只盛开一次;一年有三百六十五天,而春天只有短短的三个月……数字可以用来对比,可以用来表达世间所有美好的事物。它触摸不到却能让我们领略人间的温暖与冷漠。当我们走进数据时代,你会发现世间冷暖,尽收眼底。

  数据虽是生冷的数字,但它能折射出人间的冷暖。漫步于天地,没有数据的世界一片茫然,它可以带给我们准确的度量,可以让我们知晓天下事。可以让我们的生活更加丰富多彩,充满生机。数据折射出人间冷暖。

  数据提醒着人们过错的同时。也反映出时间的冷酷无情。到了上世纪九十年代。长江里仅剩二百余头白鳍豚,到了1997年,这种身长六英尺左右的动物只剩下了十七头。到了2004年,这种白鳍豚已经几乎消失在人们的视线。这一系列逐渐变少的数字无一不敲打着人们的警钟,提醒着人们保护环境的重要性,这些数据反映的不只是人们意识淡薄,更是对人间冷酷无情的极大反射!生命如此脆弱却被人类毫不留情地亲手扼杀。这些直击人心的数字是冷漠无情后付出的惨痛的代价,它时时刻刻都让我们为自己的所做所为感到羞耻。

  数字也会如阳光般轻柔,带给我们温暖。当你考试得了满分,拿着卷子看至那鲜红的数字,你会感到无以言表的快乐与激动:当卖水果的老大爷今天顾客满员,多挣了一百元钱,看着那鲜红的钞票,就会感到幸福满满,生活幸福指数提高,经济发展的进步,每项数据都那么鼓舞人心,温暖心灵。数据有时就像乌云上的阳光,他会带你穿过层层阻碍,走向未知的世界。即使是很微小的事情,也会被数据折射幸福的光芒。

  数据丰富着人们的生活,改变着我们的思维方式,仿佛离开了数据就会将自己陷入无边的黑暗。古人也常常用数据描述着事物的发展,曹刿论战中一鼓作气,再而衰,三而竭;登高中万里悲秋常作客,百年多病独登台。诗人们多运用数字夸张的手法表现内心情感,数字使他们的情感表达的更加淋漓尽致。作为新一届高三生,我们每天也会看到许多数字,距离高考仅剩二百余天,这将激励着我们去女里奋斗,为了明天的辉煌而放手一搏!

  数字如微风吹过,激起阵阵涟漪;数字如阳光拂过,留下丝丝温暖,我们在这条数据时代的道路上走过,留下了我们的足迹,感受世间冷暖,感受着数据带给我们的幸福生活。

  1.根据统计图中的数据填写下面的统计表。 风华小学兴趣小组男、女生人数统计图

  2.A、B两个城市2013年下半年各月平均气温如下表。根据表中的数据,完成下面的条形统计图 ...

  3.佳美超市甲、乙两种品牌的果汁今年第一季度销售情况统计如下:根据表中的数据,完成下 ...

  4.下面是英华小学五年级一班男、女生立定跳远测试情况统计图。根据图中的数据完成填空。

  5.东平小学五年级同学最喜欢的运动项目统计如下,根据这些数据填写统计表。 乒乓球:男 ...

  6.用7个同样的三角形拼成了一个梯形(如下图)。根据图中的数据,你能算出这个梯形的面 ...

  7.西岭小学五(1)班四个小组的同学分别测量了学校操场的长度,得到的数据如下表: 先算 ...

  8.有关数据表明,一些哺乳动物的平均寿命如下。 (1) 牛的平均寿命比马短百分之几? (2 ...

大数据类读书笔记

  《大数据》一书对美国大数据的应用进行了十分详细的介绍与分析,我印象最深的为两点。

  第一,以海量数据的处理作为政策制定的依据。看这本书的时候,我想到了这两年很火的一个美国人——斯诺登。在其曝光的“棱镜”计划中美政府直接从包括微软、谷歌、雅虎、Facebook、AOL、Skype以及苹果在内的国际公司服务器收集信息。美国政府从这些海量数据中寻找自己需要的数据,并以此作为所谓安全政策制定的依据之一。姑且不论媒体对此计划的口诛笔伐及相应的道德风险,仅从政策制定方面来说,依据于海量数据的政策制定科学性肯定比一般计划要高得多。

  2007年,雅虎 首席执行沃兹博士在《自然》上发表的《21世纪的科学》中提到,得益于计算机技术和海量数据库的发展,我们每个人在现实世界中的活动得到前所未有的记录, 这种记录也更为细致,为社会科学的定量分析提供了极为丰富的数据。打个比方,从你的QQ空间、微博、微信中一个普通朋友都能了解到你在哪儿、做了哪些事 情、现在的状态是什么,而新闻的跟帖、网站的下载记录、社交平台的互动记录等等都为社会行为的研究提供了大量的数据。我想到最近比较火爆的穿戴设备,如果 该技术得到普及过后,拥有穿戴设备的人群的生活轨迹、生理各项指标都能轻而易举地得到,相信这些大量的原始数据如能安全有效利用定能为卫生政策的制定提供 科学依据。

  第二,万事万物, 凡存在,皆联网,凡联网,皆计算。2005年起,美国食品与药品管理局开始在药品上推行配备RFID做法即每个食品包装上安装一个薄如纸张或小如豆粒的无 线传感器。通过这个移动传感器,对食品进行连续跟踪,一旦相应的安全事故爆发,就能通过数据库追踪溯源,快速确定传染源与影响范围。这一技术相对于国内尚 在起步阶段的食品追溯具有极强的借鉴性。上面提到的穿戴设备其实就可以视为一个穿戴在人身上的RFID。

  2010年的时 候,美国国家气象局在全国2000两客运大巴上装备了传感器,随着大巴的移动,沿途手机所有地点的温度、湿度、露水、光照度等数据,并立即传给国家气象局 数据中心。数据的采集是每10秒中一次,每天采集10万次以上的数据,这些实时的、高精度的数据意味着天气预报将不再仅仅是”预“,将逐渐走向“实”报、 “精”报。

大数据类读书笔记

  不过有意外收获,作者在文章后部主要讲了,大数据带来的消极影响,例如政府会通过大数据判断一个人将要出现的违法行为,提前对他进行拘捕,或者监视(这个已经在纽约警察局使用)但这样带来严重的后果,现在的法律是基于人已经发生的行为进行处罚,如果我们今后使用这套系统来作为法官的判决依据的话,这样就违背降低我们作为人的重要组成部分---自由选择的能力,行为责任自负。这便成了集体选择的结果,不是个人自由意志了。这样在否认个人为其行为承担责任,实际上就是在摧毁人们自由选择的权利。而且现在的预测不能达到很准确的答案。分析的数据质量不佳就会加剧问题的不良后果。

  作者最后说了这么一段话“大数据不是一个充斥算法和冰冷机器的世界,人类的作用依然无法替代,大数据为我们提供的不是最终答案们只是一个参考答案,暂时的,只是问了等待更害的解决办法,在不久的未来。”

  另外一个随之而来的问题就是数据授权使用,泄露问题,数据会有二次利用发现潜在价值,但这又产生更严重的问题,二次利用如何授权管理,是否涉及违法。解决办法是通过会计行业,可以有一个充当审计工作的外部算法师,作为第三方公证机构在出现问题时,可以进行审核算法和数据的使用情况,在公司内部也可以设立内部算法师,很类似公司自己的律师一样,一方面参加产品研发,另一方面在公司使用数据出现问题时也可以及时阻止,提醒。

  大数据确实在某种程度上可以降低风险,保护国家安全,但信用卡,保险业就会通过大数据分析拒绝一部分人(因为他们还不起账),但我们想想,人类进步,就是通过反抗,妥协,权衡,再平衡。有了一切大数据的预测,就少了很多的可能性,在某种程度会降低我们的社会进步。

  说实话之前听到大数据的概念觉得很有前景,很神奇,很向往,这本书给我带来的更多的是对大数据会给我们带来不亚于克隆人的糟糕影响。让我有了对技术给人类社会带来的负面影响有了一个全面的思考认识。读到后半部分的时候,我很沮丧啊,觉得这么好的技术,竟然负面影响超过了正面的,我很失落,也不再看好大数据。不过后来作者的一席话让我重振信心,他举例,曾经印刷术出现之前大部分的书全部在修道院,教皇手里,有了印刷术之后人们有了书,有了更开阔的思路,更多的想法,有了言论等等,这个的影响力要比大数据大很多,人类还是一步一步建立起来相应的制度,法律,直到今天我们已经有了对应的很完善稳定的法律体系。

  我们还是应该对科技充满信心,科技依然是那个推动社会进步的原动力,只是我们需要及时完善相对应的管理措施。

  最后说说对作者写的书的评价吧,其实我觉得写的一般,不过很符合外国人的写书风格,简单明了,很容易看懂,理解都不需动脑子,举例很少(可能因为本身合适的例子就很少吧)来来回回就那几个例子,有点像我们高考作文,来来回回那几个例子,什么场景都能用,哈哈。总的来说还是不错的,评级6分吧。

  最后说一句,美国确实在大数据上走在了前面,不是单纯技术上,技术科技学的很快,但是实际运用起来出现的问题,不是其他人能立即学会处理应对的,这又燃起了让我去美帝的欲望。

本站所有文章资源内容,如无特殊说明或标注,均为网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。

思想政治教育研究

数据统计与分析