大数据毕业论文
读《大数据时代》有感:大数据时代的取舍
在《大数据时代》的一开头,讲了这样一则小故事,尤为发人深省——作者维克托的继父去世的时候留下了16000张收藏的照片,这些照片全都是他几十年来周游世界的影像记录。因为体量庞大,维克托选择保留其中的一部分。如何裁决这么多幅照片呢?最后被选出的53张照片具有两个共同特点:1.照片上有认识或可能认识的人;2.照片拍摄得很漂亮。这种取舍是严格按照维克托所设定的程序进行的,其背后投射出人类对大数据时代未来的思考——在记忆成为常态的时代里,什么会是遗忘的例外?说得更玄一些,大数据时代,人类应该如何构建积极而安全的未来
《大数据时代》书分三部分,分别是商业变革、管理变革和大思维变革。在翻开这本书之前,我们不妨拿这三部分去套一下开头的故事。16000张照片精选出一部分是需要一个工具和流程的,有些人依赖情感感性地挑拣,有些人选择按照心中一个可识别的具体要求过滤。这是对待数据本身的管理方式不同。如果是160000张照片,1600000张照片甚至更多呢?一种算法在精密地处理着每张照片,而维克托选择了这样的两个要求,就要承担使用数据之后万一错过某张绝世佳作的责任。再来看这16000张照片本身,它们本身就是有价值的,每一张都是长辈生活点滴的封存,每一张都有着娓娓道来的动人瞬间。只不过或许有些照片定格的瞬间更加难得,有些风景照却可以日后故地重游重拍,因此让数据价值说话,在维克托的心目中,满足这两个条件的照片更具有被保留的意义,于是商业变革的缩影也可见一斑。最后要提到的,就是大思维变革,更多、更杂也更好的数据看似遮挡视线,但换个方式面对它们,就是在一个兼具广泛性和多样性的空间里选择更适合人类的数据使用方式,让数据不再单纯被陈列,而是可以活起来。不过此处还遗留着一个不大不小的问题,被舍弃的那一万五千多张照片,它们的命运将会何去何从,如果是纸质的可以撕掉、烧掉,但如果是现在存储在电子媒介中的,我们能确保点击删除的那个时刻,这些照片真的从此从这个世界上消失了吗?这些数据,真的是个体可控制,人类可管理的吗
一、思维转变,“样本=总体”
如果在法律的范畴中,我们提到大数据时代,第一反应是各种各样的。思维变革强调数据处理方式变化引起的思考模式转变。
1、更多
从前收集数据是一件令人苦恼的事情,于是人们无意识地选择规避大数据体量,人为限制了与数据的交流。如今,技术条件已经大大地提高,我们的习惯却常常停留在原地,因此大数据时代通过一些外在的动力去转变这种桎梏是非常有必要的。比如我们想知道应用《婚姻法》24条判案调解的情况,以前或许停留在抽查层面,不然就是要花费大量的时间挨个调研,费时费力还不一定全面。而现在,包括中国裁判文书网、北大法宝在内的多家平台可以提供大数据检索,简单输入关键词就可以在海量的数据库里精确定位到需要的案例信息,并且呈现出来的数据有一定的区分,网站通常会自动提供一些分类指标,例如是在哪个地区哪级法院,案由是什么,方便后期进行图表统计,用以画出饼图、树状图更直观地了解数据面貌。
2、更杂
但是问题也接踵而来,很多人会发现搜索结果有时并不一定完全符合预设情境,甚至文不对题,比如搜索“转让股权”而非“股权转让”就可能导致一些案例擦肩而过。而数据本身来源的多样性也导致了数据质量不一,各地区各层级司法文书的撰写水平存在差异,于是经检索获得的数据不一定都能充分发挥效用。但是纷繁的数据反应出数据体量的庞大,精确性依赖的应当是算法而非数据源,大数据的利益促使人们精进算法,多次尝试不同的搜索方式以弥补数据瑕疵,我们添加标签时所固带的不准确性从某种意义上说明我们能够接受世界的纷繁复杂,这是对更加精确系统的一种对抗。因为精确的系统通常试图让我们接受一个世界贫乏而规整的现象——因贫乏而规整,然而事实上现实就是纷繁复杂的,天地间存在的事物远多于系统所设想的。不是“一个唯一的真理”,一款法律条文不是只能适用于一种案情,多款法律条文组合可以推导出不同的逻辑链条。要想获得大规模数据带来的好处,混乱应该是一种标准途径,而不应该是竭力避免的。
3、更好
还有一点极为精妙地同时出现在法律和大数据的世界里,中国作为非判例法国家,查询其他相似案例固然可以帮助人们预测案情未来走向,但是这些信判例却不可以直接作为法源或是最有力的论证。不过,判例中所提到的法律条文,法律条文串起的逻辑思路却能另一起案件中得以运用。相似不代表相同,这是大数据时代个性化定制中存在的问题,人们在淘宝买了一件衣服之后,相似的预测方式会让系统推荐同样的款式不同的店家,或许由于渠道或者面料的不同,价格存在一定差异,但是消费者很少会在短时间内重复购入。而相关的预测方式会考虑这件衣服的特质和要素,譬如蚕丝面料、短袖、款式较为保守等等,这通常折射出消费者的偏向,于是再有这些元素组合而成的衣服也很有可能受到青睐。让数据更好意味着提高数据的效用,选择关联度高的数据,能成功起到预测的作用。法律是具有预测的功能的,而大数据可以验证或者说提高预测的可信度。当我们看到大量的案例真真实实地告诉我们许多故意杀人罪犯罪嫌疑人最终真的被判处死刑时,我们愈发地相信写在刑法里的条文所具有的威慑力,更加谨言慎行。
二、量化数据,从“T”到“I”
大数据发展的核心动力来源于人类测量、记录和分析世界的渴望,如今的信息技术变革重点落在“T”(技术)上,而不是在“I”(信息)上。现在,我们是时候把聚光灯打向“I”,开始关注数据本身了。
数字化和数据化是两个不同的词语,比如说有一篇判决书适用法律严丝合缝、遣词造句文采斐然,人们把判决书的每一页拍下来,再上传到网上,于是更多的人打开一张张jpg,开始阅读这篇判决书,这是数字化。而中国裁判文书网、北大法宝的字符串已经经过了有效的处理,在我们看来的汉字对于电脑而言是不同意味的0和1,这些网站的后台当然不是活生生的工作人员在一张一张翻看全国各地的司法文书,人为地看到“一审”就归到“一审”那摞纸上,而是计算机算法自动识别着不同的字符串,按照指定要求分门别类,这是数据化。存储成本的大幅下降,使得保存数据比丢弃数据更加容易,书盈四壁固然学问高深,但是大数据时代的数据却可以得到更长久、更妥善的保存。数据的非竞争性使其不同于物质性的东西,价值本身不会随着使用次数增多而减少,可以不断地被处理。前文已叙,对搜索点击的个人用户而言,法律数据库的好处自然是不言而喻。而大数据时代能容许数据发挥的价值,还远不限于这些现时的眼前的帮助。数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,绝大部分隐藏在表面之下。又像是静止在山坡上的小球,它原地静止时不声不响,一旦释放滚下山坡,其中的动能就能被发现。数据的二次利用使得隐藏价值得以有效释放。
大数据环境下网络信息安全研究
来源:农村经济与科技
ISSN:1007-7103
年:2018
卷:029
期:019
页码:290-291
页数:2
中图分类:TP393.08
正文语种:chi
关键词:大数据;信息泄露;网络安全;应对策略
摘要:"互联网+"新经济形态下,物联网以及传感器等相关技术的不断突破发展,使得"万物互联"得以逐步实现,社会也已经步入了大数据时代.大数据方便我们生活的同时,也在影响和改变着我们的生活方式.在这样的时代背景下,网络信息安全问题逐渐成为人们关注的焦点,应对网络信息泄露的重要性也愈发凸显.在分析网络信息泄露主要原因的基础上,提出对应的防范策略.
大数据与互联网心得体会
今天有幸拜读了陈勇、杨定平、宋智一三位学者的《中国互联网金融研究报告》这部营销新著,使我受益匪浅。该书是专家、学者对当前中我国互联网金融长期研究的结晶,是互联网金融学的前沿,对互联网金融方面的概念进行了科学的定义,剖析了我国互联网金融的现状,展望了互联网金融的远景,为我国互联网金融的发展指明了方向。
本书结合我国当前国情,详细论述了我国互联网金融的现状,内容详尽,各有千秋。其中对煜达投资城的研究最为透彻,煜隆创业投资有限公司董事长杨定平先生以服务实体中小微企业为宗旨,依靠资深技术团队,搭建产学研为一体的平台,创建了煜达投资城,该平台从单纯的平台中介服务转向家居产业链金融、股权投资、新兴产业投资四大模块,采用线上线下相结合的方式,进行科学管理,化解风险,为投资人赚取丰厚的利润,解决了融资人的燃眉之急,实现了投资、融资双赢的目的。
投资实业是煜达投资城的主要特色,也是公司业务的主要发展方向,实体产业主要有雅堂家居有限公司、盛世鸿雅家具有限公司和四川面道股份有限公司。家居产业链金融是煜达投资城的又一大创举,这种方式风险可控,操作简便。“不熟悉的不做”是规避风险的最佳选择。
总之,本书的亮点很多,值得投资人去研究,去发掘,去推广,本人才疏学浅,抛砖引玉,有不当之处望各位批评指正。
大数据分析实训心得体会
这次实训,除了让我对商业企业的基本业务有了必须了解,并且能进行基本操作外,我觉得自我在其他方面的收获也是挺大的。作为一名一向生活在单纯的大学校园的我,这次的实训无疑成为了我踏入社会前的一个平台,为我今后踏入社会奠定了基础。
首先,我觉得在学校和单位的很大一个不一样就是进入社会以后务必要有很强的职责心。在工作岗位上,我们务必要有强烈的职责感,要对自我的岗位负责,要对自我办理的业务负责。如果没有完成当天就应完成的工作,那职员务必得加班;如果不留意出现了错误,也务必负责纠正。
其次,我觉得工作后每个人都务必要坚守自我的职业道德和努力提高自我的职业素养,正所谓做一行就要懂一行的行规。在这一点上我从实训单位同事那里深有体会。比如,有的事务办理需要工作证件,虽然对方可能是自我认识的人,他们也会要求对方出示证件,而当对方有所微词时,他们也总是耐心的解释为什么务必得这么做。此刻商业企业已经纳入正规化管理,所以职员的工作态度问题尤为重要,这点我有亲身感受。
最后,我觉得到了实际工作中以后,学历并不显得最重要,主要看的是个人的业务潜力和交际潜力。任何工作,做得时间久了是谁都会做的,在实际工作中动手潜力更重要。
因此,我体会到,如果将我们在大学里所学的知识与更多的实践结合在一齐,用实践来检验真理,使一个本科生具备较强的处理基本实务的潜力与比较系统的专业知识,这才是我们实训的真正目的。
很感谢实训单位给我这个这么好的实训机会,让我学习很多、成长很多、收获很多。
大数据类读书笔记
《大数据》一书对美国大数据的应用进行了十分详细的介绍与分析,我印象最深的为两点。
第一,以海量数据的处理作为政策制定的依据。看这本书的时候,我想到了这两年很火的一个美国人——斯诺登。在其曝光的“棱镜”计划中美政府直接从包括微软、谷歌、雅虎、Facebook、AOL、Skype以及苹果在内的国际公司服务器收集信息。美国政府从这些海量数据中寻找自己需要的数据,并以此作为所谓安全政策制定的依据之一。姑且不论媒体对此计划的口诛笔伐及相应的道德风险,仅从政策制定方面来说,依据于海量数据的政策制定科学性肯定比一般计划要高得多。
2007年,雅虎 首席执行沃兹博士在《自然》上发表的《21世纪的科学》中提到,得益于计算机技术和海量数据库的发展,我们每个人在现实世界中的活动得到前所未有的记录, 这种记录也更为细致,为社会科学的定量分析提供了极为丰富的数据。打个比方,从你的QQ空间、微博、微信中一个普通朋友都能了解到你在哪儿、做了哪些事 情、现在的状态是什么,而新闻的跟帖、网站的下载记录、社交平台的互动记录等等都为社会行为的研究提供了大量的数据。我想到最近比较火爆的穿戴设备,如果 该技术得到普及过后,拥有穿戴设备的人群的生活轨迹、生理各项指标都能轻而易举地得到,相信这些大量的原始数据如能安全有效利用定能为卫生政策的制定提供 科学依据。
第二,万事万物, 凡存在,皆联网,凡联网,皆计算。2005年起,美国食品与药品管理局开始在药品上推行配备RFID做法即每个食品包装上安装一个薄如纸张或小如豆粒的无 线传感器。通过这个移动传感器,对食品进行连续跟踪,一旦相应的安全事故爆发,就能通过数据库追踪溯源,快速确定传染源与影响范围。这一技术相对于国内尚 在起步阶段的食品追溯具有极强的借鉴性。上面提到的穿戴设备其实就可以视为一个穿戴在人身上的RFID。
2010年的时 候,美国国家气象局在全国2000两客运大巴上装备了传感器,随着大巴的移动,沿途手机所有地点的温度、湿度、露水、光照度等数据,并立即传给国家气象局 数据中心。数据的采集是每10秒中一次,每天采集10万次以上的数据,这些实时的、高精度的数据意味着天气预报将不再仅仅是”预“,将逐渐走向“实”报、 “精”报。
胡适说中国人习惯于当“差不多先生”,凡是马马虎虎、不求精确。黄仁宇认为,中国不懂得用数字来管理国家。作者引用这两位先生的名 言,当然是要彰显传统中国和今天美国之间的差异。但是我们也必须认识到:这两位先生身经当时中国的混乱,激愤而出此言。在大数据浪潮迅猛而来的时候,中国 与100年前已经完全不一样了,我们已经有足够的能力与自信来面对各项挑战。2003年中国开始着手制定医疗系统的最小数据集,3年之后卫生部出台了第一 版中国医院最小数据集的标准。也是在2003年,中国创立了第一个全国性的大型社会调查项目,开始对社会的发展和变迁进行全方位、综合性、纵贯性的问卷访 谈调查,即“杨文昊在KOD里面穿的裤子”。可以看到,中国政府和企业已经投入到了大数据时代的浪潮之中了。我个人也有几点应对的想法。
一是鼓励、扶持基 于数据的创新创业。书中提到,政策扶持的传统方法,可能是以政府主导建立大数据产业园,对新兴企业提供办公场所等便利条件或者现金支持,这固然有效,但更 为有效的是调动全社会的力量。调动全社会的力量来支持可以包括扶植民间团体,快速推进新技术、新理念在全社会的传播。现在云技术大众基本上都耳熟能详了, 而这主要是各大互联网服务上都相继推出了相应的云服务以及各大媒体对这项技术的关注,促进了大众对新技术的了解与支持。
二是政府机构要建 立专门机构来统筹管理数据工作。在大数据时代不同的数据需要整合,公安、消防、民政、社保等等数据都需要进行联动,将沉睡在数据库内的数据唤醒,为政府制 定政策所用,避免各自为政、多头管理的情况发生。数据的联通也能在一定程度上减少群众的“办证”问题,相信在大数据时代,大家可能只需要一张身份卡就能满 足绝大部分的数据需要。
三是围绕个人数据安全,加强管理。任何技术都是双刃剑,耍得好可以披荆斩棘,耍得不好则会害人伤己,大数据也不列外。如何保障个人隐私也成为了大数据时代面临的一个重大挑战。
不过有意外收获,作者在文章后部主要讲了,大数据带来的消极影响,例如政府会通过大数据判断一个人将要出现的违法行为,提前对他进行拘捕,或者监视(这个已经在纽约警察局使用)但这样带来严重的后果,现在的法律是基于人已经发生的行为进行处罚,如果我们今后使用这套系统来作为法官的判决依据的话,这样就违背降低我们作为人的重要组成部分---自由选择的能力,行为责任自负。这便成了集体选择的结果,不是个人自由意志了。这样在否认个人为其行为承担责任,实际上就是在摧毁人们自由选择的权利。而且现在的预测不能达到很准确的答案。分析的数据质量不佳就会加剧问题的不良后果。
作者最后说了这么一段话“大数据不是一个充斥算法和冰冷机器的世界,人类的作用依然无法替代,大数据为我们提供的不是最终答案们只是一个参考答案,暂时的,只是问了等待更害的解决办法,在不久的未来。”
另外一个随之而来的问题就是数据授权使用,泄露问题,数据会有二次利用发现潜在价值,但这又产生更严重的问题,二次利用如何授权管理,是否涉及违法。解决办法是通过会计行业,可以有一个充当审计工作的外部算法师,作为第三方公证机构在出现问题时,可以进行审核算法和数据的使用情况,在公司内部也可以设立内部算法师,很类似公司自己的律师一样,一方面参加产品研发,另一方面在公司使用数据出现问题时也可以及时阻止,提醒。
大数据确实在某种程度上可以降低风险,保护国家安全,但信用卡,保险业就会通过大数据分析拒绝一部分人(因为他们还不起账),但我们想想,人类进步,就是通过反抗,妥协,权衡,再平衡。有了一切大数据的预测,就少了很多的可能性,在某种程度会降低我们的社会进步。
说实话之前听到大数据的概念觉得很有前景,很神奇,很向往,这本书给我带来的更多的是对大数据会给我们带来不亚于克隆人的糟糕影响。让我有了对技术给人类社会带来的负面影响有了一个全面的思考认识。读到后半部分的时候,我很沮丧啊,觉得这么好的技术,竟然负面影响超过了正面的,我很失落,也不再看好大数据。不过后来作者的一席话让我重振信心,他举例,曾经印刷术出现之前大部分的书全部在修道院,教皇手里,有了印刷术之后人们有了书,有了更开阔的思路,更多的想法,有了言论等等,这个的影响力要比大数据大很多,人类还是一步一步建立起来相应的制度,法律,直到今天我们已经有了对应的很完善稳定的法律体系。
我们还是应该对科技充满信心,科技依然是那个推动社会进步的原动力,只是我们需要及时完善相对应的管理措施。
最后说说对作者写的书的评价吧,其实我觉得写的一般,不过很符合外国人的写书风格,简单明了,很容易看懂,理解都不需动脑子,举例很少(可能因为本身合适的例子就很少吧)来来回回就那几个例子,有点像我们高考作文,来来回回那几个例子,什么场景都能用,哈哈。总的来说还是不错的,评级6分吧。
最后说一句,美国确实在大数据上走在了前面,不是单纯技术上,技术科技学的很快,但是实际运用起来出现的问题,不是其他人能立即学会处理应对的,这又燃起了让我去美帝的欲望。
读徐子沛《大数据》有感
张登泰
大数据,是近年来相当火爆的一个词汇。马云说,未来的世界是数据的世界,大数据之争,将引发"第三次世界大战".刚好办公室读书角有一本《大数据》,于是拿来闲时翻阅,浅读之后觉得颇有启发,感想略记如下。
徐子沛的《大数据》,讲述了美国的数据管理发展历程,呈现了数据与政治、数据与经济的紧密关系。全书的主体是美国,但是也处处在反观中国的当下。
数据是对信息数字化的记录,其本身并无意义,只有当数据积累到一定程度,并进行统计、分析、提炼后,才能赋予价值。
书中举了很多例子,看完很受启发。比如沃尔玛,沃尔玛通过销售数据分析发现,每到星期六、星期天,有两样东西是成比例的增长,啤酒和尿布。这是为什么呢,后来研究发现,星期六、星期天常常是女人在家做事,男人到购物店买东西,买东西就买尿布,买尿布的时候男人就想,挺辛苦的买点啤酒犒劳自已,所以啤酒和尿布就一块增加了。是不是想不到会是这样。
大数据对于企业的管理和运营是影响巨大的。联系到自己的工作实际,备件管理,很重要的方面就是备件成本预控,这涉及到对备件消耗和储备的预判与控制。船舶在进入某项目施工之前或之初,就能较准确预判出该船舶施工期间的备件消耗,从而给出准确的备件需求计划。这说起来容易,做起来很难。靠经验很多时候确实也可以大致预判,但是变数也很大。若能依托大数据,通过积累公司的所有船舶在所有工程的施工数据、备件消耗数据,并进入统计分析系统导出备件消耗特性,那对于备件成本预控将是革命性的进步。
看过杨德诺公司的一份演示稿,稿件用图表形象的罗列了各种土质工况下的单方成本组成,包括备件消耗成本和船舶修理成本。显然,杨德诺公司拥有大数据,并在利用大数据进行企业管理和运营,强大的数据支持让他们在项目投标和项目实施中,不断的取得胜利。
大数据的建立需要坚持不懈的进行数据的准确采集,需要积累到一定的量才有统计分析价值,才能最终从量变走向质变。对于大数据的厚积薄发,书中引用了《笑傲江湖》岳不群的一段话——岳不群叹了口气,缓缓地道:"三十多年前,咱们气宗是少数,剑宗中的师伯、师叔占了大多数。再者,剑宗功夫易于速成,见效极快。大家都练十年,定是剑宗占上风;各练二十年,那便是各擅胜场,难分上下;要到二十年之后,练气宗功夫的才渐渐地越来越强;到得三十年时,练剑宗功夫的便再也不能望气宗之项背了。然而要到二十余年之后,才真正分出高下,这二十余年中双方争斗之烈,可想而知。"
公司近年来已经开始布局大数据,通过建立各种信息管理平台,不断加大对信息数据的采集力度,这是对大数据的认同。那么如何做到坚持不懈的进行数据的准确采集,以及进行数据的有机整合,让数据形成运营支持和决策支持,实现数据价值变现呢。我对公司未来充满期待。
大数据时代已经到来,得数据者得天下!
大数据读后感
从徐子沛的《大数据》中得到的感悟
数据,对于我们现代社社会来说,已经是再熟悉不过了。大量化(Volu)、多样化(Variety)、快速化(Velocity)和大价值(Value)。这四个V就是大数据的基本特征。每天我们都不得不和数据打交道,比如我们平常所说得“眼观六路,耳听八方,”就是生活中一个很好的的收集数据的例子。还有,在我们平时的学习中,我们对于一些学习上的数据的整理等等。可以说,数据已经成为了我们的影子一样,无时无刻的在我们的身边活动。
拿到《大数据》这本书时,吸引我的不是书评的内容,而是书的封面上的一句话“除了上帝,任何人都可以用数据说话。”也就是说,上帝可以不用数据来说话,但是,作为一个平常人,我们做事,言论等都必须用数据来说话。用数据论来证我们的观点正确性。
那么数据真的就是那么重要吗?其实不然,数据果真有那么的重要。作者在书中大量应用世界头号强国美国的例子来说明美国是如何利用数据以及数据在美国人的利用下,是如何造福美国人的。使得美国人走上了民主、发展的道路。书中还引用了大量的利用数据的案例,以及利用数据会有什么样的后果。当然,作者在书中也很明确的表达了自己观点,也就是数据要被人利用,利用的好了,造福人类,否则,祸害无穷。
毫无疑问,我们正处在一个真正意义的大数据时代。但是,大数据浪潮的来龙去脉如何?数据技术变革何以能推动政府信息的公开、透明和社会公正?又何以给我们带来无限的商机,既便利又危及我们每个人的生活?《大数据》给了我们一个很好的答案。在拿到徐子沛《大数据》时,与其说这是个新概念,还不如说就是一个现实。信息技术的迅速发展和普遍应用,存储能力的膨胀,网络传输的便捷,必然产生巨大的数据量。即使是一个公司,经过多年的积累,产生的数据也是惊人的。每天繁多的数据,这就是要求企业要很好地存储数据,利用数据通过数据,使得数据说话,提升企业的业绩和知名度。
对于一个企业来说,比较实际的倒是关注一下企业微观大数据,如何充分利用现有的、能够得到的和自己创造的数据,采用《大数据》里提及的新技术、新方法、新理念,筛选、组织、关联、分析,精细化管理和挖掘数据,探索规律性的东西,指导企业活动。尽可能多的获取数据,首先是要有心,对于公司员工来说,随时随地注意收集客户数据、需求数据、产品数据、市场数据、资源数据等,经过整理,把它变成公司的数据资产;然后是要有据,信息与数据最大的不同,就是数据是能够度量或者确定的信息,不能“毛估估”,收集数据要精细化,要准确;其次要有序,数据需要存储,更加需要整理,单个数据没有很大意义,静止的数据也没有很大意义,有价值的数据是流动的、与其他数据交互作用的。一个大杂烩的数据库,在需要时让人找不到北,没有任何意义。再次,需要技术支持,大量的数据如何检索,如何关联,单靠人脑是不行的,需要建立基于特定理论的数据处理系统来分析管理。对于一个企业,最理想的是建立一个类似人类神经系统的数据管理系统,采用各种信息终端采集内部和外部信息,通过分析、归纳、筛选,形成管理数据,某些数据可以成为系统的“本能”,一旦触发能够自动做出反应;某些数据可以成为组合信息提交大脑综合分析,作出决策和反应。数据应该为人服务,这是一条基本原则。在大数据时代始终发挥人的主观能动性,采用先进的理念和技术驾驭数据,让人们生活更方便,工作效率更高,劳动强度降低,为社会创造更多的物质财富和精神财富。
《大数据》是一本视野独特的书。它以数据为轴线,描绘了美国走过的改革创新的过程,行文如流水,引人入胜。书中,我读到的不是大数据处理技术,更多的是与大数据相关的美国政治、经济、社会和文化的演进,从民主和国家战略的层面细解大数据的影响力。美国是全书的主体,但又处处反观中国当下的现实。内容非常值得我们身处改革开放前沿的政府工作者深思。它让我们更加深刻地理解了汪洋书记提出的“坚持用数据说话、用数据改进管理、用数据推动创新”的深刻内涵和殷切期望。我们只有重视数据,加强对数据的收集、分析和使用,才能更好地应对正在到来的数据革命的挑战。那么,作为与数据打交道、用数据说话的前线统计工作者,如何应对大数据时代的种种挑战
对比《大数据》,结合平时工作和学习的实际情况,我认为最少应该认真思考和解决好三个问题:
一、提供什么样的数据
在中国,统计部门提供的数据,是各级政府部门和广大人民群众了解国家社会经济发展和人民生活状况主要渠道。只有真实可靠统计数据,才能使政府决策有的放矢,人民了解国家经济与人民生活的真实状况。如果统计数据虚假不实,就会误导政府和人民,让政府失信于人民。因此,我们一定把握好数据的生命线—质量关,确保给国家和人民提供准确、真实、可靠、无误的数据。
2、如何高效有序地收集数据
面对信息大爆炸时代海量数据,必须充分利用高科技手段,高效有序地收集整理各种数据,以满足政府和人民群众越来越广泛的信息需求。为此,我们需要建立完善数据收集网络,包括部门内部的纵向数据收集网络和部门之间的横向数据收集网络,通过这种纵横结合的网络数据收集系统,针对特定主题,持续不断地收集相关数据,为大数据发展提供基础。需要运用互联网、电子计算机等现代技术手段,加快数据收集、加工数据的速度,确保政府和人民及时得到所需数据。
三、如何加强数据分析利用能力
收集数据的目的是为分析利用数据。通过数据分析挖掘数据背后隐含的经济规律及有利于提高效率、改进工作的因素,提高政府管理、决策和人民生活水平,实现“用数据改进管理”。因此,作为统计人,不仅要做好数据收集的及时有效和真实正确,更重要的是要善于分析利用数据,写好专业分析报告,发现问题、支撑决策、评估绩效的目的。
此外我们还可以看到不少政府机构或者其他一些组织也在开始大数据解决他们遇到的一些问题。在本书的最后一章,作者告诉了我们大数据可能带来的坏处。如:通过大数据可能我们的个人各种信息、隐私会很容易地被大数据的拥有者找到,这些信息,可能被政府用来监管我们等;通过大数据可以预测可能发生的事,或者预测我们人个人本书即将做的行为,书中有个例子:警察通过大数据分析得出一个人即将可能犯罪,并把它逮捕了,但事实上这个人现在并没有犯罪。也许这就限制、约束了我们个人的自由。
看完这本书,颠覆了自己之前的一些想法:以前我们认为错误的数据是没有用,我们需要保证统计的数据的准确性,但是在大数据中,错误的数据也是有用的,它和其他所有相对正确的数据一起构成了整体,也就算不了什么了。我们同样可以从这些数据中得出比较正确的预测和分析。Google利用人们搜索的关键字来预测和判断某个地区是否发生流感,Google通过分析这个地区的人们搜索和流感有关的词的数量等来分析得出。Google从互联网抓取数以亿记的各种语言、各种翻译水平的翻译结果,使用其翻译出来的准确率比那些微软使用正确的词库翻译出来的句子准备率更高。我自己的感想是,其实大数据无处不在,只要我们细心,我们就可以挖掘出身边的那些大数据,并做一些有意义的是,就像书中说的那样,我们不需要强求每条数据都那么真实准确,但是从大量的数据中我们就可以得出相对准备的结果。未来成功的公司必定是是那些拥有大量数据、并使用那些数据为大众提供服务的公司。
公布官员财产美国是怎么做的,美国能让少部人腐败起来吗,美国式上访是怎么回事,凭什么美国矿难那么少,全民医改美国做得到吗,美国总统大选有什么利器才能赢,下一轮全球洗牌我们世界工厂会被淘汰吗……除了上帝,任何人都必须用数据来说话。也就是是说,美国更好的利用了数据,那么,我们何尝不去利用大数据时代的数据呢
大数据看作文
1977年,中断了十余年的高考制度恢复。当年采取分省考试的形式,北京卷的作文题目是《我在这战斗的一年里》。
新京报记者不完全统计了高考恢复40年以来,超过200道全国或地方命制的高考作文题,发现历经变革至今,“材料题”是常客。2000年开始,传统文化和时政热点逐渐走上试卷。而在出题方式上,也出现了诸如半命题作文、“微写作”的创新。
专家指出,这意味着教育部门对于语文学科的定位发生了转变,正在从纯粹的文学科目逐渐转变为现实性、基础性科目,出题人的眼光在移向当代,从更高的格局引领学生心智更加健全发展。
连续十年出现材料题是主流
据新京报记者不完全统计,高考40年来,全国卷一共44套试题中,一共有24套试题使用了材料作文的形式,占比约55%;高考40年来,各地自主命题192套,其中有75套为材料作文,占比近40%。
记者发现,材料作文最早兴起于上世纪80年代,1980年,要求考生们读《画蛋》,写一篇读后感。随后,材料作文频繁出现在高考试卷上。从1999年至2009年,全国卷均为材料作文,掀起材料作文新高潮。
案例:1995年全国卷:给出阅读材料寓言诗《鸟的评说》,要求任选寓言诗中的两种鸟,展开想象,以《××与××的对话》为题,写一个200字左右的对话片断。
2013年福建高考卷:要求根据顾城的《忧天》作文。
分析:学而思网校高考研究中心向欧分析,材料作文是“主流”,体现出对学生综合能力的关注。“汉语是母语,读得多才有可能写得好”,而这两者存在相互制约的关系,这一考试形式能够同步考查学生的阅读理解和“输出”的表达能力。
北京市教委校园促进项目中学组特聘专家、新东方集团培训师及语文项目创建主管杨洋分析,“命题作文范围比较大,写作的难度系数较大,评分的要求也会更高”。
他解释说,而材料作文能够让学生在一个框架内进行创作,更有利于进行比较,因此是更为“主流的选择”,“毕竟高考要在尊重命题的合理性基础上,照顾到学生的发挥和创新”。
1218
北京卷连续三年考传统文化
在材料命题中,除了励志、寓言故事外,还有另外一个趋势,即国学和传统文化,以古人智慧而观今的作文题目越来越多。
1982年,考生被要求以“先天下之忧而忧后天下之乐而乐”为题作文。2003年的全国卷选取了《韩非子》中的一则寓言、2004年湖北卷选取了唐朝刘禹锡的《昏镜词》等等。
除此之外,近年来,传统文化更多见诸于卷面。据不完全统计,近40年来至少出现过14次,其形式包括古诗文、谚语、地方民俗等,进入新世纪以来,传统文化内容出现的更加“频繁”,18年来出现过12次。仅北京卷也在2014年至2016年,以老规矩、民族英雄、老腔等为题目要求行文。
案例:2005年湖北卷:使用了王国维《人间词话》中的一段文字。
2009年上海卷:以“板桥体”做材料。
2016年北京卷:“老腔”。
分析:“传统文化是越来越热的点”,杨洋说,近年来高考作文很关注考察这方面的内容,关注的是考生对热点事件进行恰当合理的思考这一核心能力。例如2014年北京作文题目“老规矩”,直接考察的就是如何认识传统文化的重要性,“要重礼仪、积累经验、有更好的仪态等等”,而到了2016年的“老腔”,是考察如何让传统文化保持生命力。
他认为,近年来的考察更加倾向于围绕传统文化领域的社会热点命题,其实是对教师教学的考验。当尝试做好语文教学时,要让学生能够把眼光移向当代。如今体现出语文学科的纯文学性在下降,这里的“下降”其实是个褒义词,因为好的人文教育是关注学生,关注现实的教育。
12年
2006年后时事热点年年考
近年来,高考作文不乏接地气儿的热点话题。其实,1986年的高考作文题《树木、森林、气候》涉及了环保领域,就曾让人眼前一亮。
2006年全国卷作文题为“中国的人读书的人越来越少”,随后关注社会时事热点成为一大趋势,至今连续12年出现在每年的作文题目中。
记者发现,相比全国卷,各地自主命题时,更倾向于以社会热点为切入点。2008年,汶川地震出现在地方卷中,也一度激发了高考作文与社会热点相结合的潮流。随后,社会热词“范儿”、“京骂”、“名人代言”、“高考30年”等,均成为高考作文题。
其中,2011年作文卷中的社会热点较多,涉及歌手第一句话由“大家好,我来了”变为“谢谢大家,你们来了”;乒乓球赛中国夺冠;中国崛起三个话题。而在2015年,全国卷1和江西卷还出现了“女儿举报父亲”的“撞题”。
案例:2008年全国卷I:使用社会热点材料“汶川地震救灾”
2009年江西卷:使用圆明园非法流失的兔首、鼠首铜像流拍作为材料
分析:杨洋和向欧都认为,这体现出了命题对于语文学科定位的转变。“现在语文整体的地位已经凸现出来了”,向欧说,如今已经形成了“语文是所有学科的基础”的共识,任何科目的理解都是建立在语文能力过关的基础之上的,而不仅仅是培养文学素养。
另外,使用时政社会热点做材料的题目,通常要求写作议论文,这种文体相对于文学性的考察,更关注逻辑性。考虑到如今文理分科的大背景,向欧认为,这是对于理科生的平衡,“议论文比较重视逻辑关系。”
8年
文体题目持续“标新立异”
纵观40年来的高考作文题,不乏创新之举。比如,看图写作,其实早在1983年当时的作文题便是“以图说话”,要求根据漫画《这下面没有水,再换个地方挖》写作。
据不完全统计,40年以来,全国卷至少有4年出现了漫画作文,其中,1996年的全国卷中,给出了《给六指做整形手术》和《截错了》两幅漫画,要求学生以“我更喜欢漫画《__》”为题,写一篇议论文,可谓是半命题作文的“鼻祖”。记者梳理发现,1996年至今,至少有8个年份的作文题目使用了半命题、漫画或者新事物、新提法作为材料。
此外,2005年的重庆高考作文题中,出现了大作文和小作文两道题。多选,由此成为了高考作文命题的一种新方式。2014年起,北京高考作文也引入了这一形式,并扩充为微作文“三选一”,大作文“二选一”,以增加学生的自主选择和发挥余地。
案例:2009年湖北卷:“站在__门口”
2013年天津卷:“__而知之”
2006年福建卷:1、诸葛亮借箭未满十万支;2、戈多来了;3、留下一点空白,三选一
分析:不少当年看起来“怪异”的题目,还在多年后以“新瓶装旧酒”的形式出现。向欧举例说,2014年天津卷中“智慧芯片”的题目,与1999年“假如记忆可以移植”的材料作文就有异曲同工之处,“当年的话题放到现在看都不太过时”,她认为,其实这既是一种“万用话题”的传承,又是选拔人才方面,更加看重对于社会中的新鲜事物的感想。
高考作文题演变时间轴
1977年中断了十余年的高考制度恢复。当年采取分省考试的形式,北京卷的作文题目是《我在这战斗的一年里》。
1978年-1984年各省份开始统一采用全国卷考试,将《速度问题是一个政治问题》缩写成一篇五百至六百字的短文、写作达·芬奇故事《画蛋》读后感、使用古诗词和漫画等都曾成为高考作文的命题材料。
1985年-2014年上海市1985年率先试点高考分省自主命题后,全国前后共有16个省份尝试全部或部分科目自主命题。
随之带来的不仅是高考作文材料的丰富,写作文体也出现了议论文、书信、记叙文、说明文、发言稿、对话等至少6种。
2015年-2017年自主命题省份减少,全国缩减到9套题。到了明年山东省使用全国卷之后,将只剩下8套试卷。
毕业仍看不懂的作文题
2005年湖南卷:“跑”
2006年江西卷:燕子减肥
2007年安徽卷:提篮春光看妈妈
2012年安徽卷:梯子不用时请横着放
2013年江苏卷:探险者与蝴蝶
2015年山东卷:“丝瓜藤和肉豆须”
2015年安徽卷:“蝴蝶是否有颜色”
大数据时代
一年四季,桃花只盛开一次;一年有三百六十五天,而春天只有短短的三个月……数字可以用来对比,可以用来表达世间所有美好的事物。它触摸不到却能让我们领略人间的温暖与冷漠。当我们走进数据时代,你会发现世间冷暖,尽收眼底。
数据虽是生冷的数字,但它能折射出人间的冷暖。漫步于天地,没有数据的世界一片茫然,它可以带给我们准确的度量,可以让我们知晓天下事。可以让我们的生活更加丰富多彩,充满生机。数据折射出人间冷暖。
数据提醒着人们过错的同时。也反映出时间的冷酷无情。到了上世纪九十年代。长江里仅剩二百余头白鳍豚,到了1997年,这种身长六英尺左右的动物只剩下了十七头。到了2004年,这种白鳍豚已经几乎消失在人们的视线。这一系列逐渐变少的数字无一不敲打着人们的警钟,提醒着人们保护环境的重要性,这些数据反映的不只是人们意识淡薄,更是对人间冷酷无情的极大反射!生命如此脆弱却被人类毫不留情地亲手扼杀。这些直击人心的数字是冷漠无情后付出的惨痛的代价,它时时刻刻都让我们为自己的所做所为感到羞耻。
数字也会如阳光般轻柔,带给我们温暖。当你考试得了满分,拿着卷子看至那鲜红的数字,你会感到无以言表的快乐与激动:当卖水果的老大爷今天顾客满员,多挣了一百元钱,看着那鲜红的钞票,就会感到幸福满满,生活幸福指数提高,经济发展的进步,每项数据都那么鼓舞人心,温暖心灵。数据有时就像乌云上的阳光,他会带你穿过层层阻碍,走向未知的世界。即使是很微小的事情,也会被数据折射幸福的光芒。
数据丰富着人们的生活,改变着我们的思维方式,仿佛离开了数据就会将自己陷入无边的黑暗。古人也常常用数据描述着事物的发展,曹刿论战中一鼓作气,再而衰,三而竭;登高中万里悲秋常作客,百年多病独登台。诗人们多运用数字夸张的手法表现内心情感,数字使他们的情感表达的更加淋漓尽致。作为新一届高三生,我们每天也会看到许多数字,距离高考仅剩二百余天,这将激励着我们去女里奋斗,为了明天的辉煌而放手一搏!
数字如微风吹过,激起阵阵涟漪;数字如阳光拂过,留下丝丝温暖,我们在这条数据时代的道路上走过,留下了我们的足迹,感受世间冷暖,感受着数据带给我们的幸福生活。
用大数据造福人类作文
大数据是现在大家最常用的东西,可是大数据的未来是十分危险的。
据报道,大数据以后会统计人流量和什么人在哪里,甚至可以精确到在干什么,或在说什么。这样我们每一个人的隐私全都会被相关的部门掌控着。
这样的话,大数据将是一个很危险的东西,只要国家大数据系统被别人反逆组织黑客入侵,所有的个人隐私将被别人曝光,还可能会引起国家与国家之间的矛盾,会把世界的和平与宁静统统打破,世界就只留下了战火和战争,甚至可能会引发第三次世界大战,所有无辜的人都会在战火中一一死亡。
大数据本身是一个十分有利于世界文明发展、有利于各个国家经济科学技术发展的好东西,可是被坏人利用就是危险的。
如果大数据放任被坏人掌握,讲给国家带来危险。虽然我说的话可能连一毛钱也不值,但我还是要给国家提几个建议:
1、把大数据的安全防盗的功能加强,以至让美国、俄罗斯、日本等科技发达国家无法入侵;
2、用完的大数据完全销毁,让恐怖分子找不到一点可以利用的线索,让人们不再用提心吊胆过日子,让恐怖分子找不到下手的机会,让人们过上安宁的日子。
大数据利用好了,可以造福人类,可以把医院等一些需要快速统计的工作提高工作效率,简化繁琐的工作,让大家轻松愉快的工作。
大数据是良善的,决不能让坏人们利用。