地质大数据心得体会范文(精选8篇)

  • 上传日期:2023-11-19 17:11:51 |
  • ZTFB |
  • 11页

通过总结,我们可以找到问题的解决方法和改善策略,提高工作和学习效率。那么,如何撰写一篇较为完美的心得体会呢?首先,我们应该明确心得体会的目的和主题,以便我们可以有针对性地总结和概括。其次,我们需要回顾过去的经验,对自己的行动和思考进行评估和分析。然后,我们可以结合具体案例和实际情境,从多个角度来解读和理解所得到的心得。最后,我们应该深入思考和反思,提出具体的改进和进步方向,以期在以后的学习、工作和生活中能够更好地应用和发展。接下来是一些关于心得体会的例子,大家可以参考借鉴,进行写作练习。

地质大数据心得体会篇一

大数据时代的到来,给人们的学习和生活带来了巨大的变革。近期,我读完了一本关于大数据的书籍《大数据》,在书中我了解到了大数据的定义、特点、应用和对社会产生的影响。通过这本书的学习,我深刻认识到了大数据对于现代社会的重要性,并从中汲取了一些启示和体会。

首先,我的第一个体会是对大数据的新认识。在书中,大数据被定义为指数据量巨大、处理难度大,无法通过传统的数据处理工具和方法进行处理和分析的数据。大数据的特点主要包括“四V”,即数据量大(Volume)、处理速度快(Velocity)、数据种类繁多(Variety)和价值密度低(Value)。通过学习这些概念,我意识到了大数据处理的复杂性和重要性。在现代社会中,随着互联网技术的快速发展,海量的数据正在不断产生,而利用这些数据寻找规律、洞察趋势对于企业和科学研究等领域都具有重要意义。

其次,我通过阅读《大数据》这本书,对大数据应用的广泛性有了更深入的了解。大数据不仅可以被用于商业领域的市场调研和用户行为分析,还可以被运用于医疗、金融、政府等各个领域。例如,在医疗领域,大数据分析可以帮助医生更准确地诊断疾病,提高治疗效果;在金融领域,大数据可以用于风险评估和投资策略制定。这些例子让我认识到大数据不仅仅是一个概念,它已经深入到我们的生活和工作中,并对各个领域产生了重要的影响。

第三,大数据在社会中的影响力也让我深受触动。通过大数据的分析,科学家们可以预测自然灾害的发生和规模,帮助人们采取相应的措施减少灾害造成的损失;政府们可以利用大数据分析来改进公共服务和决策,提高社会治理效能。大数据还可以通过对人群行为的分析,为企业提供精准的广告定位和销售策略,帮助企业提高竞争力。大数据的应用正引领着社会的进步和发展,让我感到对于大数据的学习和掌握变得格外重要。

第四,在书中我还学到了大数据的应对方法和技术。大数据处理的复杂性要求我们运用先进的技术和工具。例如,云计算能够提供强大的计算和存储能力,帮助我们处理海量的数据;机器学习和人工智能则能够帮助我们从复杂的数据中提取有价值的信息。了解到这些技术后,我决定在大数据领域继续深入学习,提高自己的技术水平。

最后,通过读完《大数据》,我深刻体会到大数据的革命性和不可逆转性。大数据已经成为了当今社会的一个重要标志,影响着我们生活的各个方面。不仅是企业和科研机构,普通人也需要掌握一定的大数据分析和处理能力,才能适应这个快速变化的时代。因此,在日常生活中,我们要提高自己对于大数据的认识和运用,并不断学习相关的知识和技能。

总之,通过阅读《大数据》,我对大数据有了全新的认识,了解到了其广泛的应用领域和对社会的重要影响。同时,我也学到了一些大数据的应对方法和技术。大数据已经成为一个时代的产物,对于每个人来说,掌握大数据的知识和技能变得愈发重要。我希望通过自己的努力,能够在大数据时代中不断学习和成长,为社会的发展贡献自己的力量。

地质大数据心得体会篇二

近年来,金融大数据的兴起引发了全球金融业的巨大变革。作为一名金融界的从业者,我深切感受到了金融大数据在业务决策、风险管理等方面的重要性。在实践中,我逐渐总结出了一些关于金融大数据的心得体会。

首先,金融大数据的应用为业务决策提供了全新的视角。在过去,金融业的决策常常基于经验和直觉,而缺乏数据支持的决策往往容易产生风险。然而,金融大数据的引入彻底改变了这种状况。通过对大量的金融数据进行分析,我们可以发现市场的规律和变化趋势,从而制定出更加科学合理的决策方案。例如,通过分析历史市场数据,我们可以找到股票价格之间的相关性,并进一步构建股票组合,从而实现风险的分散和收益的最大化。

其次,金融大数据的应用极大地提升了风险管理的能力。在金融领域,风险控制一直是至关重要的。过去,风险管理主要依赖于人工的经验和直觉,容易受到主观因素的影响。但现在,金融大数据能够帮助我们更加全面、准确地评估风险。通过对大数据的深入分析,我们能够获取更加全面、准确、及时的市场信息,从而为风险管理提供了更加有力的支持。例如,我们可以通过对市场数据的分析,预测可能发生的波动情况,及时提前采取相应的对策,从而降低风险的发生概率。

然而,金融大数据应用也存在一些挑战和风险。首先,金融大数据的处理和分析需要庞大的计算能力和专业的技术支持,这对金融机构提出了更高的要求。其次,金融大数据的应用还涉及到隐私和安全的问题。金融数据往往包含着大量的客户账户信息和交易数据,如果处理不当,可能会导致客户隐私泄露和财务安全的风险。因此,金融机构在使用金融大数据时必须加强数据安全措施,以确保数据的保密性和完整性。

最后,在应用金融大数据的过程中,我们需要保持数据的客观性和准确性。金融数据的处理和分析过程中,可能存在人为的操作和干扰,这可能会导致分析结果出现偏差。因此,金融机构在使用金融大数据时必须加强数据的把控和审查,确保数据的客观性和准确性。同时,也需要建立完善的数据管理系统,确保数据的存储和传输的安全和可靠。

总之,金融大数据的应用为金融业带来了巨大的变革和机遇。通过合理、科学地利用金融大数据,我们可以更好地做出业务决策和管理风险,提升金融机构的竞争力和盈利能力。然而,在应用金融大数据的过程中,我们也需要面对一系列挑战和风险,这需要我们加强技术支持、提升数据安全能力,并严格把控数据的客观性和准确性。只有这样,我们才能更好地利用金融大数据,推动金融业的发展和创新。

地质大数据心得体会篇三

随着云计算和物联网的日渐普及,大数据逐渐成为各行各业的核心资源。然而,海量的数据需要采取一些有效措施来处理和分析,以便提高数据质量和精度。由此,数据预处理成为数据挖掘中必不可少的环节。在这篇文章中,我将分享一些在大数据预处理方面的心得体会,希望能够帮助读者更好地应对这一挑战。

作为数据挖掘的第一步,预处理的作用不能被忽视。一方面,在真实世界中采集的数据往往不够完整和准确,需要通过数据预处理来清理和过滤;另一方面,数据预处理还可以通过特征选取、数据变换和数据采样等方式,将原始数据转化为更符合建模需求的格式,从而提高建模的精度和效率。

数据预处理的方法有很多,要根据不同的数据情况和建模目的来选择适当的方法。在我实际工作中,用到比较多的包括数据清理、数据变换和离散化等方法。其中,数据清理主要包括异常值处理、缺失值填充和重复值删除等;数据变换主要包括归一化、标准化和主成分分析等;而离散化则可以将连续值离散化为有限个数的区间值,方便后续分类和聚类等操作。

第四段:实践中的应用。

虽然看起来理论很简单,但在实践中往往遇到各种各样的问题。比如,有时候需要自己编写一些脚本来自动化数据预处理的过程。而这需要我们对数据的文件格式、数据类型和编程技巧都非常熟悉。此外,在实际数据处理中,还需要经常性地检查和验证处理结果,确保数据质量达到预期。

第五段:总结。

综上所述,数据预处理是数据挖掘中非常重要的一步,它可以提高数据质量、加快建模速度和提升建模效果。在实际应用中,我们需要结合具体业务情况和数据特征来选择适当的预处理方法,同时也需要不断总结经验,提高处理效率和精度。总之,数据预处理是数据挖掘中的一道不可或缺的工序,只有通过正确的方式和方法,才能获得可靠和准确的数据信息。

地质大数据心得体会篇四

随着大数据时代的到来,数据成为企业和个人获取信息和分析趋势的主要手段。然而,数据的数量和质量对数据分析的影响不能忽视。因此,在数据分析之前,数据预处理是必须的。数据预处理的目的是为了清理,转换,集成和规范数据,以便数据分析师可以准确地分析和解释数据并做出有效的决策。

二、数据清理。

数据清理是数据预处理的第一个步骤,它主要是为了去除数据中的异常,重复,缺失或错误的数据。一方面,这可以帮助分析师得到更干净和准确的数据,另一方面,也可以提高数据分析的效率和可靠性。在我的工作中,我通常使用数据可视化工具和数据分析软件帮助我清理数据。这些工具非常强大,可以自动检测错误和异常数据,同时还提供了人工干预的选项。

三、数据转换。

数据转换是数据预处理的第二个步骤,其主要目的是将不规则或不兼容的数据转换为标准的格式。例如,数据集中的日期格式可能不同,需要将它们转换为统一的日期格式。这里,我使用了Python的pandas库来处理更复杂的数据集。此外,我还经常使用Excel公式和宏来转换数据,这些工具非常灵活,可以快速有效地完成工作。

四、数据集成和规范化。

数据集成是将多个不同来源的数据集合并成一个整体,以便进行更全面的数据分析。但要注意,数据的集成需要保证数据的一致性和完整性。因此,数据集成时需要规范化数据,消除数据之间的差异。在工作中,我通常使用SQL来集成和规范化数据,这使得数据处理更加高效和精确。

五、总结。

数据预处理是数据分析过程中不可或缺的一步。只有经过数据预处理的数据才能够为我们提供准确和可靠的分析结果。数据预处理需要细心和耐心,同时,数据分析师也需要具备丰富的经验和技能。在我的实践中,我发现,学习数据预处理的过程是很有趣和有价值的,我相信随着数据分析的不断发展和应用,数据预处理的作用将越来越受到重视。

地质大数据心得体会篇五

第一段:引言(120字)。

大数据已经成为当今社会的热点话题之一,其应用正在深入我们生活的各个领域。作为一名大数据专业的学生,我非常幸运能够参加大数据上课,并有机会深入了解和学习有关大数据的知识和技能。在这篇文章中,我将分享我在上课过程中得到的心得体会。

第二段:认识大数据(240字)。

在上课之初,我对大数据的概念只是模糊的了解,大数据上课的第一堂课为我揭开了神秘的面纱。我们学习了大数据的定义、特点以及在各个行业中的应用。通过实例的引导,我更加清晰地理解了大数据是如何通过收集、处理和分析海量数据来产生洞察力和商业价值的。

第三段:深入学习与实践(360字)。

在接下来的大数据上课中,我们学习了大数据的处理技术和工具。我们了解了Hadoop、Spark和NoSQL等重要的大数据处理平台和数据库,并学会了使用这些工具来处理和分析真实的大数据集。通过实践和项目,我深入理解了数据的预处理、清洗、可视化和建模技术,以及如何对大数据进行机器学习和深度学习。

第四段:挑战与收获(360字)。

大数据上课并不是一帆风顺的,其中也存在着一些挑战。我们需要面对庞大的数据集、复杂的分析算法和高要求的计算能力。但正是这些挑战让我更加坚定了对大数据的热爱和学习的动力。通过努力和团队合作,我成功地完成了多个大数据项目,并从中收获了巨大的成就感和学习上的进步。

第五段:展望未来(120字)。

大数据技术的应用正在深入各个领域,对人才的需求也逐渐增长。在大数据上课的学习中,我不仅仅掌握了专业知识和技能,更培养了数据思维和解决问题的能力。因此,我对未来充满信心,期待将来能够利用所学的知识和技术,参与到大数据相关的工作中,为推动社会的发展和进步做出贡献。

总结(120字)。

通过大数据上课的学习,我对大数据有着更全面和深入的了解。这门课不仅帮助我掌握了大数据的概念、技术和工具,更重要的是让我培养了数据思维和解决问题的能力。我相信这些宝贵的学习和经验将成为我未来发展的强大动力。

地质大数据心得体会篇六

随着信息技术的高速发展,大数据已经成为了当今社会中一项重要的资源和工具。对于企业来说,了解大数据的重要性并将其运用于决策中已经是一项必要的技能。在过去的几年中,我个人也通过学习和实际应用,逐渐认识到了大数据的威力。以下是我对于认识大数据的心得体会。

首先,我认识到大数据具有巨大的潜力。在过去,企业的决策大多基于经验和直觉。然而,这种决策方式存在着很大的风险和不确定性。而通过分析大数据,我们可以获得更准确、更全面的信息,有助于进行更明智的决策。例如,某家电子商务公司通过分析用户的购物行为和偏好,可以更好地了解用户的需求和趋势,从而调整产品和服务,提升用户满意度和销售额。另外,大数据还可以帮助企业发现隐藏的商机和潜在的问题,进一步提升企业的竞争力。

其次,我认识到大数据需要科学的分析方法和工具。大数据的主要特征就是数量庞大和多样性。要从这些数据中挖掘出有价值的信息,并不是一件简单的事情。需要借助科学的分析方法和工具来进行处理和分析。例如,数据挖掘和机器学习等技术可以帮助我们自动发现数据中的模式和规律,从而指导我们的决策。此外,数据可视化也是很重要的一环,通过图表和可视化的方式展示数据的变化和趋势,可以帮助我们更好地理解数据背后的含义和规律。

再次,我认识到大数据需要规范和合规的管理。由于数据的敏感性和价值,需要保证数据的安全和隐私。企业需要合理设置权限和保护机制,确保数据不被非法获取和利用。另外,数据涉及到个人隐私,需要遵循相关法规和规范。企业必须建立完善的数据管理制度和流程,确保数据的规范和合规,同时也提升企业的信誉度和可信度。

此外,我认识到大数据需要与业务紧密结合。大数据本身并没有什么价值,关键是如何将大数据与企业的业务和需求结合起来。大数据分析师不仅要具备数据分析的技能,还要了解企业的业务和市场环境,才能更好地进行数据分析和运用。只有深入了解业务,才能发现更多的商机和挑战,为企业的发展提供更有力的支持。

最后,我认识到大数据需要持续学习和更新。大数据技术和方法在不断发展和更新,我们不能停留在过去的知识和技能上。要不断学习新的技术和方法,保持对大数据的敏锐洞察力,并通过实践来不断提升自己的能力。只有不断学习和更新,才能跟上时代步伐,不被淘汰。

总之,认识大数据需要我们从多个方面进行思考和努力。大数据具有巨大的潜力,但需要科学的分析、规范的管理和业务的结合。同时,我们也要持续学习和更新,保持对大数据的敏感性和洞察力。只有这样,我们才能更好地应对日益复杂的商业环境,为企业的发展提供更好的支持。

地质大数据心得体会篇七

随着信息技术的快速发展,大数据已经成为了当代社会最为炙手可热的话题之一。作为信息时代的产物,大数据给我们的生活带来了巨大的改变。最近,我读了一本名为《大数据》的书,在阅读过程中,让我对大数据有了更深的认识。下面我将与大家分享一下我的体会。

首先,大数据让我们的生活更加便利。现如今,大数据技术得到了广泛的应用,人们可以通过各种技术手段轻松地获取所需的信息。无论是购物、出行还是旅游,我们都能够通过大数据获取到最新的产品信息、路线规划以及景点推荐,从而为我们的生活提供了诸多便利。比如,每当我需要购买产品时,只需在电子商务平台上输入关键词,便可获得大量的搜索结果,同时还能通过查看其他用户的评价来进行筛选,这使得我们能够更加轻松地做出购买决策。

其次,大数据为商业发展提供了新的机遇。随着大数据技术的不断改进,越来越多的企业开始使用大数据分析手段来处理海量的数据,从而找到市场的空白点,为企业创造更多商机。例如,通过对大数据的分析,电商平台能够通过用户的购买行为了解用户的兴趣爱好,并根据这些数据进行精确的产品定位和个性化推荐,从而提高销售额。大数据的出现,使得商业发展更加精准和高效,企业可以更加了解消费者的需求,提供更好的产品和服务。

再次,大数据为决策提供了科学依据。无论是政府还是企事业单位,在制订政策和规划发展战略时,都需要基于大量的数据进行决策。大数据的出现让决策者可以更加客观地了解社会经济现状,分析各种数据之间的关系以及相关因素对决策结果的影响,从而做出更加明智的决策。比如,在交通规划方面,利用大数据可以实时监测交通拥堵情况,分析交通流量以及不同道路之间的关系,从而优化交通路线,提高交通效率。大数据的运用,为决策者提供了更准确的信息,帮助他们做出科学合理的决策。

最后,大数据也带来了一系列的挑战和问题。首先,数据安全问题成为了一个亟待解决的难题。大数据的存储和传输需要庞大的计算资源,但与此同时,也给数据安全带来了巨大的挑战。随着黑客技术的不断发展,数据泄露和隐私侵犯的风险也在逐渐增加。其次,大数据的过滤和分析需要高度专业的技术和人才。大量的数据对于普通人来说是一种负担和困扰,如果没有足够的专业人才来进行数据的处理和分析,那将影响到大数据的应用和发展。

总而言之,大数据给我们的生活和社会带来了诸多的变化和好处,但也面临着一些挑战和问题。我认为,我们应该在充分利用大数据的优势的同时,加强数据安全的保护和专业人才的培养。只有这样,我们才能更好地应对大数据时代的挑战和机遇,并为我们的生活和社会发展创造更加美好的未来。

地质大数据心得体会篇八

如今说起新媒体和互联网,必提大数据,似乎不这样说就out了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典著作——舍恩佰格的《大数据时代》。维克托·迈尔——舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和ibm等全球顶级企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,如果能做足功课又具备相应的理论功底,就能与之进行一场思想上的对话。

一读。

舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分“大数据时代的思维变革”中,舍恩伯格旗帜鲜明的亮出他的三个观点:一、更多:不是随机样本,而是全体数据;二、更杂:不是精确性,而是混杂性;三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。

我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。“大数据的简单算法比小数据的复杂算法更有效。”更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。“不是因果关系,而是相关关系。”不需要知道“为什么”,只需要知道“是什么”。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。

世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误读。比如说舍恩伯格在提出“不是因果关系,而是相关关系。”这一论断时,他在书中还说道:“在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。”[i]由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。

大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可“量化”,大数据的定量分析有力地回答“是什么”这一问题,但仍然无法完全回答“为什么”。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。在风险社会中信息安全问题日趋凸显,数据独裁与隐私保护成为一对矛盾。如何摆脱大数据的困境?舍恩伯格在最后一节“掌控”中试图回答,但基本上属于老生常谈。我想,或许凯文·凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:“大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。”谢谢舍恩伯格!让大数据讨论从自然科学回到人文社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考答案。

此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。

再读。

概念是研究的逻辑起点,“大数据”到底是什么?在百度上搜索到的解释是,“大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。”大数据的4v特点:数量(volume)、速度(velocity)、品种(variety)和真实性(veracity)。但舍恩伯格认为大数据并非一个确切的概念。他在书中的一段诠释更具人文色彩和社会意义:“大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。”[ii]其实,概念的界定要看研究者从哪个角度来研究它而定。

科学家的治学态度是严谨的,而人文学家更具有想象力。一些对大数据不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格认为大数据的核心是预测。“大数据不是要教机器像人一样思考。相反,把数学算法运用到海量的数据上来预期事情发生的可能性。”[iii]舍恩伯格甚至不回避大数据所产生的负面影响,他在第七章里谈到让数据主宰一切的隐忧。我觉得这是实事求是的科学态度。在量子力学里有一个测不准原理:一个微观粒子的某些物理量(如位置和动量,或方位角与动量矩,还有时间和能量等),不可能同时具有确定的数值,其中一个量越确定,另一个量的不确定程度就越大。它是解释微观世界的物理现象,信息社会中的大数据会不会也有类似情况呢?如果我们再把凯文·凯利的《失控》对比来读的话就更有意思了,这样我们对整个物质世界及至人类社会就有了更全面更深刻的洞察,从物理王国到生物世界,再到信息社会。从公共卫生到商业应用,从个人隐私到政府管理,大数据无处不在。与此同时,从哪个角度探讨用什么方法研究,舍恩伯格都不会忘记大数据服务人类造福人类的终极目的和价值所在。“大数据并不是一个充斥着运算法则和机器的冰冷世界,其中仍需要人类扮演重要角色。人类独有的弱点、错觉、错误都是十分必要的,因为这些特性的另一头牵着的是人类的创造力、直觉和天赋。偶尔也会带来屈辱或固执的同样混乱的大脑运作,也能带来成功,或在偶然间促成我们的伟大。这提示我们应该乐于接受类似的不准确,因为不准确正是我们之所以为人的特征之一。”[iv]用中国话来说就是“人无完人”,人类在收获大数据带来的红利的同时也要承受它带来的危害。这不是对立统一的辩证唯物主义?我把它看作带着欧洲批判学派色彩的科学发展观。

问题是研究的价值基点,“大数据”不是舍恩伯格研究的问题,而是研究对象,他研究的是数据处理和信息管理问题,同时也讨论信息安全和网络伦理问题,还引发哲学上的思考,哲学史上争论不休的世界可知论和不可知论转变为实证科学中的具体问题。可知性是绝对的,不可知性是相对的。“大数据”之所以为大是因它引发人类生活、工作和思维的大变革,从这个意义上来看,《大数据时代》的意义不仅在于它讨论了若干重大问题,而且对研究者开出了一个问题清单,从而引发更多人来探讨这些有趣的问题。

《大数据时代》实际上主要是一本讨论数据挖掘的书,数据挖掘与数据分析是不同的概念,数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。而数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。数据挖掘主要运用计算机来进行处理,而数据分析既要用计算机也要人工分析,是计算机科学与人文价值判断的统一结合。换言之,《大数据时代》并不是一本讨论大数据所有问题的书。

《大数据时代》也是一本讨论互联网发展的书,从数字化到数据化,同时有浓厚的未来学色彩。当文字变成数据,我们进入了互联网;当方位变成数据,我们进入了物联网;当沟通变成数据,我们进入了下一代互联网。一切可量化,万物皆数据,正是当今互联网世界的真实写照。面对于这样的世界及世界的未来,在《大数据时代》出现最多的词是“思维”和“方法”,因此也可以把这本书视为思维科学应用研究的书。

此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。

三读。

今年国庆节前一天,中共中央政治局们来到中关村搞集体学习,调研、讲解、讨论创新驱动发展战略。包括、在内的七位全部出动来到中关村,这是历史上没有过的,百度、联想和小米的负责人,有了一次直面最高层汇报工作的机会。雷军和柳传志,讲解的都是本公司的各种情况,李彦宏则没有讲百度的广告业务发展得如何好,而是讲起了大数据。在讲解中,李彦宏认为大数据有两个重要价值,一是促进信息消费,加快经济转型升级;二是关注社会民生,带动社会管理创新。这些价值也是目前党和国家领导人最为重视的,可见《大数据时代》既有理论价值也有现实意义。

当今大数据正在影响着新闻传媒业,大数据新闻、大数据营销、舆情分析、受众(用户)研究……数据分析师变身新闻编辑,大数据正改变新闻生产流程、大数据在创造传媒新业态。“不妨想象一下,随着数据的进一步增加,坐拥用户资源的新媒体们完全有能力通过数据挖掘,分析用户癖好,向电视台定制一部电视剧甚至向好莱坞定制一部电影。到那个时候,电视台一如那些家电厂商们,曾经产业链的上游‘王者’,将彻底成为一个产业链最低端的内容代工厂。”[v]然而,情形也远没有人们想象的那么乐观,李彦宏指出目前多数所谓的大数据公司其实还是空壳子,因为数据还没有完全开放。他认为必须在政府层面上推动才能真正实现大数据的开发与利用。我在讨论大数据时代的舆情监测与预警时说道:“经典自由主义传播学说对媒体的定位:秉持公正、客观立场的媒体被称为代表公众监督政府行为的‘看门狗’。其实,媒体既是公众利益也是国家利益的‘看门狗’。要看好门就要瞭望、洞察社情民意,传统媒体信息反馈渠道单一,视野、人力十分有限。而开放互动的新媒体平台却大有可为。作为公共信息发布平台的微博可以成为政府及时了解社情民意,从而选择正确治理路径的‘导盲犬’。”[vi]遗憾的是目前我国的数据平台还没有完全开放,真正的大数据时代还没有到来。

与国内不少教科书写法的专著相比,国外的书写得更有趣,尤其是大学者写的,不仅视野开阔,而且能够深入浅出。《大数据时代》不到22万字,却有上百个学术和商业的实例,丰富翔实的例子让读者感到通俗易懂,深奥的理论看起来也不费劲。这恐怕与舍恩伯格既是学者也是专家,既有理论又有实践有关。反观我们些学者故弄玄虚而示高明,实际上是把读者拒之门外。我觉得优秀的科学家也应该是一个科普作家,优秀的学者也应该是一个不错的传播者。当然国外学术著作也有一个翻译问题,这本书译得还不错。此外,《大数据时代》还附有不少it界名流的推荐意见,虽是出版商的发行所为,对解读此书也不无益处。

除了《大数据时代》,舍恩伯格还有一本《删除》也值得一读。要研究大数据不能只读一本书,该书译者周涛教授还推荐了三部国内出版的大数据方面的专著:《证析》、《大数据》、《个性化:商业的未来》。相比《大数据时代》的宏大视野,这些书就大数据某一局部问题给出深刻的介绍和洞见。我也推荐读一读中国工程院李国杰院士和中科院计算所副总工程学旗合写的文章《大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考》。

虽说开卷有益,但是由于每个人的时间精力有限,对于一个研究者来说,不读什么书甚至比读什么书更重要。我认为书有三种:有用的书,主要是应用类的专业书;无用的书,主要是形而上的思想类;无字的书,人间百态,社会现实。可偏重但不应偏废。对于学生来讲这三类“书”都该读一些,对于研究者则要读哪些解决关键问题的书,《大数据时代》就是这样一部书。当然,并非第一个读者都是研究大数据的,但进入大数据时代,还有什么东西与数据完全没有关系呢?麦肯锡全球研究机构认为,未来十年里有12项对经济发展产生重大影响的技术,其中包括三项新媒体技术:移动互联网、物联网和云计算。这三项新媒体技术都与大数据密切相关,而这些新媒体新技术的发展都影响着当今的新闻传播业。阅读此书至少给我们研究新闻传播学带来一些启迪。我觉得一本书的价值不在于让你顶礼膜拜,而是引发广泛而深入的讨论。

“凡是过去,皆为序曲。”读完此书,我们对大数据的认识才刚刚开始。

您可能关注的文档