实战大数据:分布式大数据分析处理系统开发与应用在线阅读
会员

实战大数据:分布式大数据分析处理系统开发与应用

井超 杨俊 乔钢柱编著
开会员,本书免费读 >

计算机网络数据库7.2万字

更新时间:2023-10-27 18:05:32 最新章节:内容简介

立即阅读
加书架
下载
听书

书籍简介

实战大数据——分布式大数据分析处理系统开发与应用,从大数据技术基础概念出发,介绍了大数据分析的流程和大数据分析处理系统的组成,以及大数据集群的搭建,并在此基础上讲解了多种不同技术构成的离线/实时数据分析系统实战项目。全书共10章,包括大数据概述、大数据分析的基本流程与工具、分布式大数据分析处理系统概述、构建大数据集群环境、构建基于LayUI的集群管理系统、基于HBase的大数据离线分析系统、基于Hive+Hadoop+Spark的大数据离线分析系统、基于MySQL+Spark的大数据离线分析系统、基于Redis+Kafka+Spark的大数据实时分析系统、基于Flume+Kafka+Flink的大数据实时分析系统。实战大数据——分布式大数据分析处理系统开发与应用,适合从事大数据系统搭建与运维、大数据分析等岗位的技术人员阅读,也适合高等院校大数据相关专业的学生使用。
品牌:机械工业出版社
上架时间:2023-02-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

井超 杨俊 乔钢柱编著
主页

最新上架

  • 会员
    《网络科学与网络大数据结构挖掘》作为网络科学的工具性图书共分两大模块:第一模块是基础理论,包括网络基本概念、网络拓扑性质、复杂网络社团挖掘等内容,旨在让读者熟悉一些基本的建模方法和分析技巧。第二模块为应用模块,包括复杂网络在几个代表性领域中的应用研究分析及案例剖析等。全书没有过多地数学和物理推导,而是更为关注网络科学的思维习惯和研究方式,兼具理论性、资料性和实践性。可用于各学科领域的教学及研究人员
    刘伟计算机0字
  • 会员
    本书从与数据要素关系最密切的信息、权属、价值、安全、交易等五个维度出发,汇聚不同学科背景的既有文献,整合现有观点,对数据要素的多维特性进行探讨,以丰富人们对数据要素的认知,凝聚共识,澄清数字时代的发展与治理迷思,为未来的相关创新提供起点。
    张平文 邱泽奇编著计算机14.5万字
  • 会员
    本书本书基于业务问题,就如何搭建分析框架,厘清分析思路,按照标准分析步骤对数据进行怡当的预处理,选择合适的分析方法和分析模型,使用恰当的分析工具对数据进行分析,以及对分析结果进行可视化和符合业务要求的解读等内容展开讲解,帮助业务专家做出合适的业务判断,制定准确的业务策略。
    傅一行计算机13万字
  • 会员
    本书系统介绍了使用Python进行数据分析需要掌握的各项知识,涵盖了Python基础知识、网络爬虫技术、正则表达式、BeautifulSoup和JSON、词语切分、自然语言处理、使用NumPy与Pandas处理数据、数据可视化技术、MySQL、机器学习、朴素贝叶斯模型、支持向量机、随机森林、深度学习以及量化投资。本书通过结合数据分析技术的理论知识与Python的实战应用,帮助读者更好地运用Pyth
    王俊主编计算机12.3万字
  • 会员
    这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。
    陈鹤 杨国栋计算机14万字
  • 会员
    这是一套数据指标体系全流程构建(从规划、框架设计、数据采集加工到应用)方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略,还通过多个行业实例展示了具体操作方法。书中从数据采集入手,借助BI工具Superset实践构建过程。本着“一切技术都是为业务服务的”这一宗旨,本书除了包含数据指标体系构建相关内容外,还结合统计学原理及Excel、Python等工具,深入剖析数据指标波动对业务的影
    李渝方计算机12.7万字
  • 会员
    本书围绕新工科背景下大数据人才培养需求编写,既涵盖了大数据的基础知识,又介绍了大数据分析的相关工具与案例。全书共9章,介绍了大数据采集与预处理、大数据存储与管理、大数据处理与分析、大数据可视化处理流程;重点分析了科大讯飞大数据平台在政务、交通、金融和用户画像等实际场景中的应用,还介绍了大数据实验环境的详细搭建步骤,方便读者快速理解和体验大数据应用技术;最后介绍了大数据治理中法律政策、行业标准建设的
    于俊伟 母亚双 闫秋玲编著计算机14.5万字
  • 会员
    本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例
    戴刚 张良均主编计算机10.4万字
  • 会员
    本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。本书共11章,采用原理+代码实例+综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书
    闭应洲 许桂秋 刘军主编计算机14万字

同类书籍最近更新

  • 会员
    本书从大数据生命周期的角度阐述大数据技术体系与开源生态的发展。全书分为7篇,包括大数据技术体系与开源生态概述、大数据获取技术、大数据管理技术、大数据处理技术、大数据分析与挖掘技术、大数据可视化与交互技术、大数据安全与治理技术。又分为15章,详细介绍大数据的技术概况、发展近况和技术优势、软件架构、和应用场景等内容。本书适合大数据和人工智能业内人员、各大高校相关专业的高年级本科生和研究生、以及对大数
    刘驰数据库22.9万字
  • 会员
    本书的写作目的是让企业管理者以及行长、校长等组织领导更清楚如何进行数字化转型、如何分工/协同、如何保障转型成功落地、如何低成本/低风险地转型,从而让中国企业在数字化转型上少走弯路,让研发人员、业务人员和广大数据从业者及数据技术爱好者了解数字化转型及数据中台的落地路径与实施方法,知道如何配合高层执行转型方案。本书采用理论与实践相结合的方法,介绍企业如何从战略、人才、技术三个角度实现数字化转型,为读者
    马晓东数据库15.7万字
  • 会员
    这是一部ECharts的实战手册,内容系统而全面,由浅入深,能带领读者快速从新人晋级为高手,做出漂亮的商业级数据图表。本书内容得到了ECharts项目官方核心Committer&PPMC成员羡辙的高度评价和推荐。本书一共12章,从逻辑上可分为四个部分。第一部分基础篇(第1~4章)主要介绍了ECharts的基础知识、环境搭建、常用组件、可视化图,以及如何利用ECharts制作简单可视化图。
    王大伟数据库4.7万字
  • 会员
    LearntheartofbringingtheInternetofThingsintoyourprojectswiththepowerofJavaScriptAboutThisBook?ThisisapracticalguidetohelpyouconfigureandbuildacompletedistributedIoTsy
    Rubén Oliva Ramos数据库2.6万字
  • 会员
    Ifyouwanttomakecross-platformgameswithoutthehassleanddangersofwritingplatform-specificcode,orIfyouareagameprogrammerwhomayhavesomeexperiencewithJavaandyouwanttolearn
    David Saltares Márquez Alberto Cejas Sánchez数据库12.1万字
  • 会员
    InteractwiththeworldandrapidlyprototypeIoTapplicationsusingPythonAboutThisBook?RapidlyprototypeevencomplexIoTapplicationswithPythonandputthemtopracticaluse?EnhanceyourIoT
    Gastón C. Hillar数据库8.6万字