-
实时大数据分析基于Storm、Spark技术的实时应用 pdf高清扫描版
内容简介 本书详细阐述了实时大数据分析的实现过程,主要包括大数据技术前景及分析平台;熟悉Storm平台;用Storm处理数据;Trident介绍和Storm性能优化;熟悉Kinesis;熟悉Spark;RDD编程;Spark的SQL查询引擎;Spark Streaming分析流数据以及Lambda架构等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。 本书适合作为…- 441
- 0
-
深入理解Kafka:核心设计与实践原理 pdf高清扫描
内容简介 《深入理解Kafka:核心设计与实践原理》从Kafka的基础概念切入,循序渐进地转入对其内部原理的剖析。《深入理解Kafka:核心设计与实践原理》主要阐述了Kafka中生产者客户端、消费者客户端、主题与分区、日志存储、原理解析、监控管理、应用扩展及流式计算等内容。虽然Kafka的内核使用Scala语言编写,但《深入理解Kafka:核心设计与实践原理》基本以Java语言作为主要的示例语言,…- 765
- 0
-
Hadoop大数据平台构建与应用 pdf高清扫描版
内容简介 本书以“高职院校学情分析”系统为项目原型,以任务驱动为主线,基于Hadoop大数据平台,讲解大数据平台的搭建与运维、大数据的采集与存储、大数据的处理、数据的分析、数据的可视化等完整的大数据应用案例,全面详细地讲述Hadop、MapReduce、HDFS、Hive和Sqoop等技术的相关知识,并详细讨论了Mahout大数据分析中的常用算法——K-means聚类算法、Canopy聚类算法、欧…- 281
- 0
-
区块链与大数据:打造智能经济 pdf高清扫描
作者:井底望天/武源文/赵国栋/刘文献,出版社:人民邮电出版社,ISBN:9787115457400,《区块链与大数据:打造智能经济》内容介绍:近年来,大数据在迅猛发展的同时也充斥着概念的炒作,面临着诸多困境。那么,有什么方法能够促使大数据突破困境,获得更高层次的发展呢?这就是井底望天、武源文、赵国栋、刘文献主编的《区块链与大数据(打造智能经济)》的核心思想及价值所在。- 795
- 0
-
大数据之路:阿里巴巴大数据实践 pdf高清扫描
作者:阿里巴巴数据技术及产品部 ,出版社:电子工业出版社,ISBN:9787121314384,《大数据之路:阿里巴巴大数据实践》内容介绍:在阿里巴巴集团内,数据人员面临的现实情况是:集团数据存储已经达到EB级别,部分单张表每天的数据记录数高达几千亿条;在2016年“双11购物狂欢节”的24小时中,支付金额达到了1207亿元人民币,支付峰值高达12万笔/秒,下单峰值达17.5万笔/秒,媒体直播大屏…- 1.4k
- 0
-
Elasticsearch集成Hadoop最佳实践 pdf高清扫描版
作者:[美]Vishal Shukla,出版社:清华大学出版社,ISBN:9787302469674,《Elasticsearch集成Hadoop最佳实践》内容介绍:Elasticsearch Hadoop作为一个完美的工具,用来连接Elasticsearch和Hadoop的生态系统。通过Kibana技术,Elasticsearch Hadoop很容易从Hadoop生态系统中获得大数据分析的结果。- 501
- 0
-
深度剖析Hadoop HDFS pdf高清扫描
作者:林意群 ,出版社:机械工业出版社,ISBN:9787111562078,内容介绍:《深度剖析Hadoop HDFS》基于Hadoop 2.7.1版本进行分析,全面描述了HDFS 2.X的核心技术与解决方案,书中描述了HDFS内存存储、异构存储等几大核心设计,包括源码细节层面的分析,对于HDFS中比较特殊的几个场景过程也做了细粒度的分析。还分享了作者在实际应用中的解决方案及扩展思路。- 599
- 0
-
Spark大数据处理: 原理、算法与实例 pdf高清扫描
作者:刘军/林文辉/方澄 ,出版社:清华大学出版社,ISBN:9787302449959,《Spark大数据处理: 原理、算法与实例》内容介绍:本书以时下最为流行的Hadoop所存在的缺陷为出发点,深入浅出地介绍了下一代大数据处理核心技术Spark的优势和必要性,并以最简洁的指引步骤展示了如何在10分钟内建立一个Spark大数据处理环境。在此基础上,以图文并茂和丰富的示例代码讲解的形式系统性地揭示…- 554
- 0
-
Cloudera Hadoop大数据平台实战指南 pdf扫描版
内容简介 对于入门和学习大数据技术的读者来说,大数据技术的生态圈和知识体系过于庞大,可能还没有开始学习就已经陷入众多的陌生名词和泛泛的概念中。本书的切入点明确而清晰,从Hadoop 生态系统的明星 Cloudera 入手,逐步引出各类大数据基础和核心应用框架。 本书分为18章,系统介绍Hadoop 生态系统大数据相关的知识,包括大数据概述、Cloudera Hadoop平台的安装部署、HDFS分布…- 719
- 0
-
基于Hadoop与Spark的大数据开发实战 pdf高清扫描
内容简介 大数据技术让我们以一种前所未有的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,最终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hi…- 568
- 0
-
大数据架构之道与项目实战
内容简介 大数据和人工智能技术发展正当时,如何快速构建一个高水平的企业级大数据平台是撰写本书的出发点。本书从总体技术要求出发,深入分析了全栈技术的各自优势和应用场景,传授了三十多种主流技术的架构设计、技术原理和集成方法。第 1章介绍企业级大数据平台服务的总体设计,突出研究经典设计模式之美、吸纳分布式技术的精髓、深耕微架构的演变内涵。第 2章~第 9章是项目实战环节,介绍高并发采集、灵活转发、高可扩…- 502
- 0
-
大数据平台基础架构指南
内容简介 市面上不乏大数据具体技术组件的书籍,但却很少有从大数据平台整体建设和产品形态的宏观角度入手来阐释的。本书重点介绍大数据开发平台服务构建的整体思路和解决方案,内容涵盖一个成熟的大数据开发平台必不可少的各类核心组件:工作流调度系统、集成开发环境、元数据管理系统、数据交换服务、数据可视化服务、数据质量管理服务,以及测试环境的建设等。书中还凝结了作者多年平台建设的实践经验,以及对大数据相关从业人…- 710
- 0
-
Hadoop构建数据仓库实践 pdf高清扫描版
内容简介 本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库,将传统数据仓库建模与SQL开发的简单性与大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。 本书内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用HIVE进行数据转换和装载处理,使用Oozie 调度作业周期性执行,使用lmpala进行快速联机数据分析…- 652
- 0
-
大数据搜索引擎原理分析及编程实现
内容简介 1、适合对自然语言处理及机器学习应用领域有兴趣的读者。 2、适合对现代搜索引擎相关算法有兴趣的读者。 3、适合对大数据分析、数据挖掘应用有兴趣的读者。 4、适合互联网行业的不同层次从业者。 5、适合从事搜索引擎优化的网络营销读者。 6、适合高校中学习计算机、软件工程等相关专业的读者。 本书向读者提供了一套完整的大数据时代背景下的搜索引擎解决方案,详尽地介绍了搜索引擎的技术架构、算法体系及…- 427
- 0
-
企业大数据系统构建实战:技术、架构、实施与应用
内容简介 对于很多企业而言,大数据的重要性不言而喻,但是如何构建、实施和应用大数据系统却是一个复杂工程。本书让读者认识到大数据不仅仅是数据、技术、架构、应用,更是结合了商业模式、战略定位、信息安全、单位协同、组织保障、实施选型的完整体系。 本书内容从大数据的规划定位、组织实施和价值提升三个维度展开,兼顾从整体性、全局性、安全性、价值性、技术性、体系性等方面的考虑。 第一部分:企业大数据战略规划 主…- 493
- 0
-
大数据架构和算法实现之路:电商系统的技术实战
内容简介 本书介绍了一些主流技术在商业项目中的应用,包括机器学习中的分类、聚类和线性回归,搜索引擎,推荐系统,用户行为跟踪,架构设计的基本理念及常用的消息和缓存机制。在这个过程中,我们有机会实践R、Mahout、Solr、Elasticsearch、Hadoop、HBase、Hive、Flume、Kafka、Storm等系统。如前所述,本书最大的特色就是,从商业需求出发演变到合理的技术方案和实现,…- 465
- 0
-
Hadoop大数据开发
内容简介 本书通过原理加案例方式系统讲解了Hadoop大数据开发,精心安排了原理分析、环境搭建、案例开发等环节,使读者对解决大数据问题有清晰的思路。 全书共7章:前6章系统讲解大数据Hadoop架构,包括大数据处理平台Hadoop、分布式文件系统HDFS,并行计算模型MapReduce、资源调度框架Yarn;第7章是MapReduce应用实例,通过案例帮助读者进一步理解Hadoop平台。全书突出三…- 377
- 0
-
大数据大创新:阿里巴巴云上数据中台之道
内容简介 阿里巴巴云上数据中台正服务着阿里生态中的数十个业务板块、百余家公司、千万级客户,在帮助决策层看清甚至决定业态走向的同时,在上万个业务场景中应用并催生创新。 《大数据大创新:阿里巴巴云上数据中台之道》基于作者在阿里巴巴的十年大数据从业经历,精彩演绎云上数据中台之道。《大数据大创新:阿里巴巴云上数据中台之道》基于大数据探索的大趋势,讲述阿里巴巴云上数据中台顶层设计,再以实际案例详述阿里巴巴云…- 771
- 0
-
Python金融大数据分析
内容简介 唯一一本详细讲解使用Python分析处理金融大数据的专业图书;金融应用开发领域从业人员必读。 Python凭借其简单、易读、可扩展性以及拥有巨大而活跃的科学计算社区,在需要分析、处理大量数据的金融行业得到了广泛而迅速的应用,并且成为该行业开发核心应用的首选编程语言。《Python金融大数据分析》提供了使用Python进行数据分析,以及开发相关应用程序的技巧和工具。 《Python金融大数…- 673
- 0
-
数据算法:Hadoop、Spark大数据处理技巧
内容简介 《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。 主要内容包括: ■ 完成超大量交易的购物篮分析。 ■ 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。 ■ 使用超大基因组数据完成DNA和RNA测序。 …- 570
- 0
-
离线和实时大数据开发实战
内容简介 本书分为三篇。第壹篇:从整体上给出数据大图和数据平台大图,主要介绍数据的主要流程、各个流程的关键技术、数据的主要从业者及他们的职责等;数据平台大图分离线和实时分别给出数据平台架构、关键数据概念和技术等;第二篇:介绍离线数据开发的主要技术,包含Hadoop、Hive、维度建模等,另外此部分还将综合上述各种离线技术给出离线数据处理实战;第三篇:集中介绍实时数据处理的各项技术,包含Storm、…- 712
- 0
❯
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!