英谷教育-服务地方普通本科高校“特色鲜明的一流高水平大学”的实质性内涵建设

云计算与大数据概论

云计算与大数据知识体系的集成者

本书从基本概念出发，主要介绍云计算与大数据发展概况及当前流行的Hadoop开发技术的基础知识。全书共分9章，分别介绍了云计算与大数据概述、云计算技术、云计算平台、大数据技术、Hadoop开发平台、MapReduce应用、PIG、HBase、大数据和云计算安全。本书侧重讲解大数据技术Hadoop生态系统成员的理论知识，包括框架的运行流程和执行原理等。通过对本书的学习，使读者能够对大数据相关知识点迅速理解并掌握。本书适应面广，可作为本科计算机科学与技术、软件工程、网络工程、计算机软件、计算机信息管理、电子商务和经济管理等专业的程序设计课程的教材。也可作为科研、程序设计等人员的参考书籍。

资源下载手机端下载

本书目录

第1章云计算与大数据概述
1.1 云计算和大数据的概念
1.1.1 云计算概述
1.1.2 云计算的特点和优势
1.1.3 大数据概述
1.1.4 大数据的特点和作用
1.2 云计算与大数据现状
1.2.1 国外云计算发展现状
1.2.2 我国云计算发展现状
1.2.3 国外大数据发展现状
1.2.4 我国大数据发展现状
1.3 云计算分类
1.3.1 私有云、公有云和混合云
1.3.2 IaaS、PaaS、SaaS和DaaS
1.4 主流云计算和大数据供应商
1.4.1 Amazon云计算
1.4.2 IBM云计算
1.4.3 Google云计算
1.4.4 微软云计算
1.4.5 阿里巴巴云服务
1.4.6 百度开放云
1.4.7 腾讯云平台
1.5 云计算与大数据的联系

第2章云计算技术
2.1 虚拟化技术
2.1.1 虚拟化技术发展史
2.1.2 虚拟化技术的概念
2.1.3 虚拟化技术的实现
2.1.4 虚拟化的应用领域
2.2 分布式技术
2.2.1 分布式文件系统
2.2.2 分布式数据库系统
2.2.3 分布式计算

第3章云计算平台
3.1 Google云平台
3.1.1 Google云计算体系结构
3.1.2 Google云计算平台核心技术
3.1.3 Google App Engine
3.2 Amazon云平台
3.2.1 存储架构Dynamo
3.2.2 弹性计算云EC2
3.2.3 简单存储服务 S3
3.2.4 简单队列服务SQS
3.2.5 其他AWS（Amazon Web Services）
3.3 微软Windows Azure平台
3.3.1 平台定位
3.3.2 计算服务
3.3.3 数据和存储服务
3.3.4 其他服务
3.4 阿里云平台服务
3.4.1 云计算服务
3.4.2 数据与存储服务
3.4.3 数据分析服务
3.4.4 其他服务
3.5 百度开发者云服务
3.5.1 计算服务
3.5.2 数据和存储服务
3.5.3 数据分析服务
3.5.4 其他服务
3.6 腾讯云平台服务
3.6.1 计算服务
3.6.2 数据和存储服务
3.6.3 数据分析服务
3.6.4 其他服务

第4章大数据技术
4.1 大数据应用系统架构
4.1.1 系统架构原则
4.1.2 Apache大数据应用架构模型
4.1.3 企业大数据应用架构模型
4.2 大数据关键技术
4.2.1 数据收集技术
4.2.2 数据预处理技术
4.2.3 数据存储技术
4.2.4 数据处理技术
4.2.5 数据挖掘技术
4.2.6 大数据分析与可视化技术
4.2.7 大数据安全
4.3 主流大数据服务
4.3.1 Google的技术与产品研发
4.3.2 微软的HDInsight
4.3.3 IBM 的InfoSphere
4.4 开源大数据平台
4.4.1 Hadoop系统架构
4.4.2 Storm流计算系统
4.4.3 Spark迭代计算框架
4.4.4 其它产品

第5章 Hadoop开发平台
5.1 Hadoop的发展史
5.2 Hadoop的功能与作用
5.3 Hadoop的基本组成部分
5.3.1 HDFS（分布式文件系统）
5.3.2 MapReduce（分布式计算框架）
5.3.3 YARN（集群资源管理器）
5.3.4 Zookeeper（分布式协作服务）
5.3.5 HBase（分布式NoSQL数据库）
5.3.6 Hive（数据库管理工具）
5.3.7 Pig（高层次抽象脚本语言）
5.3.8 Avro
5.3.9 Sqoop

第6章 MapReduce应用
6.1 分布式并行编程: 编程方式的变革
6.2 MapReduce模型概述
6.3 工作组件
6.4 MapReduce工作流程
6.4.1 工作流程概述
6.4.2 MapReduce各个执行阶段
6.4.3 Shuffle过程详解
6.5 并行计算的实现
6.5.1 数据分布存储
6.5.2 分布式并行计算
6.5.3 本地计算
6.5.4 任务粒度
6.5.5 Partition
6.5.6 Combine
6.5.7 Reduce任务从Map任务节点获取中间结果
6.6 实例分析：WordCount
6.6.1 WordCount设计思路
6.6.2 源代码程序
6.6.3 程序解读
6.6.4 使用hadoop运行程序
6.7 新MapReduce框架YARN
6.7.1 原Hadoop MapReduce框架的问题
6.7.2 新Hadoop YARN框架原理及运作机制
6.7.3 新旧Hadoop MapReduce框架比对

第7章 PIG简介
7.1 Pig概述
7.2 Pig的作用
7.3 Pig的设计思想
7.4 Pig的运行模式
7.5 Pig Latin
7.5.1 基础知识
7.5.2 读写检测操作符
7.5.3 数据类型和schema
7.5.4 表达式和函数
7.5.5 关系型运算符
7.5.6 执行优化
7.5.7 用户定义函数
7.6 Pig脚本
7.6.1 注释
7.6.2 参数替换

第8章 HBase简介
8.1 HBase的概念和作用
8.2 HBase使用场景和成功案例
8.2.1 互联网搜索功能
8.2.2 抓取增量数据
8.2.3 内容服务
8.3 HBase和传统关系数据库的对比
8.4 HBase数据模型
8.4.1 数据模型相关概念
8.4.2 概念视图
8.4.3 物理视图
8.4.4 物理存储
8.5 HBase组成架构
8.5.1 HRegion
8.5.2 HMaster
8.5.3 ZooKeeper
8.6 HBase的安装和运行
8.6.1 安装HBase
8.6.2 运行HBase
8.6.3 HBase Shell
8.7 HBase访问接口
8.7.1 HBase Java API 介绍
8.7.2 Java API程序示例

第9章大数据和云计算安全
9.1 云计算安全
9.1.1 云计算面临的安全威胁
9.1.2 云计算安全相关解决方案
9.2 大数据安全
9.2.1 大数据面临的的安全问题
9.2.2 不同领域的大数据安全需求
9.2.3 现有针对安全问题的解决方案

关于英谷: 公司简介; 三元制教育; 121工程; 荣誉资质; 教师团队; 主席寄语; 企业文化

专业介绍: 新农科专业群; 信息技术类专业群; 电子商务类专业群; 工业自动化类专业群; 金融财务类专业群; 外语类专业群

服务体系: 专业共建和人才培养; 高校教师培养; 教学内容及教材研发; 在线综合服务; 实训实习服务; 大数据综合评估; 就业服务; 创新创客创业

合作联盟: 合作院校; 企业联盟; 明星学员

新闻资讯: 公司新闻; 行业聚焦; 媒体报道; 招贤纳士

三大平台: 121荟英谷; 荟英谷创客; 巨万云

出版教材