当前位置:主页 > 电子书籍 > 网络相关 > 自己动手做大数据系统(张魁 等著) 带目录书签 pdf版[18MB]

自己动手做大数据系统(张魁 等著) 带目录书签 pdf版[18MB]

自己动手做大数据
  1. 书籍大小:18.5MB
  2. 软件语言:简体中文
  3. 书籍类型:国产软件
  4. 书籍授权:免费软件
  5. 利发国际手机客户端时间:2018-02-06
  6. 书籍类别:网络相关
  7. 购买链接:京东  异步社区
  8. 应用平台:PDF
书籍评分
网友评分: 3
内容介绍热点排行利发国际手机客户端地址相关内容
如果你是一位在校大学生,对大数据感兴趣,也知道使用的企业越来越多,市场需求更是日新月异,但苦于自己基础不够,心有余而力不足;也看过不少大数据方面的书籍、博客、视频等,但感觉进步不大;如果你是一位在职人员,但目前主要使用传统技术,虽然对大数据很有兴趣,也深知其对未来的影响,但因时间不够,虽有一定的基础,常常也是打两天鱼、晒三天网,进展不是很理想。 如果你有上述疑惑或遇到相似问题,《自己动手做大数据系统》正好比较适合你。《自己动手做大数据系统》从OpenStack云平台搭建、软件部署、需求开发实现到结果展示,以纵向角度讲解了生产性大数据项目上线的整个流程;以完成一个实际项目需求贯穿各章节,讲述了Hadoop生态圈中互联网爬虫技术、Sqoop、Hive、HBase组件协同工作流程,并展示了Spark计算框架、R制图软件和SparkRHive组件的使用方法。《自己动手做大数据系统》的一大特色是提供了实际操作环境,用户可以在线登录云平台来动手操作书中的数据和代码,登录网址请参考http://www.feiguyun.com/support 目录
第1章 为什么要自己动手做大数据系统 1
1.1 大数据时代 1
1.2 实战大数据项目 2
1.3 大数据演练平台 2
第2章 项目背景及准备 4
2.1 项目背景 4
2.2 项目简介 4
2.3 项目架构 4
2.4 操作系统 5
2.5 数据存储 7
2.6 数据处理 8
2.7 开发工具 9
2.8 调试工具 10
2.9 版本管理 10
第3章 大数据环境搭建和配置 11
3.1 各组件功能说明 11
3.1.1 各种数据源的采集工具 12
3.1.2 企业大数据存储工具 12
3.1.3 企业大数据系统的数据仓库工具 12
3.1.4 企业大数据系统的分析计算工具 13
3.1.5 企业大数据系统的数据库工具 13
3.2 大数据系统各组件安装部署配置 13
3.2.1 安装的前期准备工作 13
3.2.2 Hadoop基础环境安装及配置 15
3.2.3 Hive安装及配置 21
3.2.4 Sqoop安装及配置 24
3.2.5 Spark安装及配置 30
3.2.6 Zookeeper安装及配置 31
3.2.7 HBase安装及配置 33
3.3 自动化安装及部署说明 35
3.3.1 自动化安装及部署整体架构设计 35
3.3.2 大数据系统自动化部署逻辑调用关系 36
3.4 本章小结 43
第4章 大数据的获取 44
4.1 使用爬虫获取互联网数据 45
4.2 Python和Scrapy 框架的安装 45
4.3 抓取和解析招聘职位信息 47
4.4 职位信息的落地 51
4.5 两个爬虫配合工作 53
4.6 让爬虫的架构设计更加合理 55
4.7 获取数据的其他方式 57
4.8 使用Sqoop同步论坛中帖子数据 57
4.9 本章小结 59
第5章 大数据的处理 60
5.1 Hive是什么 60
5.2 为什么使用Hive做数据仓库建模 60
5.3 飞谷项目中Hive建模步骤 61
5.3.1 逻辑模型的创建 62
5.3.2 物理模型的创建 67
5.3.3 将爬虫数据导入stg_job表 74
5.4 使用Hive进行数据清洗转换 77
5.5 数据清洗转换的必要性 78
5.6 使用HiveQL清洗数据、提取维度信息 79
5.6.1 使用HQL清洗数据 79
5.6.2 提取维度信息 82
5.7 定义Hive UDF封装处理逻辑 85
5.7.1 Hive UDF的开发、部署和调用 86
5.7.2 Python版本的UDF 89
5.8 使用左外连接构造聚合表rpt_job 92
5.9 让数据处理自动调度 96
5.9.1 HQL的几种执行方式 96
5.9.2 Hive Thrift服务 99
5.9.3 使用JDBC连接Hive 100
5.9.4 Python调用HiveServer服务 103
5.9.5 用crontab实现的任务调度 105
5.10 本章小结 107
第6章 大数据的存储 108
6.1 NoSQL及HBase简介 108
6.2 HBase中的主要概念 110
6.3 HBase客户端及JavaAPI 111
6.4 Hive数据导入HBase的两种方案 114
6.4.1 利用既有的JAR包实现整合 114
6.4.2 手动编写MapReduce程序 116
6.5 使用Java API查询HBase中的职位信息 122
6.5.1 为什么是HBase而非Hive 122
6.5.2 多条件组合查询HBase中的职位信息 123
6.6 如何显示职位表中的某条具体信息 132
6.7 本章小结 133
第7章 大数据的展示 134
7.1 概述 134
7.2 数据分析的一般步骤 135
7.3 用R来做数据分析展示 135
7.3.1 在Ubuntu上安装R 135
7.3.2 R的基本使用方式 137
7.4 用Hive充当R的数据来源 139
7.4.1 RHive组件 139
7.4.2 把R图表整合到Web页面中 145
7.5 本章小结 151
第8章 大数据的分析挖掘 152
8.1 基于Spark的数据挖掘技术 152
8.2 Spark和Hadoop的关系 153
8.3 在Ubuntu上安装Spark集群 154
8.3.1 JDK和Hadoop的安装 154
8.3.2 安装Scala 154
8.3.3 安装Spark 155
8.4 Spark的运行方式 157
8.5 使用Spark替代Hadoop Yarn引擎 160
8.5.1 使用spark-sql查看Hive表 160
8.5.2 在beeline客户端使用Spark引擎 161
8.5.3 在Java代码中引用Spark的ThriftServer 163
8.6 对招聘公司名称做全文检索 168
8.6.1 从HDFS数据源构造JavaRDD 169
8.6.2 使用Spark SQL操作RDD 173
8.6.3 把RDD运行结果展现在前端 174
8.7 如何把Spark用得更好 175
8.8 SparkR组件的使用 177
8.8.1 SparkR的安装及启动 177
8.8.2 运行自带的Sample例子 179
8.8.3 利用SparkR生成职位统计饼图 179
8.9 本章小结 181
第9章 自己动手搭建支撑大数据系统的云平台 182
9.1 云平台架构 182
9.1.1 一期云基础平台架构 182
9.1.2 二期云基础平台架构 184
9.2 云平台搭建及部署 185
9.2.1 安装组件前准备 185
9.2.2 Identity(Keystone)组件 190
9.2.3 Image(Glance)组件 198
9.2.4 Compute(Nova)组件 201
9.2.5 Storage(Cinder)组件 206
9.2.6 Networking(Neutron)组件 210
9.2.7 Ceph分布式存储系统 221
9.2.8 Dashboard(Horizon)组件 230
9.3 Identity(Keystone)与LDAP的整合 232
9.4 配置Image组件大镜像部署 235
9.5 配置业务系统无缝迁移 236
9.6 本章小结 237
参考文献 238
截图:
标签:大数据   系统   张魁  
人气书籍
  1. TCP/IP详解,卷1:协议 Gary.Wright著 中文 PDF版TCP/IP详解卷1:协议》描述了属于每一层的各个协议以及它们如何在不同操作系统中运行利发国际手机客户端
  2. 计算机网络(第5版)中文版(特南鲍姆) PDF 扫描版[141M]本书是国内外使用最广泛、最权威的计算机网络经典教材利发国际手机客户端
  3. 图解HTTP(上野宣) PDF扫描版[67MB]图解HTTP前半部分由HTTP的成长发展史娓娓道来,基于HTTP 1.1 标准讲解通信过程,包括HTTP方法、协议格式、报文结构、首部字段、状态码等的具体含义,还分别讲解HTTP通信过利发国际手机客户端
  4. 计算机网络:自顶向下方法(原书第4版) PDF扫描版[143MB]新颖的“自顶向下”教学法。《计算机网络:自顶向下方法(原书第4版)》特别强调应用层,尽早激发读者的学习热情,并强调自主开发网络应用程序。利发国际手机客户端
  5. 计算机网络 第6版 (谢希仁) pdf扫描版[182MB]计算机网络十年经久不衰,不断出新的经典教科书,本书的特点是概念准确、论述严谨、内容新颖、图文并茂,突出基本原理和基本概念的阐述,同时力图反映计算机网络的一些最新利发国际手机客户端
  6. SQL注入攻击与防御 中文PDF清晰扫描版(38.6M)SQL注入攻击与防御利发国际手机客户端
  7. HTTP权威指南(HTTP:The Definitive Guide) PDF 扫描版[80M]主要介绍了web 应用程序是如何工作的,核心的因特网协议如何与架构构建块交互,如何正确实现因特网客户和服务器等利发国际手机客户端
  8. 计算机网络(第7版) (谢希仁著) 完整pdf扫描版[67MB]本书全面系统地介绍了计算机网络的发展和原理体系结构、物理层、数据链路层、网络层等方面。在计算机网络第6版的基础上进行了一些修订,概念准确、论述严谨、内容新颖、图利发国际手机客户端
  9. Windows8快速入门指南 Win8使用手册 中文 PDF版本书是WINDOWS的指南书.介绍WINSOWS8的入门知识利发国际手机客户端
  10. 非常网管:网络管理从入门到精通 PDF扫描版[74MB]非常网管:网络管理从入门到精通适合网络管理和维护人员学习和使用,也可作为高等院校计算机网络相关专业的利发国际手机客户端,或社会培训机构相关领域的培训用书。利发国际手机客户端
利发国际手机客户端地址
  1. 自己动手做大数据系统(张魁 等著) 带目录书签 pdf版[18MB]

      1. 百度网盘利发国际手机客户端1
      2. 百度网盘利发国际手机客户端2
    相关书籍
    1. 自己动手做大数据系统(张魁 等著) 带目录书签 pdf版[18MB]
    2. 大数据挖掘:系统方法与实例分析 带目录书签 pdf版[57MB]
    3. 应用密码学:协议、算法与C源程序(原书第2版) 中文完整PDF扫描版[182MB]
    4. 密码编码学与网络安全(第6版) 中文完整pdf扫描版[130MB]
    5. Learning WebRTC 中文版:用WebRTC开发交互实时通信应用 完整pdf扫描版[61MB]
    6. 大数据搜索与日志挖掘及可视化方案(第2版) 带书签目录 pdf版
    7. 删除:大数据取舍之道 带书签目录完整版PDF[38MB]
    8. 数据挖掘-概念模型方法和算法(第2版) 完整版PDF[32MB]
    9. 交互设计之路:让高科技产品回归人性(第2版) 库帕 pdf高清扫描版[33MB]
    10. WebRTC权威指南(原书第3版) 中文完整pdf扫描版[86MB]
    网友评论
    利发国际手机客户端声明 ☉脚本之家所供资源均来自稀酷客、csdn、电驴等网站搜集或网友提供.并仅供私下交流学习之用,版权依然由原属机构或个人所有,任何涉及商业盈利目的均不得使用,否则产生的一切后果将由您自己承担,若无意中侵犯了您的权益,请来信指出我们会立即会做出您满意的处理。
    ☉解压密码或分享码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
    ☉推荐使用 [ 迅雷 ] 利发国际手机客户端,使用 [ WinRAR v3.93 ] 以上版本解压本站电子书。
    ☉如果这个电子书总是不能利发国际手机客户端的请在评论中留言,我们会尽快修复,谢谢!
    ☉利发国际手机客户端本站资源,如果服务器暂不能利发国际手机客户端请过一段时间重试!
    ☉如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
    ☉本站提供的一些商业电子书是供学习研究之用,如用于商业用途,请购买正版。
    ☉本站提供的自己动手做大数据系统(张魁 等著) 带目录书签 pdf版[18MB] 资源来源互联网,版权归该利发国际手机客户端资源的合法拥有者所有。
    关于我们 - 广告合作 - 联系我们 - 免责声明 - 网站地图 - 投诉建议 - 在线投稿 CopyRight © 2006-2017 脚本之家 JB51.Net , All Rights Reserved 苏ICP备14036222号
    利发国际手机客户端