江风网

txt_epub_Kindle_azw3_mobi_pdf电子书免费下载

大数据架构商业之路

作者: 黄申
出版时间: 2016-05-01
发布时间: 2020-11-21
阅读热度: 5
综合评分: 0
下载支持: TXT EPUB MOBI AZW3 PDF
在线阅读: 手机阅读 电脑阅读
《大数据架构商业之路》内容简介

本书通过讲述一个虚拟的(如有雷同纯属巧合)互联网O2O创业故事,逐步展开介绍各个阶段可能遇到的大数据课题、业务需求,以及相对应的技术方案,甚至是实践解析。让读者身临其境,一起来探寻大数据的奥秘。对于想进一步深入研究技术实现细节的读者,也给出了继续阅读的方向和指导性建议。笔者衷心希望,无论是技术专家、产品经理,还是业务人员,只要阅读了本书便都能愉快地遨游在大数据的海洋中。作者:黄申。

《大数据架构商业之路》章节目录
  • 推荐序一
  • 推荐序二
  • 前言
  • 第1章 抉择
  • 第2章 数据收集
  • 2.1 互联网数据收集
  • 2.1.1 网络爬虫
  • 2.1.2 Apache Nutch简介
  • 2.1.3 Heritrix简介
  • 2.2 内部数据收集
  • 2.2.1 Apache Flume简介
  • 2.2.2 Facebook Scribe和Logstash
  • 2.3 本章心得
  • 2.4 参考资料
  • 第3章 数据存储
  • 3.1 持久化存储
  • 3.1.1 Hadoop和HDFS
  • 3.1.2 HBase简介
  • 3.1.3 MongoDB
  • 3.2 非持久化存储
  • 3.2.1 缓存和散列
  • 3.2.2 Memcached和Berkeley DB简介
  • 3.2.3 Redis简介
  • 3.3 本章心得
  • 3.4 参考资料
  • 第4章 数据处理
  • 4.1 离线批量处理
  • 4.1.1 Hadoop的MapReduce
  • 4.1.2 Spark简介
  • 4.1.3 Hive简介
  • 4.1.4 Pig、Impala和Spark SQL
  • 4.2 提升及时性:消息机制
  • 4.2.1 ActiveMQ简介
  • 4.2.2 Kafka简介
  • 4.3 在线实时处理
  • 4.3.1 Storm简介
  • 4.3.2 Spark Streaming简介
  • 4.4 本章心得
  • 4.5 参考资料
  • 第5章 信息检索
  • 5.1 基本理念
  • 5.2 相关性
  • 5.2.1 布尔模型
  • 5.2.2 基于排序的布尔模型
  • 5.2.3 向量空间模型
  • 5.2.4 语言模型
  • 5.3 及时性
  • 5.4 与数据库查询的对比
  • 5.5 搜索引擎
  • 5.5.1 Web搜索中的链接分析
  • 5.5.2 电子商务中的商品排序
  • 5.5.3 多因素和基于学习的排序
  • 5.5.4 系统框架
  • 5.5.5 Lucene简介
  • 5.5.6 Solr简介
  • 5.5.7 Elasticsearch简介
  • 5.6 推荐系统
  • 5.6.1 推荐的核心要素
  • 5.6.2 推荐系统的分类
  • 5.6.3 混合模型
  • 5.6.4 系统架构
  • 5.6.5 Mahout
  • 5.7 在线广告
  • 5.7.1 在线广告的类型
  • 5.7.2 广告投放机制
  • 5.7.3 广告的拍卖机制
  • 5.7.4 广告系统架构
  • 5.8 本章心得
  • 5.9 参考资料
  • 第6章 数据挖掘
  • 6.1 基本理念
  • 6.2 数据的表示和预处理
  • 6.2.1 数据的表示
  • 6.2.2 数据的预处理
  • 6.3 机器学习算法
  • 6.3.1 监督学习——分类
  • 6.3.2 监督学习——回归
  • 6.3.3 非监督学习——聚类
  • 6.4 挖掘工具
  • 6.4.1 Mahout简介
  • 6.4.2 R简介
  • 6.5 本章心得
  • 6.6 参考资料
  • 第7章 效能评估
  • 7.1 效果评估
  • 7.1.1 离线评估
  • 7.1.2 非离线的评估
  • 7.2 性能评估
  • 7.2.1 计算复杂度
  • 7.2.2 应用系统性能
  • 7.2.3 JMeter工具
  • 7.3 本章心得
  • 7.4 参考资料
  • 第8章 大数据技术全景
  • 第9章 商品太多啦!需要搜索引擎
  • 9.1 业务需求
  • 9.2 产品设计和技术选型
  • 9.3 实现方案
  • 9.3.1 数据定义和配置
  • 9.3.2 集群搭建
  • 9.3.3 DIH配置
  • 第10章 能否更主动?还需要推荐引擎
  • 10.1 业务需求
  • 10.2 产品设计和技术选型
  • 10.3 实现方案
  • 10.3.1 基于内容特征的衡量
  • 10.3.2 基于行为特征的衡量
  • 10.3.3 提供在线服务
  • 第11章 这样做的效果如何
  • 11.1 业务需求
  • 11.2 产品设计和技术选型
  • 11.3 实现方案
  • 11.3.1 行为数据的定义和记录
  • 11.3.2 Flume和HDFS的集成
  • 11.3.3 通过Hive进行分析
  • 11.3.4 Kafka和Storm的集成
  • 第12章 这个搜索有点逊
  • 12.1 业务需求:还要搜得更多
  • 12.2 “还要搜得更多”:产品设计和技术选型
  • 12.3 “还要搜得更多”的方案实现
  • 12.3.1 HBase的部署
  • 12.3.2 HBase和Solr的集成
  • 12.4 业务需求:还要搜得更准
  • 12.5 “还要搜得更准”:产品设计和技术选型
  • 12.5.1 提升搜索排序的相关性
  • 12.5.2 提升搜索排序的整体效果
  • 12.6 “还要搜得更准”的方案实现
  • 12.7 业务需求:还要更快
  • 12.8 还要“变”得更快:产品设计和技术选型
  • 12.9 还要“搜”得更快:产品设计和技术选型
  • 12.10 业务需求:给点提示吧
  • 12.11 给点提示吧:产品设计和技术选型
  • 第13章 支持更高效的运营
  • 13.1 业务需求:互联网时代的CRM
  • 13.2 互联网时代的CRM:产品设计和技术选型
  • 13.3 业务需求:抓住捣蛋鬼
  • 13.4 抓住捣蛋鬼:产品设计和技术选型
  • 13.4.1 识别分类错放
  • 13.4.2 识别SEO作弊
  • 13.5 业务需求:销售之战
  • 13.6 销售之战:产品设计和技术选型
  • 13.6.1 设置合理的价格
  • 13.6.2 识别黄牛
  • 后记
版权免责声明
《大数据架构商业之路》为网络收集或网友自行上传,本站不对内容负责,《大数据架构商业之路》版权归原作者所有,仅供学习交流,请勿商业使用,本站不提供任何下载,储存服务,如无意侵犯了你对《大数据架构商业之路》的版权,请联系我们,我们将在第一时间删除相关内容!