📕书籍信息
- 书名:集体智慧编程
- 作者:[美] Toby Segaran
- 豆瓣评分:⭐8.9
- 出版社:电子工业出版社
- isbn:9787121075391
- 出版日期:2009-1
- 价格:59.80元
- 豆瓣:集体智慧编程
🌵内容简介
【编辑推荐】:
本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。
本书是Web开发者、架构师、应用工程师等的绝佳选择。
📣听过的人说…
- 🌞: 翻译减分,有很多句子在原文里清晰简单,被翻译得莫名其妙。作者这种从零开始自己写决策树的精神是很伟大的,值得学习。
- 🌞: 很实用,内容有些过时
- 😗: 内容丰富,实践性极强。
📑书籍章节
- 前言
- 第1章 集体智慧导言
- 什么是集体智慧
- 什么是机器学习
- 机器学习的局限
- 真实生活中的例子
- 学习型算法的其他用途
- 第2章 提供推荐
- 协作型过滤
- 搜集偏好
- 寻找相近的用户
- 推荐物品
- 匹配商品
- 构建一个基于del.icio.us的链接推荐系统
- 基于物品的过滤
- 使用MovieLens数据集
- 基于用户进行过滤还是基于物品进行过滤
- 练习
- 第3章 发现群组
- 监督学习和无监督学习
- 单词向量
- 分级聚类
- 绘制树状图
- 列聚类
- K-均值聚类
- 针对偏好的聚类
- 以二维形式展现数据
- 有关聚类的其他事宜
- 练习
- 第4章 搜索与排名
- 搜索引擎的组成
- 一个简单的爬虫程序
- 建立索引
- 查询
- 基于内容的排名
- 利用外部回指链接
- 从点击行为中学习
- 练习
- 第5章 优化
- 组团旅游
- 描述题解
- 成本函数
- 随机搜索
- 爬山法
- 模拟退火算法
- 遗传算法
- 真实的航班搜索
- 涉及偏好的优化
- 网络可视化
- 其他可能的应用场合
- 练习
- 第6章 文档过滤
- 过滤垃圾信息
- 文档和单词
- 对分类器进行训练
- 计算概率
- 朴素分类器
- 费舍尔方法
- 将经过训练的分类器持久化
- 过滤博客订阅源
- 对特征检测的改进
- 使用Akismet
- 替代方法
- 练习
- 第7章 决策树建模
- 预测注册用户
- 引入决策树
- 对树进行训练
- 选择最合适的拆分方案
- 以递归方式构造树
- 决策树的显示
- 对新的观测数据进行分类
- 决策树的剪枝
- 处理缺失数据
- 处理数值型结果
- 对住房价格进行建模
- 对“热度”评价进行建模
- 什么时候使用决策树
- 练习
- 第8章 构建价格模型
- 构造一个样本数据集
- k-最近邻算法
- 为近邻分配权重
- 交叉验证
- 不同类型的变量
- 对缩放结果进行优化
- 不对称分布
- 使用真实数据——eBay API
- 何时使用k-最近邻算法
- 练习
- 第9章 高阶分类:核方法与SVM
- 婚介数据集
- 数据中的难点
- 基本的线性分类
- 分类特征
- 对数据进行缩放处理
- 理解核方法
- 支持向量机
- 使用LIBSVM
- 基于Facebook的匹配
- 练习
- 第10章 寻找独立特征
- 搜集一组新闻
- 先前的方法
- 非负矩阵因式分解
- 结果呈现
- 利用股票市场的数据
- 练习
- 第11章 智能进化
- 什么是遗传编程
- 将程序以树形方式表示
- 构造初始种群
- 测试题解
- 对程序进行变异
- 交叉
- 构筑环境
- 一个简单的游戏
- 更多可能性
- 练习
- 第12章 算法总结
- 贝叶斯分类器
- 决策树分类器
- 神经网络
- 支持向量机
- k-最近邻
- 聚类
- 多维缩放
- 非负矩阵因式分解
- 优化
- 附录A:第三方函数库
- 附录B:数学公式
- 索引
⏏️必读理由
**挖掘网络智慧:解密数据宝藏**
在这个信息爆炸的时代,数据成为了我们探索世界、洞察趋势的珍贵资源。而《集体智慧编程》以其深入浅出的方式,向读者揭示了如何利用机器学习与计算统计的工具,探索并利用Web上的海量数据。
**详细具体:** 本书不仅介绍了协作过滤技术,实现了关联产品推荐的功能,还深入探讨了集群数据分析、搜索引擎核心技术、贝叶斯过滤技术等多个领域。通过学习本书,读者将掌握从爬虫到决策树,从社交网络到人工智能的一系列技术,助力他们更好地分析用户体验、市场趋势等信息,并从中得出有用的结论。
**关联读者需求:** 无论你是一位Web开发者,还是一个应用工程师,本书都将是你的良师益友。对于想要深入了解数据挖掘与分析的人士,它提供了丰富的知识和实用的技术。对于那些希望在数字化时代掌握先机的企业家和决策者,它更是一本不可多得的指南。
**推荐类似书籍:**
1. 《数据智能:从零开始的数据科学》- Joel Grus。提供了入门级到中级水平的数据科学教程,适合想要从基础开始学习的读者。
2. 《深度学习》- Ian Goodfellow、Yoshua Bengio、Aaron Courville。深入探讨了深度学习领域的基础理论与实践技巧,适合对人工智能感兴趣的读者。
评论(0)