内容简介

MADlib是一套SQL中的大数据机器学习库。通常SQL查询能发现数据最明显的模式和趋势,但要想获取数据中最为有用的信息,需要的则是一套牢固扎根于数学和应用数学的技能,这就是机器学习。如果将SQL的简单易用与MADlib机器学习的复杂算法结合起来,就能实现简单的机器学习功能。

本书分为11章,从MADlib的基本概念、MADlib的架构、支持的模型类型与功能入手,详细解析MADlib各种模型的具体用法,包括数据类型、矩阵分解、数据转换、数据探索、主成分分析、回归、时间序列分析、分类、聚类、关联规则、图算法、模型评估等。每种模型将从背景知识、函数语法、应用示例三方面进行说明。

本书适合MADlib机器学习的初学者、想学习MADlib机器学习的DBA以及从事数据分析与挖掘的高级技术人员阅读,也适合高等院校与培训学校相关专业的师生教学参考。