
会员
大数据搜索引擎原理分析
更新时间:2019-07-25 11:56:30 最新章节:致谢
书籍简介
本书是畅销书升级版,向读者提供了一套完整的大数据时代背景下的搜索引擎解决方案,详尽地介绍了搜索引擎的技术架构、算法体系及取得的成果,并以模块化的方式进行组织。本书着重介绍了机器学习在搜索引擎中的应用,包括中文分词、聚类、分类等核心的机器学习算法,并结合示例加以介绍和分析,使读者可以更好地理解机器学习在搜索引擎中的价值;同时,阐述了大数据给搜索引擎带来的新特性,结合目前大数据分析的主流工具,在搜索引擎中构建知识图谱,以及进行日志反馈学习,可以使得搜索引擎更加智能。本书不仅适合作为互联网行业从业者的技术参考书,也适合作为搜索引擎爱好者的参考读物。
上架时间:2018-11-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
刘凡平编著
最新上架
- 会员本书内容分3个部分共12章。第1-4章主要介绍什么是数据分析,以及Python的编程环境和基础语法知识。第5-9章主要介绍数据处理和分析的各种方法。第10-12章介绍了如何结合Python与Excel在实际工作中进行数据处理与分析操作。计算机8.5万字
- 会员本书较全面地介绍了MySQL数据库的基础知识及其应用。本书共11章,包括数据库基础,MySQL的安装与配置,数据库的基本操作,数据表的基本操作,表数据的增、改、删操作,数据查询,视图,索引,存储过程与触发器,事务,数据安全等内容。本书采用案例教学方式,每章以应用实例的方式阐述知识要点,再通过实训项目分析综合应用,最后辅以思考与练习巩固所学知识。应用实例、实训项目、思考与练习这3个部分分别采用3个不计算机7.8万字
- 会员本书共5篇,分为14章介绍了PowerBI的基本操作、数据导入、数据整理、数据建模、数据可视化分析、数据发布等相关技能。第1篇为基础入门篇(第1-3章),主要针对初学者,从零开始,系统且全面地讲解了PowerBI的入门知识点、基本操作及数据的输入和连接操作。第2篇为数据处理篇(第4-6章),介绍了PowerBI数据的整理操作、表格中行/列数据的管理,以及PowerBI数据的高级处理、M函数的使计算机0字
- 会员本书本书基于业务问题,就如何搭建分析框架,厘清分析思路,按照标准分析步骤对数据进行怡当的预处理,选择合适的分析方法和分析模型,使用恰当的分析工具对数据进行分析,以及对分析结果进行可视化和符合业务要求的解读等内容展开讲解,帮助业务专家做出合适的业务判断,制定准确的业务策略。计算机13万字
- 会员数据挖掘算法为大数据与人工智能的核心,掌握数据挖掘各算法的编程实现,有助于提升大数据的实践运用能力。本书详细阐述了数据挖掘常用算法与编程实现,同时,本书以多个经典的数据挖掘赛题为案例,详细论述了数据预处理、特征选择、可视化、算法选择等全流程数据挖掘过程的编程实现,有助于提升读者面对实际数据问题时灵活运用各类算法能力。计算机4.7万字
- 会员《网络科学与网络大数据结构挖掘》作为网络科学的工具性图书共分两大模块:第一模块是基础理论,包括网络基本概念、网络拓扑性质、复杂网络社团挖掘等内容,旨在让读者熟悉一些基本的建模方法和分析技巧。第二模块为应用模块,包括复杂网络在几个代表性领域中的应用研究分析及案例剖析等。全书没有过多地数学和物理推导,而是更为关注网络科学的思维习惯和研究方式,兼具理论性、资料性和实践性。可用于各学科领域的教学及研究人员计算机0字
- 会员本书分为4篇,第1篇是基础入门篇,主要介绍数据分析与挖掘的基本概念及Python语言的数据分析基础;第2篇是数据分析篇,主要介绍常用的数据分析方法;第3篇是数据挖掘篇,主要介绍常用的数据挖掘方法;第4篇是实战应用篇,介绍两个完整的数据分析与挖掘案例。计算机10.9万字
- 会员这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。计算机14万字
同类书籍最近更新
- 会员本书采用“问题描述+解决方案”模式,通过500个案例介绍了使用Pandas进行数据分析和数据处理的技术亮点。全书共分为8章,主要案例包括:读写CSV、Excel、JSON、HTML等格式的数据;根据行标签、列名和行列数字索引筛选和修改数据,使用各种函数根据数据大小、日期范围、正则表达式、lambda表达式、文本类型等多种条件筛选数据;统计NaN(缺失值)的数量、占比,根据规则填充和删除NaN;在D数据库10.9万字
- 会员本书从大数据实时计算框架Spark的编程语言Scala入手,第1~4章重点介绍函数式编程语言Scala的基础语法、面向对象编程以及函数式编程等,再通过编程训练案例介绍Scala这门语言的实际开发应用,为读者后面学习Spark框架打下牢固的编程基础。第5~10章重点介绍Spark的安装部署、SparkCore编程、SparkSQL结构化数据处理以及SparkStreaming实时数据处理等,对它们进数据库8.2万字
- 会员本书主要介绍数据洞察及其四个阶段,第1部分为自助服务数据发现,包括元数据目录服务、搜索服务、特征存储服务、数据迁移服务、点击流跟踪服务。第二部分为自助服务数据准备包括数据湖管理服务、数据整理服务、数据权限治理服务。第三部分为自助服务数据构建,包括、数据虚拟化服务、模型训练服务、持续集成服务、A/B测试服务。第四部分为自助服务数据实施,包括查询优化服务、管道编排服务、模型部署服务、质量监控服务、成本数据库12.7万字
- 会员Web3.0深刻地变革了数据存储的方式,使个人数据和隐私得到了充分的保障,是实现元宇宙的重要保障。本书深入浅出地介绍了Web3.0和分布式存储技术,深入探讨了数据存储、区块链最新技术发展与产业应用,以及分布式计算等内容,带来关于Web3.0应用与发展的新思路。数据库7.9万字