强化学习:原理与Python实战在线阅读
会员

强化学习:原理与Python实战

肖智清
开会员,本书免费读 >

计算机网络人工智能17.2万字

更新时间:2023-10-19 17:44:38 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强
    肖智清程序设计12.2万字

同类热门书

最新上架

  • 会员
    本书面向初学者介绍智能计算的相关概念、典型应用,采用研究性学习方法和P-MASE模型,按照引入问题、寻找方法、问题分析、问题求解、效果评价的模式,讲授智能计算编程、数据获取和预处理、数据可视化、预测数据的值、分类问题、聚类分析、神经网络、智能图像识别、时间序列数据的处理等知识,并给出了两个综合案例。本书深入浅出、案例丰富、可操作性强,适合作为高校智能计算相关课程的入门教材,也适合相关技术人员学习参
    李敏 赵宏 李兴娟主编计算机10.1万字
  • 会员
    这是一本系统梳理并深入解析大模型的基础理论、算法实现、数据构造流程、模型微调方法、偏好对齐方法的著作,也是一本能手把手教你构建角色扮演、信息抽取、知识问答、AIAgent等各种强大的应用程序的著作。本书得到了零一万物、面壁智能、通义千问、百姓AI、澜舟科技等国内主流大模型团队的负责人的高度评价和鼎力推荐。具体地,通过本书你能了解或掌握以下知识:(1)大型语言模型的基础理论,包括常见的模型架构、领
    刘聪 沈盛宇 李特丽 杜振东计算机11.2万字
  • 会员
    本书由中科院计算所、软件所的专家学者倾心写就,以“图像风格迁移”应用为例,全面介绍智能计算系统的软硬件技术栈。第2版以大模型为牵引进行更新,第1章回顾人工智能、智能计算系统的发展历程,第2、3章在介绍深度学习算法知识的基础上增加了大模型算法的相关知识,第4章介绍深度学习编程框架PyTorch的发展历程、基本概念、编程模型和使用方法,第5章介绍编程框架的工作原理,第6章回顾深度学习所用的处理器结构从
    陈云霁等编著计算机34.9万字
  • 在人工智能的研究中,既包括对于人类理性思维的模拟,还包括对人类感性思维的计算。本书重点讲述的文本情感分析技术就属于后者。该技术源于自然语言处理领域,但也有别于一般的自然语言处理任务。文本情感分析面向的处理对象是社交媒体中产生的用户评论文本,该文本的特点是带有大量的用户主观情感信息,因此该技术的核心是通过自动分析评论文本来进行情感的理解。文本情感分析技术已有20余年的研究历史,凝聚成了多项研究任务和
    秦兵 赵妍妍 林鸿飞 王素格 徐睿峰计算机23.3万字
  • 会员
    本书根据李宏毅老师“机器学习”公开课中与深度学习相关的内容编写而成,介绍了卷积神经网络、Transformer、生成模型、自监督学习(包括BERT和GPT)等深度学习常见算法,并讲解了对抗攻击、领域自适应、强化学习、元学习、终身学习、网络压缩等深度学习相关的进阶算法.在理论严谨的基础上,本书保留了公开课中大量生动有趣的例子,帮助读者从生活化的角度理解深度学习的概念、建模过程和核心算法细节.
    王琦 杨毅远 江季编著计算机19.5万字
  • 会员
    本书旨在采用一种符合读者认知角度且能提升其学习效率的方式来讲解深度学习背后的基础知识。本书总计9章,深入浅出地介绍了深度学习的理论与算法基础,从理论到实战全方位展开。前三章旨在帮助读者快速入门,介绍了必要的数学概念和必备工具的用法。后六章沿着深度学习的发展脉络,从最简单的多层感知机开始,讲解了深度神经网络的基本原理、常见挑战、优化算法,以及三大典型模型(基础卷积神经网络、基础循环神经网络和注意力神
    瞿炜 李力 杨洁计算机14.8万字
  • 会员
    本书对Python在职场办公领域的应用进行了系统梳理与介绍。全书共12章,第1~6章主要围绕与Python办公自动化相关的基础知识展开;第7~12章包括走进ChatGPT,文件操作自动化,Word、PPT办公自动化,Excel办公自动化,PDF文档操作自动化和邮件发送,数据分析与可视化等内容。本书提供了丰富的案例,并配有相关资源,以增强读者的实战能力。本书内容易学易懂,适合追求高效工作、对办公自动
    杨永刚计算机11.9万字
  • 会员
    本书结合人形机器人研究中各类先进方法,系统地介绍了驱动人形机器人运动的基础知识、推导过程以及应用案例,阐述了人形机器人的运动学、动力学表示方法,解释了ZMP的概念及其与地面反作用力的关系,描述了人形机器人双足行走行为的生成和控制方法,并拓展了其他多种动作的实现方法,最后介绍了动力学建模、仿真和高效动力学的计算方法。
    (日)梶田秀司编著计算机8.7万字
  • 会员
    这是一个“算法世界”:建立在数据之上的算法指导社会的运行、决定我们能在网上看到什么;它更是自动驾驶、智能管家、未来医疗以至智慧城市的基石。如果我们不了解算法如何使用数据,就无法知道人工智能将如何改变我们的生活。通过采访谷歌和剑桥分析公司的数据专家、亲自模拟高科技巨头的算法模型,萨普特带我们直击智能产品背后的秘密、思考数字科技给社会带来的风险。我们对科技和互联网的日益依赖,使数据研究者能够收集与我们
    (瑞典)大卫·萨普特计算机14.8万字

同类书籍最近更新

  • 本书由浅入深地介绍了生成式AI的理论与实践,内容涉及从基础原理到前沿应用,为读者提供了一个系统的认知框架。本书从生成式AI技术的基础工具入手,逐步深入到Transformer模型与GPT的原理和应用,详细介绍了图像生成模型StableDiffusion,以及LangChain与AIAgent的相关知识。书中结合开源代码分析,展示了生成式AI在各行各业的实际应用,并探讨了其在高速发展过程中所面临
    欧阳植昊 梁菁菁 吕云翔主编人工智能11.7万字