爽死你个放荡粗暴婬货_亚洲v?高清中文字幕_玉女福利视频导航_91香蕉视频在线_久久精品无码一区二区三区毛片_三级片自拍视频_在线观看网站人成亚洲小说_国产精品亚洲欧美综合网站_日本a级作爱片口爱_2021国产剧情a在线

課程

課程介紹

Pytorch深度學習入門,介紹強化學習框架,ReinforcementLear技術(shù)在系統(tǒng)控制環(huán)節(jié)中的作用,各類強化學習模型的實戰(zhàn)應(yīng)用,提升職業(yè)技能。

培訓對象

計算機相關(guān)專業(yè)??票究圃谛I?,或理工科本科,且至少熟悉一門編程語言;
Java 開發(fā)工程師、機器學習工程師、機器學習開發(fā)工程師、機器學習算法工程師、 數(shù)據(jù)科學家、人工智能工程師、人工智能應(yīng)用工程師、人工智能應(yīng)用開發(fā)工程師、應(yīng)用架構(gòu)高級工程師、人工智能產(chǎn)品經(jīng)理;

課程收益

通過實戰(zhàn)案例的講解,使學員了解強化學習和深度學習(Pytorch)的知識和技能。

知識概要

— 初識深度學習;
— 強化學習部分;

課程大綱

模塊

學習內(nèi)容

第一天

初識深度學習

概念與術(shù)語(人工智能、強化學習、深度學習)

Python環(huán)境安裝

什么是RL

如果準備Pytorch環(huán)境

Window或linux環(huán)境下的準備工作

實現(xiàn)第一個神經(jīng)網(wǎng)絡(luò),詳解神經(jīng)網(wǎng)絡(luò)的組成部分

向量化,值歸一化

處理缺失值,過擬合與欠擬合

權(quán)重正則化,Dropout使用

第二天

強化學習部分

什么是MDP 馬科夫決策過程

如何進行動態(tài)編程

蒙特卡洛方法

連續(xù)狀態(tài)過程

N步-Bootstrap

強化學習和神經(jīng)網(wǎng)絡(luò)的整合

Deep Sarsa過程

Deep Q-learning

高級Actor-Critic A2C的使用

認證過程

無認證考試

開班信息

暫無開班信息