matlab中小球不落地的示例分析-快上网网站建设公司

matlab中小球不落地的示例分析

小编给大家分享一下matlab中小球不落地的示例分析，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！

为企业提供网站设计制作、成都网站建设、网站优化、全网营销推广、竞价托管、品牌运营等营销获客服务。成都创新互联拥有网络营销运营团队，以丰富的互联网营销经验助力企业精准获客，真正落地解决中小企业营销获客难题，做到“让获客更简单”。自创立至今，成功用技术实力解决了企业“网站建设、网络品牌塑造、网络营销”三大难题，同时降低了营销成本，提高了有效客户转化率，获得了众多企业客户的高度认可！

训练1000次之后的agent效果

在利用之前FrozenLake环境训练当中那种面向对象方式管理程序时发现训练后期运行速度变慢、而且是肉眼可观察到的变慢，所以采用了matlab另一种程序文件管理方式packages

以+和名称命名文件夹形成一个包、在包内可以新建函数或者前面用到的class

这里就直接使用函数文件、调用函数时需要写明包的名字、比如env.step()

可以观察到在训练1000后运行速度也不会出现肉眼可见的变化

这种方式比起面向对象模式简单游戏环境搭建要更容易上手

在传参和调用的时候采取结构体变量存储原先的对象参数、也就是原先那种一个文件夹下十几个函数文件一个main文件模式下的全局变量、比如

function self = step(self,action)

% 一步动作

self.done = 0;

self.reward=0;

temp_w=self.agent(5)+5*(2-action);

if temp_w<5

temp_w=5;

end

if temp_w>25

temp_w=25;

end

self.reward=0;

ballPos = self.observation(1:2);

ballVel = self.observation(3:4);

if ballPos(1) > self.weight

ballPos(1) = self.weight;

ballVel(1) = -ballVel(1); % 边界

elseif ballPos(1) < 0.1

ballPos(1) = 0.1;

ballVel(1) = -ballVel(1);

elseif ballPos(2) >= self.height

ballPos(2) = self.height;

ballVel(2) = -ballVel(2); % 顶部墙

self.score=self.score+1;

elseif ballPos(2) < 1

if abs(self.agent(5) - ballPos(1)) <= 5 % 底部方块

ballVel(2) = -ballVel(2);

self.reward=10;

else % 方块没接住球

self.reward=-1;

self.done=1;

end

ballPos = ballPos + ballVel;

self.observation=[ballPos;ballVel;temp_w];

end

这是agent执行一个动作的函数、把这个环境中所以变量存储在self参数中、在env.step(env,A)中传递进来、最后再返回出去

对比原先的oop模式、可以看出就是再传参的时候显式的传入整个环境

matlab强化学习Q-Learning与Sarsa对比

matlab强化学习Sarsa与Sarsa(lambda)对比

最后就是这个训练程序了、依然采用q-table、所以没有太多变化、将之前提出的几个优化想法都加进来

% 强化学习

ccc

% rng('default');

env0=env.single_pong(30,30,0.001);

single_pong_rl=rl.rl_q_table(env0.actions,0.9,0.2,0.9);

fig.fig=figure(1);

fig.base=0;

for episode =1:env0.max_episodes*1

fig.show = ~mod(episode,1);

env0=env.reset(env0);

fig=env.render(env0,fig);

while 1

A = rl.choose_action(single_pong_rl,env0.agent);

env0 = env.step(env0,A); % 采取动作获得状态和奖励

single_pong_rl=rl.learn(single_pong_rl,env0, A); % 更新

rl.dump(single_pong_rl,fig.show);

env0.agent=env0.observation;

fig=env.render(env0,fig);

if env0.done

break

end

clear fig A episode

close all

save(filename);

以上是“matlab中小球不落地的示例分析”这篇文章的所有内容，感谢各位的阅读！相信大家都有了一定的了解，希望分享的内容对大家有所帮助，如果还想学习更多知识，欢迎关注创新互联行业资讯频道！

分享题目：matlab中小球不落地的示例分析
标题链接：http://cdkjz.cn/article/jhcegg.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

matlab中小球不落地的示例分析

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

业务热线：400-028-6601 / 大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

matlab中小球不落地的示例分析

相关资讯

如何进行直播运营,直播平台推广步骤分享

全网短视频费用如何营销,如何做短视频营销

卖场抖音代运营是什么职位

如何运用短视频来运营公司

短视频动漫运营

专业短视频代运营是啥意思(如何评估短视频代运营指标-优店之家短视频代运营)

昆明短视频公司运营模式

高明短视频运营团队

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

业务热线：400-028-6601 / 大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

业务热线：400-028-6601 / 大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接