Advertisement

2020联合作战智能博弈挑战赛之(十四)初赛

阅读量:

2020年9月22日笔记

在热身赛至初赛期间出现了许多意料之外的情况,在这些意外发生后参赛准备时间大幅缩减使得选手感到虽然精力充沛但却难以应付繁重的任务昨天抽出一刻钟的时间依然无果不过尽管如此通过短暂的努力 somewhat improved the red side并为blue side提供了some strategic approaches于20号用了一个整天的时间加班加点完成了第一版方案即使未来几天再没有可用时间也无需担心在初赛中交白卷

为了能在初赛截止前稍微改进一下工作进度,在凌晨六点左右不得不起床并开始充分利用这段时间来推进工作进度。提升蓝方歼击机补位判断能力的同时也对蓝方飞机编队部署效率进行了优化研究。基于当前局势分析并未对红方北部护卫舰实施空袭计划因此决定暂时未对北半区区域进行空袭任务部署。

优化了一个关键参数以显著提升blue-aircraft survival capacity. 进行了上午8轮游戏后, blue-side won 5 out of 8. 看来虽然red-force possesses a numerical advantage, yet blue-side can still achieve victory by utilizing tailored strategies.

下午时分,在群聊中的一位朋友展示出对机器学习相关算法的专精之处。能够独立设计并训练DQN模型。刚刚参与了一个Kaggle的halite IV竞赛。原本想着邀请他组队参赛,但因报名时间已截止。

晚上提交了第二版,后面不怎么想继续琢磨规则了。

2020年9月25日笔记

这两天单位考评会议所涉及的各项准备工作和提交材料数量繁多导致浪费了两天宝贵的时间接下来的重点将是网络版的深入研究上午主要完成了将之前编写好的几个网络相关文件整合到1.3.2版本中的工作

摸索如何增加待训练目标的特征维度。难点在于如何计算下列语句

复制代码
    self.policy = ActorCriticTrainPolicy(BLUE_OBS_STATE_DIM, ACT_N, config['side'])

该常量BLUE_OBS_STATE_DIM的作用域为3;若需调整训练目标的特征维度,则应在ObsParser类中进行设置

2020年9月26日笔记

对训练预警机这一奖励策略透彻掌握,并认为使用len(obs['qb'])这一选择是合理且有效的做法。因为当某型预警机阵亡时,len(obs['qb'])的确会显著降低数值水平;因此这一奖励机制实际上限制了必须不断提升某类预警机存活能力的要求。

意识到举办方提供的知识体系在实际应用中存在明显不足。为了探索其他的知识体系, 我决定下载与PyTorch相关的软件包。https://download.pytorch.org/

该资源的具体下载路径位于PyTorch官方下载页面

在cmd中切换到torch-0.4.1-cp36-cp36m-win_amd64.whl所在的目录。

然后使用pip3安装指定版本的torch库:torch-0.4.1-cp36-cp36m-win_amd64.whl。当遇到平台不匹配的情况时,程序会抛出一个错误

官网https://pytorch.org/get-started/previous-versions/上的版本涵盖内容丰富。针对CUDA 10.2版本,具体的安装步骤如下:

通过pip管道连接器将这些软件包下载为指定版本,并从指定来源链接下载到指定位置

运行以后可以看到whl文件的下载链接,推荐用迅雷下载,不然速度很慢。

CPU版的安装命令为:

通过pip工具安装这两个PyTorch相关的库,并从指定的下载链接处获取

全部评论 (0)

还没有任何评论哟~