[启元星际AI若干问题答疑] 社区新闻

StarcraftAI 启元星际AI 2020-6-22 20:00 25724

最新回复 (132)
全部楼主
  • 郁小刚 猛男
    3 举报 91
    其实没什么,就是想让大佬发一下replay 我们都想学习一下启元AI的打法。
    2020-6-22 21:31 回复
  • 青菜 精英猛男
    11 举报 92

    心疼楼主,连 AI 不是脚本都需要专门出来解释

    然而网民站边是不靠逻辑的,所以讲道理的效果有限,当然总好过不讲道理。针对楼上那么多人的平均EPM的问题,楼主可以像Deepmind论文里那样提供一个 AI 与 TIME 的 EPM 分布对比图,按常理说,启元的EPM分布和AlphaStar应该是类似的,和人类选手EPM的分布特征也是类似的,所以不存在什么“我和马云平均一下财产”这种事

    不过归根结底,想逆转现在星际圈的舆论风向只能像 Deepmind 那样赶紧迭代产品,最终拿出一个闭嘴级别的作品。

    2020-6-22 21:42 收起回复
    bitterblossom: 我觉得as让我相信它和人类类似的原因是tlo的说明,就算有epm和apm分布,你能说第四盘是人能打出来的操作吗?既然人打不出这样的操作,就应该对它进行限制。当然如果你不认为这种操作会改变基于人类操作的平衡性设计当我没说。
    2020-6-23 00:39回复
    青菜: 回复 bitterblossom: 多线起飞是因为他在全图操作,这和初代AlphaStar一样,当时AlphaStar也打出了一个人类做不到的大包夹。TLO 做那些说明的时候已经发Nature了,是成熟版的AlphaStar
    2020-6-23 00:41回复
    bitterblossom: 回复 青菜: 我想表述的意思是epm和apm不是根本,根本是这些操作对人类来说的可行性。当然我没有说这不是ai之类的意思,我只是觉得现在揪着epm和apm不放忘记了最关键最根本都问题在于不做出非人类的操作。
    2020-6-23 00:48回复
    青菜: 回复 bitterblossom: 我反驳的也是前面一堆人的和马云平分资产的说法,暗示启元是骗子,EPM平均很低,实际多数时候很高的说法。至于你说的这些,他们后续的版本迭代肯定会改进的,就像当时Deepmind一样,没有人会说全图操作就是应该的,只是告诉你那些多线和阴谋论无关,纯粹是全图操作和并不算低的APM造成的
    2020-6-23 00:51回复
  • 猛男东旭黄 精英猛男
    0 举报 93
    会火 前排出售瓜子点心 小板凳
    不过我有个小疑问,像阿尔法星设置了大约340ms的延迟,启元有设置延迟吗,另外交战过程中的epm是多少?至少昨天双狗复盘的时候就有300多甚至超过400的时候了
    2020-6-22 21:46 回复
  • 0 举报 94
    我要是time,第二吧就野全家,弄死你
    2020-6-22 21:51 收起回复
    qq223ok: 没用的,野全家又怎么样,你打了人家经济,只要没完全打死,人家能东山再起,AI的运营太好了,不是正常人能做到的
    2020-6-22 23:16回复
  • 雨涯 猛男
    1 举报 95
    如果是AI摸索出来,不要求有多强,能采矿造兵能进行简单的应对都算是成果,这个大家应该是肯定的。
    土豆明那两把AI表现优秀,对战time的两把AI表现就比较过分了,主要依靠远快于人类的速度赢得比赛
    对“智能”体现得不够,就像一个人武功再精妙也打不过一只大猫
    这个论坛的人都看得懂录相的,epm骗骗外行就行了
    2020-6-22 21:58 回复
  • 青色学者 二五仔
    1 举报 96
    我也不知道为啥都说屏外操作,明明用的都是暴雪给的api啊,不然怎么模拟
    2020-6-22 22:01 回复
  • 雨涯 猛男
    0 举报 97
    其实看完土豆明那两把,我在想这AI简化后,投进游戏里是极好的,看起来像是有逻辑,有一点像是游戏理解的
    在time的对战中,前五分钟启元表现得极好,宛如高智能,在之后就表现的像力速双A的智障,
    可能是算力或者学习不够吧,参数找个懂星际的人调调
    2020-6-22 22:08 回复
  • 0 举报 98
    请问第四盘的apm和epm是多少
    2020-6-22 22:10 回复
  • 2 举报 99
    你现在来论坛给几个“穷打星际的”人解释半天,让人家昨天帮你吹《投资》《做AI的会管你打星际的?》的这些怎么脸往哪搁啊
    2020-6-22 22:15 回复
  • LICH 猛男
    1 举报 100
    放replay出来堵住大家的嘴啊
    2020-6-22 22:16 收起回复
    NorthCross: replay放出来你也不会用你信不信
    2020-6-22 22:38回复
    LICH: 回复 NorthCross: 你猜如果有replay我拿来是不是用来学战术
    2020-6-22 23:12回复
    NorthCross: 回复 LICH: 那现阶段的ai战报来学战术就是搞笑的,那嘉年华上的as的战报来也是搞笑的
    2020-6-23 00:24回复
    会飞的查查: 你能学到东西那就不用AI了,岂不是职业选手学了就是AI了?
    2020-6-23 01:52回复
    还有7条回复,查看
  • 0 举报 101
    所以,你学到了什么?
    2020-6-22 22:39 收起回复
    苍穹神影修: 而且你这ID什么鬼,星际AI?哦呦,高攀不起!
    2020-6-22 22:39回复
  • 1 举报 102
    你学到了吗?
    2020-6-23 00:09 回复
  • Logos 二五仔
    2 举报 103
    这次比赛大家气愤的并不是启元有多差,相反,这次启元说句实话表现还不错,但恶心人的地方是明明靠的算力居多,非要说成算法厉害,大家又都不傻,都能看出来的。
    另外,一直在强调“无效操作”,“apm和epm和人类差不多”,但是实际上呢?人类的无效操作大多为了热手,为了能在关键时刻手不会抽筋僵住,并不是必须存在的,反而导致东施效颦,第一视角在无谓的晃动屏幕,还有一点ai的操作界面问题,由于是全体视角切屏等的操作是不需要的,比如不切屏建建筑、砸矿骡都是存在的,反而切屏成了一种作秀。成了拉低epm的手段,而不是去学习阿尔法星的热点操作,使切屏成为必要的过程。
    最令大家生气的是“你学到了么”,大家感觉到的就是人和车比赛速度,车赢了反而嘲笑你没有四个轮子。
    “无知和弱小不是生存的障碍,傲慢才是”希望这次启元能够好好想清楚这句话。
    2020-6-23 00:42 收起回复
    NorthCross: 那你是没理解什么叫算力什么叫算法。打个比方,现在要造一辆超快的车,DeepMind丛Google那里要来了几万马力的发动机,然后它整了个能用的车壳子和驾驶系统,阻力系数很大,但是车能开而且因为发动机好所以开得飞快。启元搞不到这么好的发动机,只能弄到几百马力的,那它就只能优化造型,在保证车能开的前提下把阻力系数和车重降到最低,也能开的和DeepMind的车一样快。在这个比喻里,算法就是车的外形设计,算力就是发动机。在算法不是很好的情况下,你有足够的算力也能让模型暴力收敛(DeepMind就经常搞这种事情,搞得大家都没法复现他们的效果)。
    2020-6-23 00:55回复
  • Mind 猛男
    0 举报 104
    在与time的第一局中?说机械化epm不如说说第二局生化?然后再把省去的切屏epm加上来看看?还有100ms的反应时间是想表达什么,表达你们的f1方程式只有200码还达不到光速?
    2020-6-23 00:54 回复
  • ACCUM 拟态猛男
    1 举报 105
    赢了选手,但少了英雄惜英雄的环节,观众炸了。
    下次可以限制屏内信息和切屏间隔,再加一点延迟。
    毕竟切屏也是操作。。
    祝你们你好运,早日出成果吧。
    2020-6-23 00:58 回复
  • 尼娅还有大家 精英猛男
    0 举报 106
    话说在训练过程中,无效操作为什么会一直保留着。。。。想不通
    2020-6-23 01:14 回复
  • LuckyCB 二五仔
    0 举报 107
    算了啊,启元哥,这样对线是对不完的
    2020-6-23 01:26 回复
  • 2 举报 108

    我有个偏技术向的问题想请教一下,不知道能否回答一下?

    首先,我对深度学习也只是了解过一些皮毛,也许问题本身就存在问题或者有一些用词错误,希望不影响我表达的意思……


    我的疑问是这样的:

       1:比如星际这种比较复杂的游戏,由AI自我对战训练出来的策略网络基本可以理解成一个“黑盒”,即使是开发者也并不清楚AI在这种情况下为什么会做出这个决策。  训练时间(次数)足够长之后,策略网络应该会收敛于一个局部最优解

            那么这个收敛域局部最优解的策略网络在实际对战中,对于几乎相同的局面(输入信息)给出的决策应该是几乎不变的,但是我看到在几盘对战中,在AI的视野范围内出现人类玩家的第1个敌对单位之前,前期采用的打法就已经出现了分歧,这是如何实现的?  是完全没有人为干扰的情况下,AI自我对弈训练出的策略网络给出的当前局面的最佳应对吗?  为什么在局面相同的情况下会出现不同的打法呢?


       2:当前现场你们说过有200多钟打法。   但是这个策略网络本身是一个“黑盒”过程,你们是如何知道AI是有200多钟打法的呢?  按我的理解,训练出来的这个策略网络是不存在有多少种“打法”的概念的,只会针对当前局面给出现在的最佳应对策略。 

          还是说你们已经可以“破解”这个“黑盒”了,知道内部是如何运转的?


       3:针对上面2个问题,我还想到了另外一种可能的解释: 那就是你们完全独立的训练了比如1000多个AI,而这些AI在训练初期因为偶然的随机性因素导致策略网络收敛域完全不同的“局部最优解”,相当于这1000多个AI的策略网络在面对相同的局面时有各自认为的最优打法(但都是互不相同的),因此这相当于有1000多种打法。   然后你们挑选了其中比较优秀的200多个策略网络封装成一个运行程序,人为设定每次开始时随机调用其中1种,这便是我们看到的AI在每盘开局都使用不同打法的原因?



    希望能解释一下我的疑惑。。

         


    ==================

    再补充一个问题:

       4:启元星际AI是否学习过人类选手(或暴雪自带的电脑)的对战replay呢(类似alphago那样)? 还是完全从0开始自我对弈的呢(类似alphazero那样)? 

            如果是后者,那么我比较好奇这个数据:AI是在训练了多少万盘之后学会的“开局有50块钱需要第一时间造一个SCV”?  



    最后于 2020-6-23 09:43 被复城国际孙一峰编辑 ,原因:
    2020-6-23 02:08 收起回复
    复城国际孙一峰: @StarcraftAI 可以回答一下我的疑问吗?谢谢了~
    2020-6-23 13:36回复
  • spectrum_ 二五仔
    2 举报 109
    “为方便观众观看AI的第一视角,我们通过后处理的方式添加了部分镜头的移动,但这不会对AI的训练和决策产生任何影响。”
    什么叫通过后处理的方式?镜头移动需要时间,AI实际对战有这个移屏延迟吗?

    而且逻辑上应该是先移屏,才能做决策,而不是先知道做怎么决策,再假装移动屏幕。

    2020-6-23 02:21 收起回复
    四大仇人驻kaizitv办事员: 就是移给下面的观众看看假装会移罢了
    2020-6-23 07:38回复
    新宿優等生: 看着ai主视角晃的不行不像人为添加的…
    2020-6-23 10:11回复
  • 法人抽奖小号 精英猛男
    1 举报 110
    你把rep放出来不就好了,说这么多又不敢放rep,你让大家怎么信你的说辞?
    2020-6-23 02:32 回复
  • 凉月 精英猛男
    0 举报 111
    兄弟,发篇论文就啥都说清楚了,我会去看的
    2020-6-23 02:37 回复
  • weiliango 猛男
    0 举报 112
    开赛前就应该讲清楚的。这样至少主持人不需要一遍遍重复“不赖皮”,李培楠也用不着一遍遍“电脑反应有点快”。
    2020-6-23 05:24 回复
  • fclxt2357 精英猛男
    0 举报 113
    别BB,贴出论文精英二五仔会来帮你对线的让喷子闭嘴的
    2020-6-23 06:16 回复
  • LouisBourbon 猛男
    1 举报 114
    骗子们不先回答一下你们全程欺骗选手和观众是怎么回事吗?
    2020-6-23 07:26 回复
  • pioneer 精英猛男
    0 举报 115
    突然想起来为什么你们宣传time是18年黄金总决赛冠军,他19年明明也是啊,为什么不挑近的(
    2020-6-23 07:54 回复
  • LouisBourbon 猛男
    1 举报 116
    就硬洗是吧,当别人是傻子吗?
    目前,启元AI和AlphaStar一代类似,都是全屏操作(AlphaStar最终版虽然移动镜头,但依然可以进行屏外操作)。启元AI没有学习移动镜头,为方便观众观看AI的第一视角,我们通过后处理的方式添加了部分镜头的移动,但这不会对AI的训练和决策产生任何影响。

    Like human players, this version of AlphaStar chooses when and where to move the camera, its perception is restricted to on-screen information, and action locations are restricted to its viewable region.

    你说的初版阿老师是最早的实验版本,公布的第一版就已经加上切屏和屏内操作了,你个全图操作的作弊软件有啥洗的
    2020-6-23 08:18 收起回复
    新宿優等生: as天梯版本就是因为无法屏外操作 只能总屏幕视角获取信息所以as是不可能打出三线有反应的多线操作… 假如启元不是依靠屏外操作的话,他这个长时间三线空投根本打不出来
    2020-6-23 10:15回复
  • schwarzeni 二五仔
    0 举报 117
    2020-6-23 08:25 回复
  • 秋小栀大魔王 混元体猛男
    5 举报 118
    这个帖子楼主就没正面回复过,属实打擦边球发帖,想堵住星际粉丝的嘴巴而已,你就别说什么拟人了,老老实实承认不足有问题吗?不就是为了吸引人家投资嘛,我们星际玩家又不是不讲理的人,你说是吧。何必又当又立呢?
    而且你这种发帖完全有点洗白越洗越黑的意思了,自己rep不肯发,用各种理由搪塞,人家阿老师的rep都能发凭什么你们就不能发?还是你们真的有猫腻??有点阴谋论的意思了噢
    2020-6-23 08:44 回复
  • 0 举报 119
    我只想问一个问题,为什么打的时候不给ob位,只给TIME的视角
    2020-6-23 08:46 回复
  • TAK 精英猛男
    0 举报 120
    1000APM的时候 我头看晕了 这是人类能做到的?
    2020-6-23 09:20 回复
返回