大型科普/教学/交流贴,alphastar剖析 综合

云天青大大 云sp 2020-8-2 07:17 19614

最新回复 (110)
全部楼主
  • 云天青大大 云sp
    0 举报 91
    天长tianchang 好,为了有回帖不那么水,发挥自己的专业领域,决定对着云教授来一发(
    少年你这xp有点奇怪。。。。。。。。
    2020-8-5 12:11 收起回复
    天长tianchang: 略略略
    2020-8-6 12:54回复
  • 牛头五十六 拟态猛男
    0 举报 92
    刚才看黄哥直播的一场tvp中,黄哥的apm为295,对方那个p的apm只有160,但是黄哥可以说被暴打,6分钟直接投降,这就和本文说的更高的apm反而让alphastar变菜了有点相似把,而且p的apm可能是三个族里面相对最低的,所以限制了apm之后alphastar的p胜率远高于剩下俩族
    2020-8-5 20:13 回复
  • 云天青大大 云sp
    0 举报 93
    牛头五十六 刚才看黄哥直播的一场tvp中,黄哥的apm为295,对方那个p的apm只有160,但是黄哥可以说被暴打,6分钟直接投降,这就和本文说的更高的apm反而让alphastar变菜了有点相似把,而且p的ap ...
    我怀疑你在乳黄哥,色格勃来人,给毙了
    2020-8-6 15:58 回复
  • 牛头五十六 拟态猛男
    0 举报 94
    唔。。。

    似乎挺有意思的,我先结合这个看看论文原文,不懂的地方再找你请教
    2020-8-7 08:38 回复
  • 牛头五十六 拟态猛男
    0 举报 95
    https://www.scboy.com/?thread-149535.htm
    晚辈看完了alphastar的论文原文之后发现您写的这篇帖子和论文原文有几处有出入的地方,整理成了一个帖子,希望前辈有时间回答晚辈的问题,谢谢
    2020-8-8 23:15 回复
  • 牛头五十六 拟态猛男
    0 举报 96
    别睡啦,起床答疑啦
    2020-8-9 08:40 回复
  • 云天青大大 云sp
    0 举报 97
    牛头五十六 https://www.scboy.com/?thread-149535.htm 晚辈看完了alphastar的论文原文之后发现您写的这篇帖子和论文原文有几处有出入的地方,整理成了一个帖子,希望前辈 ...
    我现在在丈母娘家,没有电脑只有手机不太方便编辑,晚上或者明早给你回复帖子
    2020-8-9 11:03 回复
  • 牛头五十六 拟态猛男
    0 举报 98
    云天青大大 我现在在丈母娘家,没有电脑只有手机不太方便编辑,晚上或者明早给你回复帖子
    晚上啦,九点啦,大佬
    2020-8-9 21:06 回复
  • 云天青大大 云sp
    0 举报 99
    牛头五十六 https://www.scboy.com/?thread-149535.htm 晚辈看完了alphastar的论文原文之后发现您写的这篇帖子和论文原文有几处有出入的地方,整理成了一个帖子,希望前辈 ...

    那就一个一个问题依次回答吧


    1.p=2是我查的deepmind团队上传在github上面的代码知道的数据


    2.根据nature论文上的原文

    image.png

    只有对手比你强大很多的时候才用f(var)函数(通俗点的翻译就是说如果想训练jbr,对手找赤小兔和找serral都是没有意义的)然而这种情况实在是太少啦

    image.png从论文原文的图来看,主智能体的elo基本上都是高于联盟利用者和主利用者的,这种情况极少出现,再加上一个帖子只能编辑10000个字符image.png我实在是写不下了,再写85个就超了,所以没介绍这种极为罕见的情况

    3.你是对的,我手误了,就是20%而不是10%,谢谢,已修正


    4.AI的题目是根据mmAP评分和准确率作为分数指标的,基础赛题部分就是看你优化的好坏,根据GPU计算时间作为分数指标


    2020-8-10 08:59 回复
  • 16xrus 猛男
    0 举报 100
    所以alphastar现在还做不到alphastar自身的战略决策加上悍马操作是限于算力吗?
    2020-8-10 10:56 回复
  • 云天青大大 云sp
    0 举报 101
    16xrus 所以alphastar现在还做不到alphastar自身的战略决策加上悍马操作是限于算力吗?
    不完全是算力的问题,还有算法等一系列问题。

    你要知道电脑刚被发明出来的时候可是占了一个几百平米的仓库,其算力还不及我们现在智能手机的百万分之一,电脑经过了将近80年的更新换代才有了今天。

    而alphago战胜柯洁无非是4年前的事,4年对于一个新兴产业(人工智能)来说是妥妥的婴儿期,能发展到这个水平已经很厉害了,不要抱有过高的期望呀
    2020-8-10 12:28 回复
  • 牛头五十六 拟态猛男
    0 举报 102
    感谢大佬回答我的问题,但是我还有最后一个问题,就是16楼的回复里面,overfitting到底是啥意思呀
    2020-8-11 00:06 回复
  • 云天青大大 云sp
    0 举报 103
    牛头五十六 感谢大佬回答我的问题,但是我还有最后一个问题,就是16楼的回复里面,overfitting到底是啥意思呀

    overfitting翻译成中文是过拟合的意思,过拟合(overfitting)是指在模型参数拟合过程中的问题,由于训练数据包含抽样误差,训练时,复杂的模型将抽样误差也考虑在内,将抽样误差也进行了很好的拟合。  具体表现就是最终模型在训练集上效果好;在测试集上效果差。模型泛化能力弱。这就好比上学考试的时候,有的人采取题海战术,把每个题目都背下来。但是题目稍微一变,他就不会做了。因为他非常复杂的记住了每道题的做法,而没有抽象出通用的规则。


    image.png


    如上图,你觉得蓝线和黑线哪一个更能反应这些点的规律?


    再举一个例子,好比你想学习追妹子。 先找你表妹问喜欢什么,表妹说她喜欢干净帅气的男生,还说她喜欢周杰伦,喜欢火锅,喜欢酸菜鱼,合计一百条规矩。你规规矩矩地按照要求学习,终于符合表妹的一切要求,0 Error,训练完成,超级自信准备出去试试追个妹子。 可是换了个妹子,发现学到的似乎没想象中有用。第二个妹子只要你干净帅气。后面的九十八条她都不care,她甚至讨厌吃火锅,那后面98条只会增加误差。这就过拟合了。


    2020-8-11 08:21 回复
  • 牛头五十六 拟态猛男
    0 举报 104
    牛头五十六 感谢大佬回答我的问题,但是我还有最后一个问题,就是16楼的回复里面,overfitting到底是啥意思呀
    懂了( ̄∀ ̄)

    感谢大佬
    2020-8-12 07:54 回复
  • 0 举报 105
    神经网络那块看不懂呀,大佬能指点一下吗。。。
    2020-8-15 08:42 回复
  • 云天青大大 云sp
    0 举报 106
    赤道以北三神最美 神经网络那块看不懂呀,大佬能指点一下吗。。。
    我另开了一个新帖子,详情请见https://www.scboy.com/?thread-153813.htm
    2020-8-18 08:25 回复
  • 0 举报 107
    云天青大大 我另开了一个新帖子,详情请见https://www.scboy.com/?thread-153813.htm
    看完啦,感谢大佬~
    2020-8-19 12:00 回复
  • 结城明日奈 二五仔
    0 举报 108
    看完啦,谢谢教授。教授是哪个大学的啊?好厉害
    2020-9-16 16:09 收起回复
    云天青大大: 山东大学呀
    2020-9-16 17:01回复
  • dony1003 精英猛男
    0 举报 109
    懂了,这就去研究强化学习
    2020-9-16 16:13 收起回复
    云天青大大: 很好~
    2020-9-16 17:01回复
  • 月倾浅 精英猛男
    0 举报 110
    给云教授跪了
    2020-11-22 13:42 回复
  • 云天青大大 云sp
    0 举报 111
    月倾浅 给云教授跪了
    低调基操勿六皆坐
    2020-11-22 13:47 回复
返回