重要通知:域名变更为m.bxuu.net请收藏
不掉落,持续打方块的游戏。正如你们已经知道的那样,它会学着如何不断的提高分数,而且进步飞速。
起初,人工智能几乎是在随机地玩,半个小时后,每四次操作,它才失误一次。一个小时后,他在300局游戏中做到了零失误。之后,它继续飞快的学习,以至于在第二个小时里,它算出了Breakout中的一个漏洞,而此前数百万人类玩家都没有发现。利用这个漏洞,它可以通过打通一面墙赢的游戏,这连游戏开发者也没有想到。
在没有DeepMind开发者指导的情况下,一种叫做“深度强化机器学习”的算法在接触了四十九个雅达利游戏数小时后诞生,进化的速度让人惊叹。而如今的人工智能已经达到不仅可以自我深度学习的境地,甚至可以自我进化和创造,这——就是你们将来会在游戏中遇到的最强大的对手!”