（五）通向猎人之路（2）(第2/2页)幻游猎人

重要通知:域名变更为m.bxuu.net请收藏

不掉落，持续打方块的游戏。正如你们已经知道的那样，它会学着如何不断的提高分数，而且进步飞速。

    起初，人工智能几乎是在随机地玩，半个小时后，每四次操作，它才失误一次。一个小时后，他在300局游戏中做到了零失误。之后，它继续飞快的学习，以至于在第二个小时里，它算出了Breakout中的一个漏洞，而此前数百万人类玩家都没有发现。利用这个漏洞，它可以通过打通一面墙赢的游戏，这连游戏开发者也没有想到。

    在没有DeepMind开发者指导的情况下，一种叫做“深度强化机器学习”的算法在接触了四十九个雅达利游戏数小时后诞生，进化的速度让人惊叹。而如今的人工智能已经达到不仅可以自我深度学习的境地，甚至可以自我进化和创造，这——就是你们将来会在游戏中遇到的最强大的对手！”