文章橫幅廣告

鹿鼎娱乐平台介绍


正是混合的方法令AlphaGo如此令人难以置信的强大。它的核心是一种类型树搜索算法,鹿鼎娱乐平台它通过蛮力穷举展现出所有可能的下法。但是以前的人工智能在每一种可能下法上都花费相同的时间,或者依靠明确的、人类编码的启发来告诉它们去哪里找。而AlphaGo有两个神经网络,其中一个给它提供建议,基于它学过的基本策略,另一个神经网络则会通过借鉴历史对局告诉鹿鼎娱乐AlphaGo在哪里落子可以赢得比赛。在这两种神经网络的结合下,这些引导它通过游戏树,并确保它花更多的处理器功率更深入地阅读最有前途的分支。
完善VS不完善信息:不同的技术
这个对比可能不是非常准确,因为围棋和扑克之间有一个根本区别。鹿鼎娱乐平台那就是围棋不存在概率和隐藏信息的问题,而扑克则存在着两种因素,随机的底牌和未知的对手手牌。这使得在这两个游戏在解决问题时会使用截然不同的方法。在完善信息游戏中完美的策略是“绝对”,比如围鹿鼎娱乐注冊棋。
这意味着理论上围棋的每一个局面下都有一个正解,你的对手可以接收到和你相同的信息。鹿鼎娱乐平台在不完善信息游戏中,完美的策略是典型的“混合”,比如扑克。这意味这牌手会在几种选择中权衡概率。例如,在一个给定的情况下机器给出的理想策略是弃牌占30%,加注占70%。一定量的不可预测性是必要的,以避免给鹿鼎娱乐平台对手的传达信息。