几年前,谷歌旗下的公司DeepMind推出了AlphaGo,这家公司不仅在韩国而且在全世界引起了对人工智能的兴趣。
Deep Mind随后改进了AlphaGo,去年推出了AlphaGo Zero。 Alpha Gao Zero不再教坏人,但人工智能相互对抗。算法得到了很大的改进,达到了100:1的水平,以击败现有的alpha。
阿尔法零学习如何保持自己并记住它。它有能力自己重复它,它可以处理数以千万计的练习。现有的阿尔法通过让人类学习大量数据,学会了人类的思维方式,学会了一种胜利模式。然而,Alpha Goo Zero在不借用人手的情况下学会了在零状态下玩Badu,他越过了现有的人工智能,学习了Baduk而没有受到人类的影响。
Alpha Zero首先学习关于Go的基本规则,然后通过学习直接重复游戏来学习其余部分。经过三天的学习,据说水平达到了现有的阿尔法水平之外。经过超过21天的学习,Alpha Gozo超越了Alpha Go Master,后者在网上比赛中赢得了60分。 40天后,我浏览了所有现有的Alpha版本,并完全学会了如何通过单独的自学来获胜。它使用强化学习,让您了解神经网络如何获胜,为您赢得胜利奖励。 Alpha Zero重复记忆如何在互相对抗并赢得胜利的同时建立技术诀窍的过程。它显示了超越人类知识极限的可能性。很容易学会如何赢得非常规的胜利。
与之前的版本不同,Alpha Zero仅接收有关放置在棋盘上的石头和黑色石头的信息。现有的Alpha已经使用了策略网络和价值网络,但Alpha Zero已将其集成到一个中,以便可以有效地学习和评估它。它还使用随机石击技术来查看在比赛中哪种方式更有利。这使得比现有的Alpha更有效地学习并获得结果。 Alpha-Zero能够大幅降低功耗,因为它只能学习几个处理器和TPU。
Deep Mind并没有就此止步,但后来推出了AlphaZero并且除了Go之外还玩过棋盘游戏。 Alpha Zero是基于Alpha Go开发的。经过四个小时的学习,我们轻轻地超越了世界上最强大的开源国际象棋引擎 – 鳕鱼。 Alpha Zero在第100场比赛中有28胜72平。 Alpha Zero还学习如何在不知道如何玩像Alpha Zero这样的人类游戏的情况下赢得AI。 Alpha Zero使用强化学习,因此您无需学习相同的专业知识。 Alpha Zero假设下一个数字是一秒钟80,000,但是Stockfish一秒钟达到7000万。
Alpha Zero能够在没有专业知识的情况下在24小时内展示象棋等游戏中的超人能力。经过两个小时的学习,Alpha Zero赢得了世界上最强大的长期计划Elmo。
Deep Mind开发了FTW(For the Win),这是一款可以在第一人称射击游戏FPS游戏中超越人类的AI。这不仅仅是你可以获胜,而且你可以与人类团队成员合作并享受多场比赛。
当然,2017年使用开放式人工智能(Open AI)的人工智能一直是人类在Dota 2中获胜的话题。这个AI以1:1的摊牌进行了比赛。这是一种自学习类型的技术,使用强化学习方法在学习游戏风格的同时逐步学习游戏风格,而无需使用模仿或树木导航。 Deep Mind还说他正在研究星际争霸II的人工智能。
这位心胸深邃的FTW使用Quake 3 Arena(1999年发布的游戏)引入了一个演示.Quake 3团队就像一个旗帜捕捉游戏并释放出另一面旗帜的方式。 FTW已经表示,它已经学会了在这个过程中与人类合作的目标。
如果你将旗帜带到你对手营地的身边,那么夺旗就是一种简单的获胜方式,但根据瞬间情况的动作很复杂。地图不会在同一个地方使用,但每次播放时都会更改。因此,GTW不记得地图布局。此外,要像人类一样成长AI,您需要像人类一样识别屏幕像素,而不是像现有的游戏AI那样直接在游戏中读取参数。
Deep Mind方面随机匹配了40名人类游戏玩家和30名FTW,并训练了超过450,000次。在这个过程中,神经网络形成,并通过游戏进程的动机被反馈并提高了水平。
在显示FTW的增长状态的图表中,横轴表示游戏的数量,纵轴表示游戏者的更强度。蓝线显示FTW的水平改善。超过150,000次,它已超过人类平均游戏玩家等级,并在达到约450,000次时达到最高分。
FTW不仅捍卫球队在旗帜爆发方面的实力,还帮助同伴(包括人类),以及压制对手的位置。也可以学习与人合作。通过强化学习,这些人类和人工智能合作在一起。该项目的目标是通过集体级教育方法改进强化学习,并开发可与人类组成团队的AI代理。
Deep Mind的目标是用人工智能技术解决人类面临的问题。通过将人工智能应用于医学领域,它可以用于早期发现无法治愈的疾病或控制电力需求。数据挖掘也是如此,它从大量数据中获取洞察力。在这方面,虽然对人工智能有很多负面看法,但Deep Mind CEO Demise Hasabith强调它将对人类产生积极影响。
科学家确定人工智能何时超越人类水平的调查预测,2024年的翻译,2027年的卡车运输,2031年的销售人员以及2053年的外科医生都将成为可能。如果实际发生这种发展,人力劳动力可能会转移到焦点。在Go游戏,棋盘游戏以及现在通过深思熟虑观看之后人类通过FPS游戏可以被视为恰好在游戏中的茶杯台风。但是,很明显,这些变化正逐渐变为现实。
Add comment