AI Se Samostatně Naučil Hrát šachy Na Nadlidské úrovni Za Den - Alternativní Pohled

AI Se Samostatně Naučil Hrát šachy Na Nadlidské úrovni Za Den - Alternativní Pohled
AI Se Samostatně Naučil Hrát šachy Na Nadlidské úrovni Za Den - Alternativní Pohled

Video: AI Se Samostatně Naučil Hrát šachy Na Nadlidské úrovni Za Den - Alternativní Pohled

Video: AI Se Samostatně Naučil Hrát šachy Na Nadlidské úrovni Za Den - Alternativní Pohled
Video: Jak hrát šachy 1 - úvod 2024, Duben
Anonim

Algoritmus AlphaZero, bez lidského učitele, zvládl šachy a hru shogi za 24 hodin, takže porazil další programy šampionů, které dříve bezpodmínečně porazili lidi.

Deep Mind, společnost vyvíjející algoritmy pro umělou inteligenci (AI), zveřejnila údaje o výsledcích rekvalifikace algoritmu AlphaGo pro hraní šachů a shogi. Dříve byla AlphaGo schopna porazit mistrů světa ve hře go. Umělé inteligenci se podařilo zvládnout nové hry ještě rychleji. Odpovídající práce je zveřejněna na předtiskovém serveru Cornell University.

AlphaZero použil metodu posilování učení. Je to podtyp hlubokého strojového učení, který nevyužívá učitele člověka, ale výhradně hry mezi dvěma AI. Ačkoli na začátku obě AI hrají velmi slabě, díky své vysoké rychlosti (ve srovnání s učitelem člověka) mohou hrát v krátkém časovém období obrovské množství her a vybrat si osvědčené pohyby a jejich sekvence v určitých pozicích na desce, což dává schopnost algoritmů zvýšit jejich úroveň velmi rychle.

V tomto případě AlphaZero dosáhlo úrovně hry vyšší než kterýkoli lidský hráč za pouhých 24 hodin. Poté jí bylo dovoleno hrát s Stockfishem, nejlepším šachovým hráčem, který je k dispozici, a Elmo, nejlepším hráčem shogi (vysoce upravený šachový set v raném středověkém Japonsku).

I přes velmi krátké tréninkové období AlphaZero porazilo Stockfish 28krát a 72krát více. Podařilo se jí vyhrát 90krát Elmo, prohrát 8krát a 2 krát čerpat. To jsou mimořádně vysoké výsledky. Šachy a shogi se velmi liší od cesty, pro kterou byl AlphaGo původně vytvořen, stejně jako od sebe navzájem. Například „japonské šachy“znamenají extrémně exotické možnosti, jako je hraní kteréhokoli ze „snědených“kousků nepřítele. Vítězství algoritmu vytvořeného pro Go pouze hraním s úplně identickým algoritmem jeho vlastní znamená, že učitel lidských zdrojů může dosáhnout

IVAN ORTEGA