Britská společnost DeepMind, která se stala součástí společnosti Google v roce 2014, neustále pracuje na zdokonalování umělé inteligence. V červnu 2018 představili její zaměstnanci neuronovou síť schopnou vytvářet 3D obrazy z 2D. V říjnu vývojáři šli dále - vytvořili neuronovou síť BigGAN, aby vytvořili obrazy přírody, zvířat a objektů, které je obtížné odlišit od skutečných fotografií.
Stejně jako u jiných projektů umělých obrazů je tato technologie založena na generativní protivníkové neuronové síti. Připomeňme, že se skládá ze dvou částí: generátoru a diskriminátoru. První vytváří obrázky a druhá hodnotí jejich podobnost se vzorky ideálního výsledku.
V této práci jsme chtěli rozmazat hranici mezi obrázky generovanými AI a fotografiemi ze skutečného světa. Zjistili jsme, že k tomu postačují stávající generační metody.
Různé sady obrázků byly použity k výuce BigGAN k vytváření obrázků motýlů, psů a jídla. Nejprve bylo školení založeno na databázi ImageNet a poté - větší sada JFT-300M s 300 miliony obrázků, rozdělena do 18 000 kategorií.
Školení BigGAN trvalo 2 dny. Trvalo 128 tenzorových procesorů Google určených speciálně pro strojové učení.
Na vývoji neuronové sítě se podíleli také profesoři ze Skotské univerzity Heriot-Watta. Podrobnosti o technologii jsou popsány v článku „Školení
rozsáhlá generativní protivníková neuronová síť GAN pro syntézu vysoce věrných přírodních obrazů “.
Propagační video:
V září vědci z Carnegie Melon University využili generativní protivníkovské neuronové sítě k vytvoření systému superponování výrazů obličeje na tvářích ostatních.
Ramis Ganiev