Na konferenci ICLR 2020, zprávy TheNextweb 17. května, představili vědci z IBM, MIT, Harvard a DeepMind novou konferenci Hybrid Artificial Intelligence (dále jen AI) a nový soubor dat a měřítka pro posuzování schopností algoritmů AI při uvažování o akcích obsažených ve video informacích.
Nový dataset a výzkumné prostředí představené na ICLR 2020 se nazývá CoLlision Events for Video Reprezentace a zdůvodnění videa nebo CLEVRER. Jsou založeny na vizuální otázce a odpovědi CLEVR vyvinuté na Stanfordské univerzitě v roce 2017. CLEVR je sada úkolů představujících statické obrazy pevných objektů. Agent AI musí být schopen analyzovat scénu a odpovědět na několik otázek týkajících se počtu objektů, jejich atributů a jejich prostorových vztahů.
Jako řešení obtížného úkolu pro klasickou umělou inteligenci vědci představili model neuros symbolického dynamického myšlení, kombinace neuronových sítí a symbolické umělé inteligence.
Výsledky ukázaly, že začlenění neuronových sítí a symbolických programů do jednoho modelu AI může kombinovat jejich silné stránky a překonat jejich slabiny. „Symbolická reprezentace poskytuje silný společný rámec pro vizi, jazyk, dynamiku a kauzalitu,“poznamenávají autoři a dodává, že symbolické programy umožňují modelu „jasně zachytit kompozici, která je základem kauzální struktury videa a logiky otázky“.
Výhody takových systémů jsou omezeny nepodmíněnými nevýhodami. Data použitá pro trénink modelu vyžadují další anotace, které mohou být příliš náročné na energii a drahé v reálných aplikacích.