Vědci Vyškolili Neuronovou Síť K Určení Pohlaví Osoby Z Psaného Textu - Alternativní Pohled

Vědci Vyškolili Neuronovou Síť K Určení Pohlaví Osoby Z Psaného Textu - Alternativní Pohled
Vědci Vyškolili Neuronovou Síť K Určení Pohlaví Osoby Z Psaného Textu - Alternativní Pohled

Video: Vědci Vyškolili Neuronovou Síť K Určení Pohlaví Osoby Z Psaného Textu - Alternativní Pohled

Video: Vědci Vyškolili Neuronovou Síť K Určení Pohlaví Osoby Z Psaného Textu - Alternativní Pohled
Video: Eduard Bakštein - Od biologických neuronů a sítí k umělým (NÚDZ 21.4.2017) 2024, Smět
Anonim

Tým vědců z Národní výzkumné jaderné univerzity „MEPhI“, Národního výzkumného střediska „Kurchatov Institute“a Voroněžské státní univerzity vyvinul metodu, která učí počítač rozpoznávat pohlaví osoby z textu napsaného s přesností 80 procent. Vědecký vývoj patří do oblasti výpočetní lingvistiky. Výzkum byl proveden s grantem Ruské vědecké nadace. Výsledky jsou publikovány v časopise Procedia Computer Science.

Četné vědecké studie ukazují, že psaný text nevyhnutelně odráží charakteristiky jeho autora - pohlaví, psychologické charakteristiky, úroveň vzdělání. Řeč je cenným psychodiagnostickým nástrojem, který používají odborníci na lidské zdroje velkých společností, jakož i bezpečnostní služby.

Na základě analýzy řeči je možné diagnostikovat přítomnost určitých nemocí u člověka (demence, deprese) a tendenci k sebevražednému chování. Potřeba stanovit charakteristiky autora textu také roste s rozvojem internetové komunikace: Je důležité, aby společnosti věděly, které skupiny lidí mají rádi své produkty a služby.

Vědci pracující v tomto směru (lingvisté, psychologové, specialisté na informační technologie) na základě numerických hodnot různých parametrů textu vytvářejí matematické modely pro diagnostiku určitých osobnostních parametrů.

Tým odborníků analyzoval účinnost různých technologií strojového učení pomocí neuronových sítí pro analýzu textu.

V průběhu studie porovnávali přesnost řešení genderové identifikace textů na základě dvou přístupů k datovému modelování: na jedné straně, algoritmy strojového učení (podpora vektorového stroje a posílení gradientu), na druhé straně, hluboké učení neuronových sítí (konvoluční neuronové sítě a opakující se neuronové sítě s dlouhou krátkodobou pamětí).

„Dosáhli jsme vysokých výsledků při určování pohlaví autora textu díky pokročilým modelům neuronových sítí v podmínkách, kdy autor své pohlaví nezakrývá. Dalším úkolem je zjistit pohlaví z hlediska jeho úmyslného utajení, “říká Alexander Sboev, docent NRNU MEPhI.

V následujících textech, zveřejněných původně na seznamovací stránce, neuronová síť snadno najde úlovek v deseti z deseti případů, navíc autor úmyslně vloží do podpisu jméno opačného pohlaví.

Propagační video:

Text napsal dívka: „Jsem pohledný, svalnatý muž 30 let. Pracuji pro velkou ropnou a plynárenskou společnost v dobré pozici se slušným platem. Bydlím ve svém vlastním bytě v Moskvě. Tato nemovitost má také malý, ale pěkný dům v jedné z vesnic v Itálii. Mám rád sport, zejména fotbal. Rád chodím na víkend, nesnáším pobyt doma. Dívka, která by mi vyhovovala, by měla mít skromné dispozice, dobrý vzhled a atraktivní postavu podle moderních standardů. Měla by sdílet mé zájmy, neměla by žárlit a neměla by se pokoušet, abych se cítila žárlivá. Nebudu podporovat dívku, protože věřím, že by oba měli pracovat v rodině. Také raději ponechávám rozpočet samostatně. Nebudu tolerovat zradu. “

Text napsal muž: „Dobrý den! Jsem nesmírně nešťastný, extrémně! Proč se s námi takto chováte!! Jsme také lidé, všichni jsme si rovni! Jste sexista? Už to nebudu brát! Rozbiju vaše auto všude, namalovám to. Počkejte, nelidské. Tímto dojdu. “

Výsledky této studie ukázaly, že přístup založený na použití konvolučních neuronových sítí a metod hloubkového učení pro rozpoznávání pohlaví osoby, která text napsala, je nejoptimálnější.

Nyní skupina vědců pracuje na problému rozpoznávání věku.