Mašine već sjajno pišu vesti, slede knjige

Novi AI tekstualni generator može biti preopasan za čovečanstvo, kažu njegovi izumitelji a prenosi Gardijan. Neprofitna kompanija OpenAI, koju podržava Elon Musk odbija da obelodani straživanja, strahujući od masovne zloupotrebe.

Kreatori revolucionarnog AI sistema – koji je danas sposoban da piše novinske članke i književna dela – sistema danas poznatog kao “duboko tekstualno učenje” (ili, možda temeljito učenje zakonitosti teksta, jezika, njegovog značenja i gramatike) – učinili su neobičan korak: odlučili su da ne objavljuju svoja istraživanja, iz straha od potencijalne zloupotrebe.

OpenAI, neprofitna istraživačka kompanija koju podržavaju Elon Musk, Reid Hoffman, Sam Altman i drugi vrhunski stručnjaci kažu da je ovaj novi AI model nazvan GPT2 “baš toliko dobar”, kao i da je rizik od zlonamerne upotrebe toliko visok da su njegovi kreatir uveliko odstupili od uobičajene prakse javne prezentacije kompletnih istraživanja kako bi se omogućilo više vremena za raspravu o posledicama savremenih tehnoloških prodora.

U osnovi, GPT2 je generator teksta. Sistem AI je unet u tekst na svakom nivou: od nekoliko reči, do cele stranice; od ovog tekst procesora istraživači su zahtevali da napiše nekoliko narednih rečenica na osnovu svojih predviđanja o tome šta bi trebalo da sledi. Ovaj sistem pomera granice onoga što se smatralo mogućim, kako u pogledu kvaliteta konačnog rezultata, tako i u pogledu širokog spektra mogućnosti njegove upotrebe u budućnosti.

AI može da piše baš kao ja. Pripremite se za robotsku apokalipsu, tvrdi Gardijanova kolumnistkinja Hana Džejn Parkinson.

Kada se koristi za generisanje novog teksta, GPT2 je sposoban da piše neverovatno verodostojne odlomke koji odgovaraju onome što se od njega zahteva – kako stilski tako i suštinski, to jest po sadržaju. Retko kad se može uočiti bilo koja varka tj manjkavost koja je bila prepoznatljiva kod prethodnih AI sistema, poput, recimo, „naprasnog“ zaboravljanja onoga o čemu piše na pola puta do završetka nekog pasusa, da bi “ničim izazvan”, krenuo sa „seckanjem, čupkanjem i prekrajanjem“ sintakse u dugim rečenicama.

U ovaj izuzetno sofisticirani program za obradu teksta – što GPT2, napokon, i jeste – tim istraživača ubacio je početak Orvelovog romana „1984“: “Bio je to vedar i hladan aprilski dan, a satovi su pokazivali trinaest časova” – a onda je GPT2 sistem prepoznao nejasno futuristički ton i romansijerski stil koji je nastavio sopstvenom kreacijom:

„Bio sam u automobilu, na putu ka svom novom poslu u Sijetlu. Natočio sam gorivo, upalio motor i krenuo. Zamišljao sam kakav će ovaj dan biti. Za sto godina od danas. Godine 2045. bio sam učitelj u nekoj školi u siromašnom delu ruralne Kine. Počeo sam sa kineskom istorijom kao i istorijom nauke.”

Kada su u ovaj procesor ubacili prvi pasusi jednog Gardijanovog članka o Bregzitu, mašina je u finišu „dopisala“ stilski veoma uverljiv novinarski tekst koji obiluje “citatima” onoga što je govorio i pisao  Džeremi Korbin, britanski lider laburista, spominjući usput i aktuelne probleme: granicu sa Irskom, kao i odgovor premijerkinog portparola.

Jedan takav, potpuno veštački „skrojen“ pasus, glasi: „Na zahtev da pojasnimo dobijene izveštaje, portparol Tereze Mej je rekao da je ‘Premijerka jasno stavila do znanja kako je njena namera da napusti EU što je pre moguće, kao i da će to biti pod njenim pregovaračkim mandatom, što je potvrđeno i u govoru kraljice prošle nedelje’. ”

Sa stanovišta istraživanja, GPT2 je revolucionaran na dva načina. Prvi je njegova veličina, kaže Dario Amodei, direktor istraživačkog odeljenja u startup firmi OpenAI. Modeli su “bili 12 puta veći, a skup podataka bio je takođe 15 puta veći i daleko obimniji” u odnosu na prethodni vrhunski AI model. Mašina je „obučavana“ na skupu podataka od oko 10 miliona članaka, odabranih tako što su na sajtu društvenih vesti Reddit pretraženi linkovi sa više od tri glasa-preporuke. Ova ogromna količina članaka bila je „teška“ 40 gigabajta, prostor dovoljano da se pohrani oko 35.000 kopija Mobija Dika. (Redit (engl. Reddit) je veb sajt u vidu foruma zasnovan na principu postavljanja, komentarisanja i ocenjivanja veb sadržaja. Korisnici mogu biti registrovani ali i nije neophodno za pretraživanje veb sajta. Korisnici na sajt postavljaju sadržaj u vidu teksta, linkova i fotografija koje potom ocenjuju drugi korisnici. Sadržaj je podeljen u sabredite (engl. subreddit), koji obično pokrivaju neku određenu temu kao što su novosti, nauka, tehnologija, video-igre, knjige, filmovi, muzika, hrana, fotografije, kao i raznovrsan sadržaj koji veb nudi. Objave sa većim brojem pozitivnih glasova se prikazuju na vrhu sabredita i ako imaju dovoljno pozitivnih glasova prikazuju se na početnoj strani Redita)

Količina podataka kojima je GPT2 „nahranjen“ direktno je uticala i na njegov kvalitet, dajući procesoru više informacija/znanja o tome kako razumeti pisani tekst. To je, takođe, dovelo do još jednog napretka. GPT2 je daleko sveobuhvatniji od prethodnih modela tekstualnih procesora. Strukturisanjem unetog teksta, ovaj tekst generator može obavljati najraznovrsnije zadatke, uključujući prevođenje teksta i njegovo sažimanje, uz „shvatanje“ značenja jednostavnih testova koje je „pročitala“, često obavljajući te operacije baš toliko dobro – ili, u svakom slučaju, bolje od drugih AI teskst procesora koncipiranih posebno za te zadatke.

Taj kvalitet je, međutim, doveo do toga da OpenAI bude u koliziji sa svojom društvenom obavezom, naime, podsticanjem daljih istraživanja veštačke inteligencije; ovaj startap je, i pored jedne opšte svrhe da svoja stečena znanja barem jednim delom podeli s drugima kao opšte dobro, samostalno odlučivši da drži GPT2 iza zatvorenih vrata u bliskoj budućnosti, a usled procene šta bi sve zlonamerni korisnici mogli da učine s ovom tehnologijom. “Prinuđeni smo da obavimo dodatne eksperimente kako bismo saznali za šta je GPT2 sposoban da urada a šta ne”, rekao je Džek Klark, šef jedne američke dobrotvorne organizacije za dodelu sredstava naučno-obrazovnim projektima. „Ukoliko niste u stanju da predvidite sve ono za šta je sposoban ovaj AI model, onda ga nekako morate podstaći kako biste videli kakve su mu mogućnosti. Toliko je onih koji daleko bolje (od nas iz startapa OpenAI) mogu sagledati potencijalnu štetu koju GPT2 može naneti.”

Da bi pokazao šta to znači, OpenAI je napravio jednu verziju GPT2 sa nekoliko minornih podešavanja kojima je moguće koristiti ga za generisanje beskonačnih pozitivnih – ili negativnih – prikaza i recenzija proizvoda. Spamovi i lažne vesti su još dva očigledna potencijalna nedostatka, kao što je to slučaj sa „nefiltriranom“ prirodom AI. Pošto se obučava na internetu, nije teško ohrabriti ga da generiše tekstove koji obiluju neproverenim informacijama i sadržajima koji podstiču netrpeljivost, teorije zavere i tako dalje.

Umesto toga, cilj je pokazati šta je to na šta bi današnji svet trebalo da se priprema: na ono što će za godinu ili dve biti maejnstrim tj sasvim uobičajena pojava. „Imam i termin za ovo. Lift iz pakla“, rekao je Klark. „Troškovi proizvodnje novih tehnologija, nakon nekog vremena, padaju, smanjujući i cenu po kojoj ih je moguće kupiti. Pravila po kojima možete kontrolisati tehnologiju su se fundamentalno promenila.“

“…Ne kažemo da znamo pravu stvar koju je ovde (u oblasti AI razvoja) potrebno učiniti, niti postavljamo neke granice (drugima), govoreći (im) gde je i kakav je mogući put razvoja veštačke inteligencije… Pokušavamo da razvijemo rigorozniji način razmišljanja. Pokušavamo da izgradimo put dok istovremeno koračamo njim.”

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.