OPENAI je 13. svibnja predstavio ChatGPT-4o, najnoviju verziju svojeg velikog jezičnog modela koja je prema tvrdnjama kompanije, ali i prvih korisnika koji su je isprobali, brža i moćnija od GPT-4.
“Danas predstavljamo naš najnoviji model GPT-4o s kojim ćemo besplatno uvesti više inteligencije i naprednih alata za ChatGPT. GPT-4o je naš najnoviji model koji pruža inteligenciju GPT-4 razine, ali je puno brži i poboljšava svoje mogućnosti vezane uz tekst, glas i vizuale”, objavila je kompanija.
Stručnjaci OpenAI-ja su na službenoj stranici i na X-u predstavili cijeli niz zanimljivih alata koji demonstriraju nove sposobnosti GPT-4o i njegove praktične primjene u svakodnevnom životu.
“S GPT-4o u cijelosti smo obučili jedan novi model kako bi radio s tekstom, slikom i zvukom, što znači da sve ulaze i izlaze obrađuje ista neuronska mreža. Budući da je GPT-4o naš prvi model koji kombinira sve ove modalitete, još uvijek samo grebemo po površini u istraživanju što sve može činiti i koja su mu ograničenja”, poručila je kompanija.
Zastrašujuće ljudski
Mi smo na Indexu neke od najzanimljivijih alata testirali, a neki rezultati su, blago rečeno, iznad očekivanja, gotovo zastrašujuće dobri. No neki su ispod očekivanja i stvaraju dojam da su priče o skorom dolasku opće umjetne inteligencije ipak još uvijek znanstvena fantastika.
Sposobnost da prati zbivanja i reagira
Posebno je zapanjujuća službeno demonstrirana sposobnost GPT-4o da prati zbivanja oko uređaja na kojem se koristi, da komunicira s više osoba te da to čini na vrlo ljudski način s uvjerljivim glasovnim ekspresijama.
Izvršni direktor OpenAI-ja, Sam Altman u svojem je postu na blogu istaknuo:
“Osjećaj je kao s umjetnom inteligencijom iz filmova; i još uvijek mi je pomalo iznenađujuće da je to stvarno. Pokazalo se da je postizanje brzine odgovora i izražajnosti na ljudskoj razini velika promjena”, dodao je.
Pretjerano humaniziran?
Neki stručnjaci smatraju da je OpenAI možda čak pretjerao s humanizacijom AI-ja te da bi to moglo imati raznih neželjenih implikacija. Tu podsjećaju na ekstreman primjer Britanca Jaswanta Singha Chaila, koji je kao 19-godišnjak naoružan samostrelom u Windsoru pokušao izvršiti napad na kraljicu Elizabetu II na Božić 2021., da bi kasnije na sudu tvrdio da ga je AI svojim algoritmima uvjerio da bi to bilo sasvim prihvatljivo.
Vodeći konkurenti OpenAI-ja, poput Googlea, do sada su općenito nastojali ograničiti antropomorfizam svojih chatbota. Njihovi modeli uglavnom odbijaju odgovarati na određene vrste pitanja te korisnike često podsjećaju da su samo računalni programi.
Doduše, čini to i GPT-4o kada ga se izravno pita što osjeća.
Još nisu dostupne sve mogućnosti GPT-4o
Nažalost, neke mogućnosti GPT-4o nismo mogli isprobati jer u vrijeme testiranja neke njegove funkcije, među kojima i jedna od važnijih – mogućnost da preko mobitela prati ono što vidi kamera uređaja, još nisu bile dostupne čak ni za korisnike s pretplatom.
Kompanija je najavila da će sve ključne mogućnosti uskoro postati dostupne čak i u besplatnoj verziji, samo s nekim ograničenjima u količini razmjena.
Tekst se nastavlja ispod oglasa
Prezentacija OpenAI-ja
U ovom ćemo tekstu stoga prenijeti neke korisne funkcije koje su u prezentaciji na X-u predstavili demonstratori kompanije te neke koje smo sami testirali.
U prvoj videosnimci (dolje) avatarica (može se odabrati između više ponuđenih avatara s muškim i ženskim glasovima) vrlo prirodnim glasom i glasovnim gestikulacijama komunicira o novostima te opisuje što sve vidi dok zaposlenik kamerom mobitela kruži po prostoriji.
U drugoj GPT-4o poučava demonstratore španjolskom prepoznajući objekte na stolu na španjolskom jeziku.
U trećoj zaposlenik zadaje GPT4o da otpjeva neku uspavanku na temu veličanstvenog krumpira. Pritom zaposlenik savjetuje AI kako da prilagodi glas uspavanke, kako da optimalno nježno šapuće i avatarica u skladu s uputama mijenja glas.
U četvrtoj demonstratori traže od GPT-4o da shvati što se zbiva u prostoriji u kojoj je na stolu kolač sa svjećicom. Potom od AI avatarice traže da otpjeva pjesmu Sretan rođendan i ona to čini vrlo prirodno uz smijeh i zezanciju.
U petoj demonstrator testira hoće li avatar shvatiti i odobriti šalu o mačkama kojom bi se mogao poslužiti kao otac. Po smijehu i reakciji čini se da je GPT-4o shvatio igru riječima i odobrio je.
U šestoj, na temelju snimke sastanka više osoba, AI avatarica zaključuje tko od sudionika više voli mačke, a tko pse. Također nalazi argumente kojima opravdava njihove osobne preferencije.
U sedmoj zaposlenik od avatara traži da mu se od određenog trenutka na dalje počne obraćati isključivo sarkazmom i on to vrlo dobro čini, kako odabirom riječi, tako i glasovnom ekspresijom.
U osmoj zaposlenik OpenAI-ja i njegov sin demonstriraju kako GPT-4o može davati instrukcije iz matematike. Avatarica djeluje vrlo taktično, postavlja pitanja, hrabri učenika, navodi ga na odgovore te blago reagira na njegove greške i strpljivo ih ispravlja.
U devetoj demonstratori igraju igru kamen, papir, škare, a GPT-4o prepoznaje tko je pobijedio u kojoj rundi.
U 10. demonstratorica podučava AI kako harmonično pjevati. Ova prezentacija pokazala je da AI još nije na zavidnoj razini glazbenog znanja.
U 11. se GPT-4o šali s demonstratorom dok mu daje savjete kako da se uredi za službeni razgovor.
Tekst se nastavlja ispod oglasa
U 12. se demonstratori šale s avataricom dok je savjetuju kako da mijenja glas dok priča priče i pjeva.
U 13. avatarica pomaže demonstratoru riješiti jednadžbu s jednom nepoznanicom. Pritom djeluje kao učiteljica koja daje instrukcije učeniku, a ne samo kao automat za rješavanje zadataka.
U međuvremenu je u istom threadu OpenAI-ja na X-u objavljeno još mnogo raznih videodemonstracija.
Niz različitih alata
U verziji AI-ja za računalo, kada se klikne na ChatGPT ikonu u gornjem lijevom uglu, otvara se izbornik raznih modela od GPT-3.5, preko GPT-4, do GPT-4o.
Još malo više nalijevo nalazi se pregled brojnih programa s kojima model radi.
Kada se klikne na Explore GPTs, otvara se ponuda najrazličitijih alata po kategorijama, a mi smo isprobali tek neke od njih, za nas najinteresantnije.
Kodiranje
Damir Škrjanec, zagrebački direktor razvoja u Cybrotechu, za Index je testirao koderske sposobnosti GPT-4o i zaključio da je definitivno bolji od GPT-4.
“Skok je puno veći od očekivanog. Zvuči prirodnije, ima manje nepotrebnih ponavljanja, može pristupati real-time podacima, može generirati slike preko DALL-E, može napisati i sam izvršiti program u Pythonu, podignuto je ograničenje na veličinu podataka itd.”, kaže Škrjanec.
“Dao sam mu da sam opiše razlike u odnosu na raniju verziju i napravio je to jako dobro. Dao sam mu da napiše komad koda u Pythonu i rješenje je odlično. Stil je sad sličniji ljudskom, lakše ga je čitati. Dao sam mu također da prevede jedan strogo tehnički tekst i rezultat je skoro savršen. Moram priznati da sam ponovno impresioniran”, kaže Škrjanec.
S druge strane, brojni profesionalni programeri na forumima ističu da je kvaliteta kodiranja kojom raspolaže GPT-4o za njih još uvijek nedovoljno dobra da bi im on bio upotrebljiv.
Škrjanec tumači kako je vjerojatno stvar u tome da GPT-4o ne uspijeva napraviti vrlo specijalizirani kod za specifične zadatke kakvima se često bave profesionalni programeri.
“On je meni isto neupotrebljiv za neke zahtjevne zadatke. No u mnogim drugima bit će koristan”, rekao je Škrjanec.
Tekst se nastavlja ispod oglasa
Fizika
Pitali smo GPT-4o da nam kratko objasni kvantnomehanički koncept – kolaps valne funkcije na dvostrukoj pukotini.
On je to solidno napravio.
Matematika
Na traženje da riješi tipičan matematički zadatak kakav se pojavljuje na višoj A razini mature, alat je predstavio cijeli postupak rješavanja u osam koraka i od sustava dviju jednadžbi s dvije nepoznanice: x2 + y2 = 25 i x + y = 7, došao do tražena dva rješenja: (x, y) = (3, 4) i (x, y) = (4, 3)
Znanost
Alat Scolar GPT pokazao se prilično korisnim u traženju studija na određene teme. Primjerice, tražili smo da nam pronađe studije koje ukazuju na povezanost rodnog identiteta s fizičkim čimbenicima kao što su geni i hormoni i on je to učinio. Predstavio je više studija na tu temu s pripadajućim poveznicama na radove objavljene u različitim časopisima i sažecima zaključaka svakog od radova.
Generator slika
Tražili smo kratko da nam generator slika napravi jednu koja bi predstavljala dvorac Oštrozimlje iz filma Igre prijestolja.
Rezultat možete vidjeti dolje. Naravno, moguće je poigrati se s uputama i korekcijama pa dobiti značajno uvjerljiviju sliku.
Recept
Tražili smo aplikaciju Sous Chef da nam kreira recept prema povrću koje se nalazilo u našem hladnjaku.
Alat je to vrlo dobro odradio sa svim detaljnim uputama što učiniti sa svakom vrstom povrća.
Karikatura
Program koji “kartunizira” portrete, odnosno koji ih pretvara u likove iz crtića, napravio je ovo dolje. Pritom je objasnio da je to učinio tako da lik bude nalik likovima iz Pixarovih crtića.
Video
Tražili smo Video GPT by Veed da nam napravi kratak film koji bi na zabavan i popularan način ilustrirao nastajanje aurora od eksplozija na Suncu preko Sunčevog vjetra do sudara s česticama u atmosferi iznad polova.
Alat je postavio nekoliko pitanja: kome je namijenjen video, kakav bi trebao biti njegov ton, zabavan ili ozbiljan, treba li video biti više znanstven ili spektakularan i sl., a potom je napravio kratku skriptu teksta. Konačno je generirao video popraćen glasom kojem su se mogle mijenjati dimenzije, skripta teksta i neki drugi parametri. Bilo je moguće odabrati između muškog i ženskog glasa.
Pisanje
U alatu Write For Me pokušali smo napraviti znanstveno popularan tekst o nebinarnim osobama iz znanstvene perspektive. Alat je tražio dosta detaljnih uputa o tome što želimo da tekst sadrži. Trebalo je dosta truda, promptova, korekcija i dodatnih uputa da se dobije relativno pristojan, ali još uvijek generički tekst kojem je trebalo dodavati toliko ‘sočnih’ detalja da je postalo jasno da je još uvijek lakše pisati sam, ako želimo dobiti pošten tekst.
Tekst se nastavlja ispod oglasa
Alat se pokazao najkorisnijim kada je trebalo napisati pojedinačne kratke pasuse ili rečenice za koje je bilo dovoljno da budu jednostavne, a informativne. No, čak i one su ponekad sadržavale doslovne, nezgrapne prijevode iz engleskih medija poput Wikipedije. Postalo je očito da Write For Me zasigurno još neko vrijeme neće moći zamijeniti ni početnika na desku, a kamoli istraživačkog novinara, osobito na hrvatskom jeziku.
GPT-4o ima još cijeli niz drugih alata koji mogu biti korisni u rukama osobe koja zna kako bi trebao izgledati kvalitetan rezultat i usto zna i kako ga natjerati da ga daje.