Gemini kombinira mogućnosti AlphaGo-a i velikih jezičnih modela

Autor: Tanja Ivančić , 13. srpanj 2023. u 22:00
Google DeepMind rezultat je internog spajanja: DeepMinda i AI tima pod nazivom Google Brain/Shutterstock

U Googleu su osnovali novi odjel – Google Deep, razvija AI sustav s naprednim mogućnostima planiranja i rješavanja problema.

Utrka u razvoju umjetne inteligencije ne posustaje. Od lansiranja OpenAI-jevog ChatGPT-a, u lanjskom studenome, tehno velikani još su jače prionuli razvoju vlastitih proizvoda. Microsoft koji je i uložio u OpenAI, vrlo brzo je njegove sposobnosti tako integrirao u vlastitu tražilicu Bing, dok je Google lansirao Barda, koji je od jučer (četvrtak) dostupan i u Hrvatskoj.

No, ipak, kao ni ChatGPT, tako i Bing i Bard imaju svoja ograničenja. Prije svega, i dalje nisu posve pouzdani. Odgovori na neka banalna pitanja i dalje mogu biti netočno, nepotpuni ili izmišljeni.

Razvoj ‘iza 2021.’
Lansiranje ChatGPT-a pokrenulo je lavinu jer je na velika vrata prihvaćen u mainstreamu s obzirom na to da su mu sposobnosti vrlo jasne i vidljive. Pisanje tekstova, pjesama, sažimanje uradaka, mnogima su bili temelj za unapređenje svojih poslova, stvaranje botova. ChatGPT u osnovnoj, svima dostupnoj verziji, treniran je podacima do 2021. i ne pretražuje internet, dok Bing i Bard to čine, premda i dalje ne daju savršene podatke.

U pozadini, i velike i male tehno kompanije nastoje razviti pouzdanije proizvode temeljene na umjetnoj inteligenciji AI. U Googleu su pak, okupili tim i osnovali novi odjel – Google DeepMind, koji razvija novi sustav nazvan Gemini.

Google DeepMind rezultat je internog spajanja: Google je 2014. kupio startup DeepMind i vodio ga kao zasebnu tvrtku unutar svoje matične tvrtke Alphabet, dok je sam Google imao AI tim pod nazivom Google Brain. Google već godinama demonstrira napredak umjetne inteligencije, ali s eksplozijom ChatGPT-a i obnovljenom prijetnjom Microsofta u pretraživanju, Google i izvršni direktor Alphabeta Sundar Pichai donijeli su odluku da spoje timove DeepMinda i Google Braina te ih stave pod nadzor Googlea.

9

godina prošlo je otkako je Google kupio startup DeepMind

Na njegovu čelu je Demis Hassabis, suosnivač DeepMinda., koji je ustvrdio da će upravo Gemini pomesti svoju konkurenciju. Gemini je zapravo veliki jezični model sličan GPT-4 modelu koji pokreće ChatGPT. Međutim, Hassabis tvrdi da će njegov tim kombinirati tu tehnologiju s tehnikama korištenima u AlphaGou s ciljem da sustav dobije nove sposobnosti, poput planiranja ili rješavanja problema.

“Možemo reći da Gemini kombinira prednosti AlphaGoa i sličnih sustava s iznimnim jezičnim sposobnostima velikih modela. Imamo i dodatne inovacije koje će biti vrlo zanimljive”, kaže Hassabis, čiji će tim, dakle, raditi na unapređenju tehnologiju velikih jezičnih modela s alatima iz drugih područja umjetne inteligencije. Stručnjaci u DeepMindu rade u područjima koja se protežu od robotike do neuroznanosti.

AlphaGo temeljio se na tehnici nazvanoj “pojačano učenje” (eng. reinforcement learning), u kojem softver uči rješavati teške probleme koji zahtijevaju odabir radnji, poput igre “Go” ili videoigara, ponavljajući pokušaje i dobivajući povratnu informaciju o svojoj izvedbi. Također je koristio metodologiju “pretraživanja stabla” (eng. tree search) za istraživanje i pamćenje mogućih poteza na ploči.

Sljedeći veliki korak za jezične modele može uključivati obavljanje više zadataka na internetu i računalima. Kako je to nedavno Hassabis pojasnio u intervjuu za The Verge: Postoji puno više vrsta umjetne inteligencije od generativne umjetne inteligencije koja je sada “in” stvar, ali mislim da će planiranje i rješavanje problema i rasuđivanje, stići u sljedećem valu nakon ovoga, zajedno s trenutačnim mogućnostima sadašnjeg sustava.

Dakle, mislim da ćemo za godinu ili dvije govoriti o potpuno novim vrstama proizvoda i iskustava i usluga s dosad neviđenim mogućnostima.

Što, primjerice, uključuje razvoj chatbota i sličnih sustava koji će postati svestrani osobni pomoćnici. Ti pomoćnici će pružati korisne informacije i usluge, od preporuka za čitanje knjiga i događanja do rezerviranja putovanja i pomoći u svakodnevnim zadacima.

Proizvodi sljedeće generacije
Trenutni chatbotovi su samo početna točka, jer nedostaje im planiranje, rezoniranje i pamćenje. U istraživanju se razvijaju alati koji koriste velike jezične modele i druge AI sustave kako bi riješili specijalizirane zadatke, a rezultati se korisniku prenose kroz sučelje prirodnog jezika.

Sljedeća generacija sustava koristit će te mogućnosti, omogućujući korisnicima pristup različitim specijaliziranim AI alatima preko središnjeg jezičnog modela. To će biti nova era u kojoj će korisnici interakciju s AI sustavom doživljavati kao jednostavno korištenje jezičnih naredbi za dobivanje rješenja za svoje potrebe, pojašnjava Demis Hassabis.

Ističe da je vrlo uzbuđen što vodi Google DeepMind sada, u ovoj novoj eri, a fokusiran je na izradu proizvoda sljedeće generacije koje pokreće AI. Gemini je u razvoju, i vjerojatno će zamijeniti PalM2, koji sada pogodni Barda.

Komentirajte prvi

New Report

Close