Prošlog mjeseca, kineski startup DeepSeek zadivio je međunarodnu tehnološku zajednicu svojim najnovijim open-source modelom umjetne inteligencije. Model DeepSeek-V3 nudi performanse usporedive s onima bogatijih američkih konkurenata poput OpenAI-a. Prošli tjedan ponovno je impresionirao s R1, svojim prvim korakom u AI zaključivanju.
Međutim, R1 i DeepSeek nisu iznimke, piše Financial Times. Od sredine prošle godine, kineske tehnološke kompanije poput Alibaba, Tencent, ByteDance, Moonshot i 01.ai postepeno smanjuju zaostatak za američkim konkurentima, izjednačujući svoje mogućnosti i nadmašujući ih u troškovnoj učinkovitosti.
Veća samostalnost
Uspjeh Kine u učinkovitosti nije slučajnost. To je izravan odgovor na sve strože restrikcije izvoza koje nameću SAD i njegovi saveznici. Ograničavanjem kineskog pristupa naprednim čipovima za umjetnu inteligenciju, SAD je nenamjerno potaknuo inovacije.
Kako bi smanjile ovisnost o vrhunskim čipovima iz inozemstva, kineske AI kompanije eksperimentirale su s inovativnim pristupima u algoritmima, arhitekturi i strategijama treniranja. Mnogi su prigrlili pristup “mješavine stručnjaka”, fokusirajući se na manje AI modele obučene na specifičnim podacima, koji pružaju snažne rezultate uz smanjenu potrošnju računalnih resursa.
DeepSeek-V3 utjelovljuje uspjeh ovog snalažljivog pristupa. Prema tehničkom izvještaju, model je treniran u podatkovnom centru pogonjenom Nvidia H800 GPU-ovima – manje naprednim čipovima u usporedbi s najnovijim izdanjima Nvidije. Unatoč tome, DeepSeek je završio trening za samo dva mjeseca uz trošak od 5,5 milijuna dolara – djelić iznosa koji, prema izvještajima, troše američke kompanije poput OpenAI-a.
DeepSeek je također drastično smanjio troškove inferencije, zaradivši nadimak “Pinduoduo AI-ja”, referencu na poslovni model s niskim troškovima popularnog kineskog giganta e-trgovine. Ovo postignuće ima duboke implikacije jer dovodi u pitanje uvriježeno mišljenje da vrhunska umjetna inteligencija zahtijeva ogromne količine računalne snage i milijarde dolara. DeepSeek pokazuje kako softverska domišljatost može nadomjestiti ograničenja hardvera.
Također, razotkriva ograničenja američkih izvoznih kontrola dizajniranih da uspore kineski napredak u AI-ju. Iako te mjere mogu prouzročiti kratkoročne poremećaje, njihov se utjecaj smanjuje s vremenom kako se Kina prilagođava i inovira.
Neugodna istina za američke donositelje politika jest da su stroge izvozne kontrole prisilile kineske tehnološke tvrtke na veću samostalnost, potičući proboje koji možda ineče ne bi nastali. Međutim, nisu svi složni. Gregory Allen, direktor Wadhwani AI centra pri think-tanku Center for Strategic and International Studies, smatra da bi Kina napredovala i bez američkih restrikcija.
Kineska vlada već dugo ima ambiciju pretvoriti zemlju u AI supersilu, ali njezin dosadašnji učinak u alokaciji resursa bio je slab. Državne inicijative često rezultiraju neučinkovitošću, korupcijom i rasipanjem – stvarnost koja je jasno ilustrirana skandalima i sporim napretkom u kineskoj industriji poluvodiča.
Poticaj privatnog sektora
Ono što su američke restrikcije AI-ju nenamjerno postigle jest snažan komercijalni poticaj za kineski privatni sektor da popuni prazninu. Dok SAD često dominira u pionirskom istraživanju, kineske kompanije briljiraju u provedbi, pristupačnosti i širenju proizvoda. U e-trgovini, električnim vozilima, solarnim panelima i baterijama pokazale su impresivnu sposobnost skaliranja.
Uspon DeepSeeka živopisan je podsjetnik da ograničenja mogu potaknuti inovaciju. Za novu administraciju Donalda Trumpa to postavlja neugodno pitanje: hoće li sve strože sankcije Kini ubrzati upravo onaj napredak koji su dizajnirane da spriječe?
Važna obavijest:
Sukladno članku 94. Zakona o elektroničkim medijima, komentiranje članaka na web portalu Poslovni.hr dopušteno je samo registriranim korisnicima. Svaki korisnik koji želi komentirati članke obvezan je prethodno se upoznati s Pravilima komentiranja na web portalu Poslovni.hr te sa zabranama propisanim stavkom 2. članka 94. Zakona.Uključite se u raspravu