Objavljivanje najnovijeg modela kineskog AI startupa DeepSeek poremetilo je tehnološki sektor i uzrokovalo 1 bilijun dolara gubitaka na burzi u ponedjeljak. Nvidia, vodeći svjetski proizvođač grafičkih procesorskih jedinica (GPU), izgubila je 593 milijarde dolara tržišne kapitalizacije. Američke kontrole izvoza naprednih poluvodiča i proizvodne opreme, koje su osmišljene da ometaju kineske AI tvrtke poput DeepSeeka, potaknule su tvrtku da se odrekne skupog hardvera što je rezultiralo mnogo isplativijim AI modelom od američkih pandana.
DeepSeek je prošlog tjedna objavio svoj model R1, koji je u izvedbi
ravnopravan sličnom modelu koji je razvio OpenAI. Razvoj modela R1 je navodno
koštao samo 5,6 milijuna dolara, što je omogućeno
korištenjem klastera memorijsko ograničenih Nvidia H800 čipova umjesto H100, od kojih
stotine tisuća koriste američke AI tvrtke.
SAD su uvele politike kontrole izvoza, kojima je zabranjena prodaja grafičkih kartica H100 kineskim tvrtkama u rujnu 2022. i H800 u 2023. koje je DeepSeek kupio prije tih zabrana.
Kako bi zaobišao memorijska ograničenja, DeepSeek je "programirao 20 od 132 procesorske jedinice na svakoj H800 kartici posebno za upravljanje komunikacijama između čipova modificiranjem skupa instrukcija niske razine za Nvidia GPU-ove",
piše tehnološki izvjestitelj Ben Thompson. Tvrtka je također koristila mješavinu ekspertnih modela i drugih optimizacija softvera kako bi smanjila troškove obuke i zaključivanja,
objašnjava Morgan Brown, potpredsjednik Dropboxa za proizvode i rast AI proizvoda. Optimizacija hardvera i softvera omogućila je tvrtki da smanji troškove obuke modela sa 100 milijuna dolara na 5 milijuna dolara, sa 100.000 na 2.000 GPU-a i smanji troškove API-ja za 95 posto, prema Brownu.
Unatoč vrhunskoj efikasnosti, postoje neke stvari koje DeepSeek ne može učiniti. Ako ga netko pita, na primjer, "Reci mi što se dogodilo na Tiananmenu 1989.", odgovorit će: "Oprostite, to je izvan mog trenutnog opsega. Razgovarajmo o nečem drugom." DeepSeek, kao i svi kineski modeli umjetne inteligencije, zakonski je obvezan "ugraditi ideološku cenzuru Komunističke partije Kine (KPK) u svoje modele", objavila je nevladina organizaciji
Human Rights in China koju su osnovali kineski iseljenici za promicanje ljudskih prava u Kini i inozemstvu.
Iako su DeepSeekovi odgovori hendikepirani propagandom KPK, njegov kod nije: DeepSeekovi modeli otvorenog koda slobodno su dostupni programerima koji mogu ukloniti cenzuru KPK iz koda, izvještava
The Wall Street Journal.
Američka kontrola izvoza naprednih grafičkih procesora i opreme nije zaustavila razvoj kineske umjetne inteligencije. Samo ga je usporila i potaknula računalno efikasniji razvoj, naštetivši američkoj ekonomskoj konkurentnosti i tehnološkoj prednosti.
-----------------
Članak je originalno objavljen na portalu ReasonAutor: Jack NicastroPrijevod: Mario Nakić