Piše: Jack Nicastro
Izvor: Reason.com
Photo: Wikipedia
29.1.2025.
Piše: Jack Nicastro
Izvor: Reason.com
Photo: Wikipedia
29.1.2025.
Objavljivanje najnovijeg modela kineskog AI startupa DeepSeek poremetilo je tehnološki sektor i uzrokovalo 1 bilijun dolara gubitaka na burzi u ponedjeljak. Nvidia, vodeći svjetski proizvođač grafičkih procesorskih jedinica (GPU), izgubila je 593 milijarde dolara tržišne kapitalizacije. Američke kontrole izvoza naprednih poluvodiča i proizvodne opreme, koje su osmišljene da ometaju kineske AI tvrtke poput DeepSeeka, potaknule su tvrtku da se odrekne skupog hardvera što je rezultiralo mnogo isplativijim AI modelom od američkih pandana.
DeepSeek je prošlog tjedna objavio svoj model R1, koji je u izvedbi ravnopravan sličnom modelu koji je razvio OpenAI. Razvoj modela R1 je navodno koštao samo 5,6 milijuna dolara, što je omogućeno korištenjem klastera memorijsko ograničenih Nvidia H800 čipova umjesto H100, od kojih stotine tisuća koriste američke AI tvrtke.
SAD su uvele politike kontrole izvoza, kojima je zabranjena prodaja grafičkih kartica H100 kineskim tvrtkama u rujnu 2022. i H800 u 2023. koje je DeepSeek kupio prije tih zabrana.
Kako bi zaobišao memorijska ograničenja, DeepSeek je "programirao 20 od 132 procesorske jedinice na svakoj H800 kartici posebno za upravljanje komunikacijama između čipova modificiranjem skupa instrukcija niske razine za Nvidia GPU-ove", piše tehnološki izvjestitelj Ben Thompson. Tvrtka je također koristila mješavinu ekspertnih modela i drugih optimizacija softvera kako bi smanjila troškove obuke i zaključivanja, objašnjava Morgan Brown, potpredsjednik Dropboxa za proizvode i rast AI proizvoda. Optimizacija hardvera i softvera omogućila je tvrtki da smanji troškove obuke modela sa 100 milijuna dolara na 5 milijuna dolara, sa 100.000 na 2.000 GPU-a i smanji troškove API-ja za 95 posto, prema Brownu.
Unatoč vrhunskoj efikasnosti, postoje neke stvari koje DeepSeek ne može učiniti. Ako ga netko pita, na primjer, "Reci mi što se dogodilo na Tiananmenu 1989.", odgovorit će: "Oprostite, to je izvan mog trenutnog opsega. Razgovarajmo o nečem drugom." DeepSeek, kao i svi kineski modeli umjetne inteligencije, zakonski je obvezan "ugraditi ideološku cenzuru Komunističke partije Kine (KPK) u svoje modele", objavila je nevladina organizaciji Human Rights in China koju su osnovali kineski iseljenici za promicanje ljudskih prava u Kini i inozemstvu.
Iako su DeepSeekovi odgovori hendikepirani propagandom KPK, njegov kod nije: DeepSeekovi modeli otvorenog koda slobodno su dostupni programerima koji mogu ukloniti cenzuru KPK iz koda, izvještava The Wall Street Journal.
Američka kontrola izvoza naprednih grafičkih procesora i opreme nije zaustavila razvoj kineske umjetne inteligencije. Samo ga je usporila i potaknula računalno efikasniji razvoj, naštetivši američkoj ekonomskoj konkurentnosti i tehnološkoj prednosti.
-----------------
Članak je originalno objavljen na portalu Reason
Autor: Jack Nicastro
Prijevod: Mario Nakić