Viskas, ką reikia žinoti apie „DeepSeek“ fenomeną

DeepSeek programėlė greitai tapo populiariausia nemokama programėle JAV, aplenkdama net patį OpenAI kurtą ir visiems gerai pažįstamą ChatGPT.

Šarūnas Dignaitis Kerpė

2/3/20254 min read

Skambioms antraštėms atslūgus: viskas, ką reikia žinoti apie „DeepSeek“ fenomeną

Pirmiausia, visi iki skausmo žinome, kad Kinijos dirbtinio intelekto startuolis DeepSeek sukūrė naują dirbtinio intelekto pokalbių robotą, kuri netikėtai sudrebino technologijų industriją.
Ši programa greitai tapo populiariausia nemokama programėle JAV, aplenkdama net patį OpenAI kurtą ir visiems gerai pažįstamą ChatGPT.

Tai, žinoma, turėjo poveikį rinkai - Nvidia (grafinių procesorių, ant kurių pastatytos visos didžiųjų kalbos modelių programėlės gamintoja) patyrė didžiulį smūgį. DeepSeek iškilimas sukėlė milžinišką reakciją rinkoje, Nvidia vertė sumažėjo net 600 mlrd. Dolerių. Tai tapo didžiausiu vienos dienos nuostoliu bet kuriai JAV įmonei per visą istoriją. Nasdaq Composite indeksas atsidarant rinkai taip pat smuko 3,4%, o Nvidia akcijos nukrito 17%.

Ką tai reiškia platesniame kontekste? Pavadinčiau tai dirbtinio intelekto lenktynėmis: JAV prieš Kiniją. JAV prezidentas Donaldas Trumpas pavadino DeepSeek „žadintuvu“ Amerikos technologijų sektoriui. Dirbtinio intelekto konkurencija stiprėja - Kinija dabar laikoma rimta varžove JAV dirbtinio intelekto srityje.

Sąnaudų efektyvumas - pagrindinis DeepSeek pranašumas. DeepSeek buvo sukurtas vos už 6 mln. dolerių, kai tuo tarpu JAV technologijų milžinės išleidžia šimtus milijonų. Bent jau taip yra komunikuojama iš Kinijos pusės. Tačiau, kaip ir su elektromobilių kainomis - vakarų rinka linkę daryti prielaidas, kad kainos mažinamos dėl valstybinių subsidijų, kad būtų daug lengviau įeiti į užsienio rinkas, o tuopat - dalis žemų kainų laikoma ir tam tikra propogandos priemone.

Įdomu ir tai, kad modelis veikia su senesniais ir mažiau galingais lustais, todėl yra pigesnis, bet vis tiek užtikrina aukštą našumą. Čia - arčiau realių faktų, nes grafiniai procesoriai, kuriuos eksportuoja JAV yra sankcijų prekė ir naujausi procesoriai Kinijos nepasiekia. Ko gero, tai dar vienas DeepSeek pranašumas - apeiti grafinių procesorių limitacijas ir gauti tokį pat ar panašų rezultatą su senesne ir pigesne technologija.

Pabandysiu greituoju aptarti DeepSeek R1 modelių mokymą nes jis kiek kitoks nei OpenAI ChatGPT. Šis metodas, trumpai tariant, reikalauja mažiau laiko ir sąnaudų, tačiau leidžia pasiekti aukštą našumą. DeepSeek tikslas - pasiekti dirbtinį bendrąjį intelektą (AGI). Jo pažanga samprotavimo (reasoning) gebėjimuose žymi svarbų dirbtinio intelekto plėtros etapą.

Pagrindinės R1 modelio inovacijos:

sustiprintas mokymasis (Reinforcement Learning).
DeepSeek tai taikė dideliu mastu bei orientavo į samprotavimo užduotis.
Atlygio inžinerija (Reward Engineering). Sukurtas taisyklių pagrindu veikiantis atlygio modelis, kuris lenkia tradicinius neuroninius atlygio modelius. Atlygio inžinerija, beje, tai dirbtinio intelekto mokymo proceso optimizavimo metodas, padedantis nukreipti modelio mokymą tinkama linkme.

Distiliacija (Distillation). Taikant efektyvius žinių perdavimo metodus, DeepSeek tyrėjai sugebėjo suspausti modelio galimybes į vos 1,5 mlrd. parametrų turinčius modelius.
Emergentinio elgesio tinklas (Emergent Behavior Network). DeepSeek atrado, kad sudėtingi samprotavimo modeliai gali natūraliai atsirasti taikant stiprinamąjį mokymą, net ir be aiškaus jų programavimo.

Dar vienas svarbus aspektas, kuris nuaidėjo socialiniuose tinkluose - geopolitiniai ir reglamentavimo iššūkiai. DeepSeek programėlė yra cenzūruojama Kinijoje, ribojant diskusijas apie Tiananmeną, Tibetą ir kitas jautrias temas komunistų partijai. Tačiau atvirojo kodo modelis leidžia nepriklausomiems kūrėjams visame pasaulyje laisvai naudoti ir modifikuoti dirbtinį intelektą. Tai ganėtinai įdomus derinys - autokratinio pobūdžio cenzūra ir istorijos iškraipymas bei demokratinis atvirojo kodo modelis laisvam naudojimui.

DeepSeek populiarumas neliko nepastebėtas kibernetinių nusikaltėlių.

2025 m. sausio 27 d. DeepSeek pranešė apie didelio masto kenkėjiškas atakas prieš savo paslaugas, dėl kurių bendrovė buvo priversta laikinai apriboti naujų vartotojų registraciją.
Atakos laikas sutapo su tuo, kai DeepSeek AI asistentas aplenkė ChatGPT ir tapo labiausiai atsisiunčiama programėle Apple App Store.

Nepaisant atakos, DeepSeek išlaikė paslaugų prieinamumą esamiems vartotojams.
Incidentas tęsėsi iki sausio 28 d., tačiau bendrovė pranešė, kad nustatė problemos priežastį ir įdiegė sprendimą.

DeepSeek neatskleidė tikslaus atakos pobūdžio, tačiau viešai sklandančios spekuliacijos rodo, kad tai buvo DDoS ataka, nukreipta į API ir žiniatinklio pokalbių platformą.

Dar vienas iššūkis - sausio 29 d. Wiz Research - debesų saugumo įmonės Wiz Inc. tyrimų grupė paskelbė apie viešai prieinamą DeepSeek duomenų bazę, kurioje nutekėjo jautri informacija. Nutekėję duomenys:

DeepSeek pokalbių istorija
Vidiniai sistemos duomenys
Žurnalo srautai (log streams)
API raktai
Operacinės detalės

DeepSeek pašalino duomenų bazę iš viešosios prieigos iškart po to, kai buvo informuota apie pažeidimą. Tačiau nėra aišku, kiek laiko duomenys buvo prieinami internete.

DeepSeek populiarumo pasekmės aiškios, bet kokių galimų pasekmių šis modelis gali turėti JAV ir Europos dirbtinio intelekto plėtrai?

Pirmiausia, JAV technologijų įmonės gali būti priverstos persvarstyti savo uždaros ekosistemos strategiją, kad išliktų konkurencingos. Europa, iki šiol atsiliekanti dirbtinio intelekto srityje, tikėtina, galėtų pasimokyti iš Kinijos mažų kaštų ir didelio efektyvumo modelio.

Pabaigai, „DeepSeek“ įkūrėjas Liang Wenfengas sulaukė didvyrio statuso pietinėje Kinijos Guangdongo provincijoje, kur jis užaugo ir, kaip pranešama, sugrįžo švęsti Kinų Naujųjų metų, bet jau lydimas apsaugos darbuotojų.

40-metis Wenfengas jau yra milijardierius dėl savo rizikos draudimo fondo „High-Flyer“, tačiau vietiniai gyventojai jį dar labiau vertina po „DeepSeek“ proveržio. Tai parodė, kad stiprius dirbtinio intelekto modelius galima kurti naudojant mažiau ir silpnesnių „Nvidia“ lustų. Šis atradimas turi didelę reikšmę, ypač Kinijoje, kur prieiga prie pažangiausių lustų yra apribota.

Wenfengo gimtosios bendruomenės gyventojai „Financial Times“ pasakojo, kad jis buvo „puikus mokinys“, mėgęs komiksus, turėjęs išskirtinių matematikos gabumų ir kilęs iš pedagogų šeimos. Pasak vieno vietinio gyventojo, Wenfengas taip pat žaidė futbolą. „Mes visi augome šiame kaime, - sakė jis Financial times. - Labai juo didžiuojamės.“

Nepaisant sparčiai kylančios sėkmės, Wenfengas vengia viešo dėmesio, kas nuvilia tuos, kurie nori daugiau apie jį sužinoti. Atsižvelgiant į tokių Kinijos verslo magnatų kaip Jackas Ma ir Pony Ma likimą - jie susidūrė su valdžios institucijų dėmesiu dėl per didelio matomumo - taigi, nereikėtų stebėtis, jei Wenfengas pasirinks likti šešėlyje.