AI report

AI report

0 49

De foarte mult timp spun că cercetarea chineză este cu mult înaintea celei occidentale în ceea ce privește inteligența artificială.
Dacă ar fi așa, de ce nu aruncă și chinezii pe piață ceva gen Open AI?” – mi se răspundea deseori. Degeaba explicam că există echivalente(Qwen, de exemplu) și că nu obligatoriu chinezii vor urma o cale similară celei occidentale în AI. De asemenea, argumentam cu faptul că întotdeauna China are o substanțială rezervă în zona subterană față de ceea ce se vede la suprafață. „Aiurea, n-au nimic!” – era replica seacă pe care o primeam. 

Iată că treburile s-au precipitat cu o palmă gravă pe care chinezii au dat-o industriei AI americane. Peste noapte, un startup necunoscut din China a aruncat pe piață un model care depășește cele mai importante LLM-uri ale momentului: GPT-4 de la Open AI, Claude aparținând  Anthropic, Llama de la Meta sau conaționalul Qwen, dezvoltat de Alibaba. Este o lovitură cu barosul întrucât în China se reușește lansarea unui model care efectiv rupe totul, schimbând regulile în industrie. Marea provocare este dată de costurile infime de dezvoltare ale chinezilor și necesităților hardware mult reduse față de cele ale competitorilor occidentali. 

Fără doar și poate, după apariția lui Deepseek sunt extrem de multe întrebări și, din nou, se transmite o undă de șoc bulei AI din SUA.
Startup-ul chinezesc a construit modelul său cu doar 5.6 milioane de dolari, ceea ce este o firimitură față de zecile de miliardele aruncate în aer de competitorii americani.
Toată lumea se întreabă cum a fost posibil așa ceva, în ciuda sancțiunilor americane. Desigur, au apărut pe piață și zvonacii care, instantaneu „au găsit răspunsul”: fondul finanțator al DeepSeek ar fi avut acces la exporturi ilegale de hardware din SUA.
Știți cum e asta? Exact ca aia cu rușii care au furat coiful nostru din muzeul olandez. 
Evoluția reală a fenomenului este însă alta, explicată de specialiștii din domeniu. Chinezii au mers pe tehnologii open source pe care le-au optimizat la extrem. Inclusiv fondatorul companiei, Liang Wenfeng, în numeroasele interviuri pe care le-a acordat mediei chineze, a arătat modul cât se poate de logic pe care a mers. Ideea e că DeepSeek nu este un fenomen doar pentru Occident, ci și pentru chinezi, apariția sa „de nicăieri” șocând inclusiv publicul și specialiștii Imperiului Celest. Chiar și acolo prețul de dezvoltare reușit de DeepSeek e considerat infim!

Aveți însă idee care a fost rețeta genială a lui Liang Wenfeng? Nu procesoarele complexe sau oamenii de top ai industriei au făcut posibil succesul, ci o genială strategie de … resurse umane.
Fondatorul DeepSeek nu a atras oameni scumpi din industrie, ci a recrutat strict tineri doctoranzi din universitățile de top din China, oameni care câștigaseră premii științifice importante și care erau dornici să dovedească ceea ce știu. Așa a reușit să combine prospețimea cunoștințelor din domeniu cu un cost redus al personalului. Este cumva invers față de cum procedează americanii.

Și, pentru că tot i-am adus în discuție pe americani, uitați-vă puțin la Stargate, „alianța” pe care a anunțat-o Trump cu surle și trâmbițe. Jumătate de trilion la prima strigare pentru „dominarea AI-ului” mondial. De fapt ce fac băieții ăia mânați de la spate de Trump? Pun la bătaie tehnologiile lor ultra-costisitoare încercând să facă ceva gigantic. De câte ori a ieșit ceva din proiecte de acest gen? Vă cer doar să priviți obiectiv la muntele de bani cheltuiți de SUA față de rezultatele lor. Și apoi să vă uitați puțin la rivali.

M-am jucat cu Kandinsky 3.1 al rușilor de la Sberbank. De altfel, imaginea care însoțește articolul de față este generată cu modelul rușilor. Nu mi se pare că atinge puterea Dall-e, dar nu este departe. Dacă însă facem comparația între banii păpați de Sam Altman și cei investiți de ruși, ajungem din nou la o prăpastie. Ceea ce ar trebui înțeles este că, în ciuda statutului pe care și-l alocă americanii, AI-ul a reușit să se democratizeze suficient de mult și de rapid, fără a le mai rezerva avantaje absolute, așa cum au avut în microelectronică și IT.

Vreau să vă spun că și noi ne jucăm cu diverse modele AI. Am folosit intens Llama de la Meta. Pentru anumite proiecte, modelele mai sărăcuțe în parametri s-au dovedit mult mai potrivite din punctul de vedere al rezultatelor. Important în domeniul AI nu este doar capacitatea de a obține rezultatul dorit ci, mai degrabă, obținerea rezultatului dorit cu un cost rezonabil.

Șocant în ceea ce privește DeepSeek este punerea la dispoziție a LLM-ului lor în regim open source. Întrebat de abordarea de-a dreptul șocantă pentru industrie, Liang Wenfeng a declarat că investiția companiei sale este una pe termen lung, că nu urmărește obligatoriu monetizarea acestui LLM după modelul urmat de companiile americane și că – aici m-a lăsat mască – oricum LLM-ul respectiv este un proiect marginal al companiei sale, altele fiind țintele urmărite. Luați-o p-asta!

Autor: Dan Diaconu
Sursa: trenduri.blogspot.com

COMENTARII

Acest site folosește Akismet pentru a reduce spamul. Află cum sunt procesate datele comentariilor tale.