Grupul chinez de tehnologie Ant, afiliat companiei Alibaba a lui Jack Ma, a folosit semiconductori produși în China, în combinație cu chip-uri de generație mai veche ale Nvidia, pentru a dezvolta tehnici de antrenare a modelelor de inteligență artificială (AI) care reduc nu doar timpii de dezvoltare a sistemelor AI, ci și costurile cu până la 20%, scrie Bloomberg.
Cipurile autohtone au venit de la Alibaba și Huawei, iar rezultatele modelelor de inteligență artificială sunt comparabile, conform surselor Bloomberg, cu cele obținute prin utilizarea exclusivă a cipurilor H800 de la Nvidia, companie care este parte la regimul SUA de restricții la export de semiconductori și tehnologie avansată către China.
În prezent, Ant folosește în special semiconductori produși în China, potrivit Bloomberg. Până acum, SUA au încercat să reducă abilitatea companiilor chineze de a dezvolta sisteme AI care să concureze cu cele din Vest restricționând accesul Chinei la semiconductori avansați din punct de vedere tehnologic.
Un nou moment Sputnik în lupta pentru supremație în domeniul AI
Ant, cu sediul în Hangzhou, folosește în continuare cipuri Nvidia de generație mai veche pentru dezvoltarea AI, dar se bazează tot mai mult la dezvoltarea modelelor sale recente pe alternative, inclusiv de la Advanced Micro Devices Inc. și producători chinezi.
Inițiativa plasează Ant într-o poziție importantă în competiția tot mai intensă dintre firmele chineze și cele americane în domeniul AI, mai ales după ce modelul chinez de AI DeepSeek a demonstrat că modele de ultimă generație pot fi antrenate la costuri mult mai mici decât investițiile de miliarde făcute de OpenAI și Google.
Compania chineză susține și că modelele sale au depășit, în anumite teste, performanțele Meta Platforms Inc, mai scrie Bloomberg, care adaugă că nu a putut verifica independent afirmația. Dacă rezultatele sunt confirmate, modelele dezvoltate de Ant ar putea marca un progres semnificativ pentru inteligența artificială chineză, reducând costurile de inferență și îmbunătățind serviciile AI.
Companiile chineze reușesc să producă modele performante, cu bani mai puțini
Companiile de AI au început să schimbe modalitatea în care antrenează modelele de inteligență articială, cu un accent pe eficiență, după succesul DeepSeek. Tehnica Mixture of Experts (MoE), adoptată și de Google – care urmărește reducerea costurilor –, împarte sarcinile în seturi mai mici de date, similar cu modul în care o echipă de specialiști lucrează la diverse segmente ale unui proiect.
Antrenarea modelelor MoE necesită însă cipuri de înaltă performanță, precum unitățile de procesare grafică (GPU) produse de Nvidia, ale căror costuri ridicate au fost până acum un obstacol pentru firmele mai mici. Ant și alte companii chineze lucrează în prezent la metode de antrenare mai eficiente pentru modelele mari de limbaj (LLM), eliminând această barieră.
Strategia companiilor chineze contrazice inclusiv presupunerile Nvidia cu privire la piața de semiconductori, al cărei CEO, Jensen Huang, susține că cererea pentru putere de calcul va continua să crească, iar companiile vor avea nevoie de cipuri tot mai performante pentru a genera venituri mai mari, nu de alternative mai ieftine pentru reducerea costurilor.
Progresul Ant Group în AI și aplicațiile sale
O analiză realizată de Bloomberg Intelligence indică spre faptul că progresul rapid al inovației tehnologice în China ar putea permite țării să devină autosuficientă în domeniul AI, prin utilizarea modelelor mai eficiente din punct de vedere al costurilor, ca răspuns la restricțiile SUA privind cipurile Nvidia.
Ant susține că a cheltuit aproximativ 6,35 milioane de yuani (880.000 de dolari) pentru a antrena un model folosind hardware de înaltă performanță, dar noua sa metodă optimizată ar reduce costul la 5,1 milioane de yuani utilizând hardware mai puțin performant.
Compania intenționează să folosească modelele sale de AI în soluții AI industriale, inclusiv în domeniul sănătății și al finanțelor. Ant a achiziționat recent platforma online chineză Haodf.com pentru a-și extinde serviciile AI în domeniul sănătății și a creat asistentul AI Doctor Assistant, care ajută medicii în gestionarea dosarelor medicale. De asemenea, compania oferă și o aplicație AI de asistență zilnică și un serviciu de consultanță financiară.
În același timp, pe partea de înțelegere a limbii engleze, Ant susține că modelul său Ling-Lite a depășit unul dintre modelele Llama de la Meta într-un test de referință important. Totodată, Ambele modelele Ant ar fi avut performanțe mai bune decât modelele DeepSeek la testele de limbă chineză.
Cum diferă modelele chinezești de cele vestice
Modelul Ling-Lite al Ant conține 16,8 miliarde de așa-numiți parametri, iar modelul AI Ling-Plus are 290 de miliarde, ceea ce îl plasează în standardele modelelor mari. Comparativ, se estimează că GPT-4.5 de la OpenAI are 1,8 trilioane de parametri, conform MIT Technology Review, iar DeepSeek-R1 are 671 de miliarde.
Comparativ cu sistemele vestice, modelul DeepSeek-R1 și celelalte modele chinezești nu folosesc toți parametri la un nivel constant, ceea ce reduce consumul de energie, ci ține mare parte din parametri în rezervă pentru când are nevoie să îi folosească, specific. În funcție de cerințe. Totodată, chinezii își fac modelele open-source (pot fi downloadate și reproduse sau îmbunătățite), ceea ce contrastează puternic cu abordarea americană, axată pe comercializare și profitabilitate.
Ant a lansat luni modele dedicate sectorului medical
Competiția pe zona AI s-a întețit în ultimele luni. Într-un document de politică publicat în ianuarie, OpenAI a îndemnat guvernul SUA să sprijine dezvoltarea inteligenței artificiale americane, pentru a evita ca modelele chinezești să le egaleze sau să le depășească în capacitate.
Luni, Ant a anunțat că a dezvoltat modele AI dedicate sectorului medical, utilizate deja de șapte spitale și furnizori de servicii de sănătate în orașe precum Beijing și Shanghai. Aceste modele folosesc sistemele chineze DeepSeek-R1, Alibaba Qwen precum și propriile sisteme Ant Group pentru consultanță medicală.
(Citește și: ”Bornă în AI: Modelul low-cost de Inteligență Artificială al start-up-ului chinez DeepSeek produce derută pe bursele internaționale – Momentul Sputnik pentru AI”)
***