Cuprins:
Aplicația a fost lansată acum mai puțin de o lună
Lansată pe 10 ianuarie, aplicația bazată pe modelul DeepSeek-V3 a câștigat rapid popularitate în SUA.
Creatorii săi susțin că acest model „se află în fruntea clasamentului printre modelele open-source și rivalizează cu cele mai avansate modele cu sursă închisă la nivel global”, potrivit datelor furnizate de compania de cercetare Sensor Tower, citată de Reuters.
DeepSeek, un laborator mai puțin cunoscut din China, a reușit să dezvolte modele de inteligență artificială care depășesc performanțele celor mai avansate modele din SUA. Acest lucru a fost realizat în ciuda costurilor reduse și a tehnologiei mai puțin avansate.
În decembrie, compania a prezentat un model de limbaj de mare anvergură, open-source, construit în doar două luni. Costul dezvoltării a fost sub 6 milioane de dolari, folosind cipuri Nvidia H800, mai puțin puternice decât cele de ultimă generație.
Rezultate superioare în teste independente
Modelul DeepSeek a depășit performanțele unor giganți precum Meta, OpenAI și Anthropic în diverse domenii, inclusiv rezolvarea problemelor complexe, matematică și codare.
Luni, compania a lansat r1, un model specializat pe raționament, care a obținut rezultate mai bune decât cel mai recent model OpenAI în numeroase teste.
:contrast(8):quality(75)/https://www.libertatea.ro/wp-content/uploads/feed/images/192_070c238e61ffc1fcf06b0d3ec18abe20.jpg)
„Modelul celor de la DeepSeek este impresionant, mai ales prin eficiența lor în utilizarea calculului la momentul inferenței. Este un semnal că trebuie să luăm foarte în serios progresele venite din China”, a declarat Satya Nadella, CEO-ul Microsoft într-o intervenție la Forumul Economic Mondial de la Davos.
Depășirea restricțiilor și inovația
Realizările DeepSeek sunt cu atât mai notabile cu cât compania a trebuit să depășească restricțiile stricte impuse de guvernul SUA asupra accesului Chinei la cipuri de înaltă performanță. Acest lucru sugerează fie că laboratorul a găsit metode de a ocoli aceste reguli, fie că măsurile de control nu sunt atât de eficiente cum s-a crezut.
„Au folosit o tehnică numită distilare, prin care un model mare ajută unul mai mic să învețe să devină mai eficient. Este o metodă foarte rentabilă”, a explicat Chetan Puttagunta, partener general la Benchmark.
Alți actori chinezi în cursa AI
DeepSeek nu este singurul actor chinez care avansează în domeniul inteligenței artificiale. Start-upul 01.ai al lui Kai-Fu Lee a fost antrenat cu un buget de doar 3 milioane de dolari.
De asemenea, ByteDance, compania-mamă a TikTok, a lansat recent o actualizare a modelului său, care depășește performanțele modelului o1 de la OpenAI.
:contrast(8):quality(75)/https://www.libertatea.ro/wp-content/uploads/feed/images/192_79071763ce178b3e4c1c8db1ef183910.jpg)
„Necesitatea stimulează inovația. Faptul că au fost obligați să găsească soluții alternative i-a condus, de fapt, la construirea unui model mult mai eficient”, a declarat Aravind Srinivas, CEO-ul Perplexity.
:contrast(8):quality(75)/https://www.libertatea.ro/wp-content/uploads/feed/images/281_bcf5a58904dbfe230b7e12d9986f58fe.jpg)
:contrast(8):quality(75)/https://www.libertatea.ro/wp-content/uploads/feed/images/153_838d7710e2cff83b7d1cc9f8f6501117.jpg)
:contrast(8):quality(75)/https://www.libertatea.ro/wp-content/uploads/feed/images/197_bb6b5b28e7e7a40949bccbd4e6f6c43b.jpg)
:quality(75)/https://www.libertatea.ro/wp-content/uploads/feed/images/276_45610f7df1a118599cc95e0b7135d282.png)
:contrast(8):quality(75)/https://www.libertatea.ro/wp-content/uploads/feed/images/43_c2e4f004d7cd8a7610ecaab17bd352b7.jpg)
:contrast(8):quality(75)/https://www.libertatea.ro/wp-content/uploads/feed/images/15_db78b0d65d3b1b16f647b6eb6de28dd9.jpg)
:contrast(8):quality(75)/https://www.libertatea.ro/wp-content/uploads/feed/images/253_6f14d31260853ce61f5d48565900b478.jpg)
:contrast(8):quality(75)/https://www.libertatea.ro/wp-content/uploads/feed/images/190_9cd4b8c31889dc5ded86db60a4db65b9.jpg)