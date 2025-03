de Hannah Murphy, Cristina Criddle (San Francisco)

Meta intenționează să introducă funcții vocale îmbunătățite în cel mai recent model open-source de limbaj de mari dimensiuni, Llama 4, așteptat în următoarele săptămâni, au declarat persoane familiarizate cu această chestiune, pariind că viitorii așa-numiți agenți AI vor fi mai degrabă conversaționali decât textuali.

Compania s-a concentrat în special pe transformarea conversației dintre un utilizator și modelul său vocal mai aproape de un dialog natural bidirecțional, permițând întreruperile din partea utilizatorului mai degrabă decât un format mai rigid de întrebare și răspuns, a declarat o persoană din interior.

Impulsul pentru voce vine în contextul în care Zuckerberg, directorul executiv, a prezentat planuri îndrăznețe pentru a face din compania din Silicon Valley, cu o valoare de 1.700 de miliarde de dolari, „liderul AI”, numind 2025 un an decisiv pentru multe dintre produsele sale AI, în timp ce grupul concurează cu rivali precum OpenAI, Microsoft și Google pentru a comercializa tehnologia.

Acest lucru a determinat compania să analizeze posibilitatea de a testa abonamente premium pentru asistentul său de inteligență artificială Meta AI, pentru sarcini agențiale precum rezervări și crearea de videoclipuri, au declarat două persoane familiarizate cu această chestiune.

De asemenea, se ia în considerare introducerea publicității plătite sau a postărilor sponsorizate în rezultatele căutărilor asistentului său AI, a declarat una dintre persoane.

Zuckerberg a dezvăluit în acest an planurile de a construi un agent de inginerie AI care are abilitățile de codare și de rezolvare a problemelor ale unui inginer de nivel mediu, despre care a spus că are o potențială „piață foarte mare”. Meta a refuzat să comenteze.

Chris Cox, directorul de produs al grupului, a evidențiat miercuri unele dintre planurile sale pentru Llama 4, spunând că va fi un „model omni” prin care vorbirea va fi „nativă … mai degrabă decât să traducem vocea în text, să trimitem textul la LLM, să obținem textul și să îl transformăm din nou în vorbire”.

Vorbind la conferința Morgan Stanley despre tehnologie, media și telecomunicații, acesta a adăugat: „Cred că este o afacere uriașă pentru produsul de interfață, ideea că poți vorbi cu internetul și îl poți întreba orice. Cred că încă nu ne-am dat seama cât de puternic este acest lucru.”

Meta a discutat, de asemenea, barierele de protecție pe care cel mai nou model Llama ar trebui să le aibă în ceea ce privește ceea ce poate produce și dacă să le reducă, au declarat două persoane familiarizate cu această chestiune.

Discuțiile au loc pe fondul unei avalanșe de lansări din partea rivalilor și a avertismentelor din partea recent numitului „țar al AI” David Sacks, din Silicon Valley, care a declarat că dorește să se asigure că modelele IA din SUA nu sunt părtinitoare din punct de vedere politic sau „woke”.

OpenAI și-a lansat modul vocal anul trecut și s-a concentrat pe oferirea unor personalități distincte, în timp ce Grok 3, creat de xAI a lui Elon Musk și disponibil pe platforma X, și-a lansat caracteristicile vocale pentru anumiți utilizatori la sfârșitul lunii trecute.

Modelul Grok a fost conceput special pentru a avea mai puține garduri de protecție, inclusiv un „mod nebun” care răspunde în mod deliberat în moduri menite să fie „reprobabile, inadecvate și ofensatoare”, potrivit companiei.

Anul trecut, Meta a prezentat o versiune mai puțin „moralizatoare” a modelului său AI pentru a treia iterație Llama, în urma criticilor conform cărora Llama 2 refuza să răspundă la întrebări nevinovate.

Permiterea utilizatorilor să interacționeze cu un asistent AI folosind comenzi vocale este o caracteristică majoră a ochelarilor inteligenți Ray Bans ai Meta, care au devenit recent un mare succes în rândul consumatorilor.

Grupul și-a accelerat planurile de a construi căști ușoare care pot înlocui smartphone-ul ca principal dispozitiv de calcul al consumatorilor. Reportaj suplimentar realizat de Melissa Heikkilä în Londra

