Noul model AI al Meta este un expert în traduceri în timp real. SeamlessM4T poate traduce textul în vorbire și vorbirea în text

Meta, compania-mamă a Facebook, a făcut un pas important în domeniul traducerii în timp real a textului și vorbirii cu ajutorul inteligenței artificiale. Noul lor model AI, numit SeamlessM4T, este un model multimodal care poate traduce textul în vorbire și viceversa. Prin intermediul acestui model, Meta susține că a reușit să creeze „primul model AI de traducere și transcriere multilingvă multimodală”, capabil să traducă și să transcrie simultan în până la 100 de limbi diferite.

SeamlessM4T este un model AI revoluționar, care aduce mai multe funcționalități importante într-un singur pachet. Iată câteva dintre caracteristicile cheie ale acestui model:

  1. Traducere text în vorbire și viceversa: SeamlessM4T poate traduce textul în vorbire și vorbirea în text, oferind astfel o soluție completă pentru nevoile de traducere și transcriere.
  2. Compatibilitate cu multiple limbi: Acest model poate traduce în până la 100 de limbi diferite. De asemenea, suportă 35 de limbi pentru traducerea vorbirii în text și a textului în vorbire.
  3. Disponibilitate publică: Precum alte modele AI lansate recent de Meta, cum ar fi Llama 2 și AudioCraft, SeamlessM4T este disponibil public pentru cercetători și dezvoltatori, sub licență de cercetare.
  4. Date de antrenament extinse: Meta a lansat, împreună cu modelul SeamlessM4T, setul de date de antrenament numit SeamlessAlign. Acesta conține 270.000 de ore de înregistrări audio și alinieri de text. Acest set de date oferă resurse valoroase pentru dezvoltarea și îmbunătățirea sistemului de traducere și transcriere.

Dezvoltarea modelelor AI și utilizarea lor implică adesea probleme de etică și transparență. Cu toate acestea, Meta a ales să facă modelele lor AI open-source și disponibile publicului. Acest lucru le permite dezvoltatorilor să construiască și să îmbunătățească produsele, în timp ce câștigă puncte în ochii eticiștilor în domeniul IA, care solicită transparență în utilizarea sistemelor AI generative.

Deși abordarea Meta de a face modelele lor AI open-source poate părea altruistă, este, de asemenea, o mișcare strategică într-o piață extrem de competitivă, în care companii mari de tehnologie dezvoltă AI. De asemenea, există și problema colectării datelor, cu care se confruntă toate modelele AI. Meta susține că setul de date SeamlessAlign este format din date disponibile public, dar există în continuare probleme etice și juridice legate de utilizarea operelor protejate de drepturile de autor și a datelor personale fără consimțământ.

Deși nu au fost detaliate planuri specifice pentru utilizarea lui SeamlessM4T, Meta a dat de înțeles că dorește să exploreze cum acest model fundamental poate permite noi capabilități de comunicare. Asta înseamnă că, în viitor, s-ar putea să vedem o versiune destinată consumatorilor a lui SeamlessM4T pe platforme precum WhatsApp sau Instagram.

Razvan Alexandru

Dacă aveți sugestii, știri sau orice altceva legat de tehnologie pe care ați dori să le discutați cu mine, sunt mereu deschis la dialog și vă încurajez să mă contactați direct. Apreciem colaborările strânse și perspectivele inovative care ne permit să rămânem în avangarda domeniului.

„Tehnologia ne unește, pasiunea ne ghidează”

Age of Empires IV este în sfârșit disponibil pe consolele Xbox

Samsung adaugă funcții noi în actualizarea One UI 6 pentru Galaxy S23

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *