Міжнародна команда IT-фахівців розробила модель штучного інтелекту SEAMLESSM4T, яка здатна виконувати точний переклад текстів та усного мовлення в чотирьох режимах, перевершуючи існуючі аналоги.
Штучний інтелект (ШІ) продовжує вдосконалюватися, досягаючи нових рівнів функціональності та якості. Серед останніх досягнень — модель SEAMLESSM4T, яку розробили спільно IT-компанії та наукові установи. Як зазначено в журналі Nature, ця модель здатна перекладати мову у різних форматах: з тексту в текст, з тексту в мову, з мови в текст і з мови в мову. Крім того, система виконує автоматичне розпізнавання мовлення, що дозволяє перетворювати звук на текст без перекладу.
Ключовою перевагою SEAMLESSM4T є висока точність роботи. У режимі speech-to-speech (переклад мови у мову) рівень точності нейромережі перевершує попередників на 23%. Цей режим підтримує переклад зі 101 мови на 36, тоді як speech-to-text охоплює 96 мов як мови виходу. Аналогічно, text-to-speech і text-to-text підтримують велику кількість мов, забезпечуючи універсальність для користувачів з усього світу.
Ще одним важливим аспектом є оптимізація роботи в складних умовах. SEAMLESSM4T краще приглушує фонові шуми і коригує зміну гучності голосу, що робить її більш адаптованою до реального середовища. Окрім того, розробники впровадили механізми безпеки, що мінімізують ризики токсичного контенту та гендерних стереотипів у перекладах.
Нова технологія стане доступною для некомерційного використання, відкриваючи можливості для широкого застосування в міжнародному спілкуванні. Як зазначають автори, SEAMLESSM4T може стати для сучасного світу тим самим, чим уявна “вавилонська рибка” була для персонажів творів Дугласа Адамса, тобто ідеальним інструментом для подолання мовних бар’єрів.