Новият AI на Meta превежда 200 езика в реално време

Pixabay.com
PublicDomainPictures

Новият AI на Meta превежда 200 езика в реално време

Моделът надхвърля възможностите на досегашните системи за точен превод на по-редките езици

Мария Динкова
303 прочитания

Pixabay.com

© PublicDomainPictures


Тази седмица Meta обяви първия си голям успех при амбициозния проект No Language Left Behind, който стартира преди половин година и има за цел да обучава изкуствен интелект да превежда безпроблемно между множество езици, без да преминава през английски. Последният AI модел на компанията NLLB-200 вече може да превежда 200 различни езика и подобрява качеството на преводите спрямо предишните технологии с 44%.

"Шепа езици - включително английски, мандарин, испански и арабски - доминират мрежата. Хората, за които тези широко говорени езици са майчини, могат да приемат за даденост колко значимо е да четеш нещо на своя роден език. NLLB ще помогне на повече хора да четат на своя предпочитан език, вместо винаги да се нуждаят от междинен, който често грешно предава чувството и съдържанието", посочват от Meta в блог публикация.

Досега преводите между два езика, особено когато нито един от тях не е английски, се оказваше значително предизвикателство за AI езиковите модели. Една от основните причини за това е, че много от системите разчитат на написани данни, взети от интернет, за обучението на моделите.

За да покрият нужното качество на съдържанието, от Meta създават FLORES-200 - база данни, която дава възможност на изследователите на оценяват работата на новия AI модел при 40 хил. различни езикови направления. FLORES-200 позволява на практика да се измери работата на NLLB-200 във всеки език, за да се потвърди, че преводът е с високо качество. Затова новият модел сега постига със 70% по-голяма точност при превода на някои африкански и индийски диалекти.

Подобно на други публични програми с изкуствен интелект, Meta решава да отвори NLLB-200 моделите и FLORES-200 базите данни за разработчиците в допълнение към кода за обучение на модела и кода за пресъздаване на обучителните бази данни. Освен това компанията ще осигури 200 хил. долара в грантове за неправителствени организации, за да разработят реални приложения за технологията.

Например тя може да се използва в страницата с новините на Facebook или Instagram, където само с един клик публикациите ще могат да бъдат превеждани на игбо или луганда. Освен това подобни възможности на изкуствения интелект имат потенциала да помогнат за развиването на метавселената, както и за разширяването на преводите в Wikipedia с повече езици.

"Това може да помогне да се развият други технологии като създаване на асистенти, които работят добре с езици като явански и узбекски, или за изграждане на системи, които добавят точни субтитри на боливудските филми на суахили или оромо език", заключват от Meta.

Тази седмица Meta обяви първия си голям успех при амбициозния проект No Language Left Behind, който стартира преди половин година и има за цел да обучава изкуствен интелект да превежда безпроблемно между множество езици, без да преминава през английски. Последният AI модел на компанията NLLB-200 вече може да превежда 200 различни езика и подобрява качеството на преводите спрямо предишните технологии с 44%.

"Шепа езици - включително английски, мандарин, испански и арабски - доминират мрежата. Хората, за които тези широко говорени езици са майчини, могат да приемат за даденост колко значимо е да четеш нещо на своя роден език. NLLB ще помогне на повече хора да четат на своя предпочитан език, вместо винаги да се нуждаят от междинен, който често грешно предава чувството и съдържанието", посочват от Meta в блог публикация.

С използването на сайта вие приемате, че използваме „бисквитки" за подобряване на преживяването, персонализиране на съдържанието и рекламите, и анализиране на трафика. Вижте нашата политика за бисквитките и декларацията за поверителност. ОК