Meta разработва AI за проверка на цитати в Wikipedia

Pixabay.com
geralt

Meta разработва AI за проверка на цитати в Wikipedia

Инструментът ще улесни редакторите при удостоверяването на цитатите в платформата

Мария Динкова
913 прочитания

Pixabay.com

© geralt


През 2020 г. стана ясно, че американски тийнейджър е написал 27 хил. статии на език, който не се говори в общността на Wikipedia. Този случай беше напомняне, че онлайн енциклопедията не е перфектният източник на информация. Дали става дума за злонамерени опити за промяна да текстовете или за неволна човешка грешка, едно е ясно - необходим е надежден инструмент, който да проверява достоверността на данните в платформата.

В тази връзка Wikimedia Foundation започва да работи с Metа, за да намери решение на този проблем. Идеята е компанията майка на Facebook да предложи базирано на изкуствен интелект решение, което да улесни проверката на цитираните текстове в статиите на онлайн енциклопедията. В повечето случаи бележките под линия са толкова много, че доброволците редактори трудно могат да потвърдят автентичността на всички. След като сайтът се разраства с над 17 хил. статии всеки месец, хиляди цитати са незавършени, липсващи или изцяло неточни.

За целта Meta разработва изкуствен интелект, който може автоматично да сканира цитатите в мащаб и да потвърждава тяхната точност. Също така технологията може да предлага алтернативни цитати, когато намери пасажи от недостоверен източник. Когато хората редактори на Wikipedia оценяват цитатите, те разчитат предимно на своя опит. Когато ИИ прави същото, той разчита на разбирането на естествен език (NLU) чрез модел, който се опитва да разбере различните отношения между думите и фразите в едно изречение.

Базата данни на Meta - Sphere, съдържаща над 134 млн. уеб страници, действа като индекс за знание на системата. Всъщност моделът е създаден да намира един-единствен източник, за да верифицира всяко твърдение. По този начин, обучавайки машините да разбират връзката между сложни текстови пасажи, ще помогне също така да се развият възможностите на ИИ към по-умни системи, които могат да улавят повече сложност и нюанси.

"Това е силен пример на инструментите с машинно обучение, които могат да помогнат да се мащабира работата на доброволците, като ефективно се препоръчват цитати и точни източници. Подобряването на тези процеси ще ни позволи да привличаме нови редактори в Wikipedia и да осигуряваме по-добра и надеждна информация на милиарди хора по света", коментира Шани Евенщайн-Сигалов, председател на настоятелството на Wikimedia Foundation.

Към момента двете организации не си партнират официално по проекта, тъй като той е в проучвателна фаза и решението все още не се използва за автоматично ъпдейтване на съдържанието в Wikipedia. Когато обаче моделите бъдат приложени, те се очаква да подобрят значително точността на източниците в онлайн енциклопедията. Освен това реализирането на проекта има потенциала да подпомогне разрешаването на трудни проблеми, свързани с работата със самия изкуствен интелект.

От Meta уточняват, че моделите за проверка и извличане на информация могат в бъдеще да се използват за верифицирането на документи в реално време. Освен предлагането на цитати системата ще може да дава възможност за автоматично допълване и корекции на текста. "В идеалния случай моделите ще разбират множество езици и ще могат да обработват няколко типа медийно съдържание, включително видео, изображения и таблици с данни. Тези способности за сред новите цели на Meta AI, тъй като помагаме да обучим технологията да разбира нашия свят", отбелязват от компанията.

През 2020 г. стана ясно, че американски тийнейджър е написал 27 хил. статии на език, който не се говори в общността на Wikipedia. Този случай беше напомняне, че онлайн енциклопедията не е перфектният източник на информация. Дали става дума за злонамерени опити за промяна да текстовете или за неволна човешка грешка, едно е ясно - необходим е надежден инструмент, който да проверява достоверността на данните в платформата.

В тази връзка Wikimedia Foundation започва да работи с Metа, за да намери решение на този проблем. Идеята е компанията майка на Facebook да предложи базирано на изкуствен интелект решение, което да улесни проверката на цитираните текстове в статиите на онлайн енциклопедията. В повечето случаи бележките под линия са толкова много, че доброволците редактори трудно могат да потвърдят автентичността на всички. След като сайтът се разраства с над 17 хил. статии всеки месец, хиляди цитати са незавършени, липсващи или изцяло неточни.

Най-новото









Руски чиновници със забрана да използват iPhone

Руски чиновници със забрана да използват iPhone

  • 0
  • 165

Още от Digitalk ›
С използването на сайта вие приемате, че използваме „бисквитки" за подобряване на преживяването, персонализиране на съдържанието и рекламите, и анализиране на трафика. Вижте нашата политика за бисквитките и декларацията за поверителност. ОК