Възможно ли е изкуственият интелект да прави проверка на фактите. За сега учените правят само проучвания по въпроса. Добромир Видев разговаря по темата с проф. Ирина Гуревич - един от водещите учени в сферата на обработката на естествен език. Тя е директор на Лабораторията за обработка на знания (UKP) в Техническия университет (TU) в Дармщат, Германия и президент на Асоциацията за компютърна лингвистика, както и съдиректор на програма в рамките на ELLIS - европейската лаборатория за обучение и интелигентни системи. Проф. Ирина Гуревич беше лектор на програмата ИНСАЙТ в София.
Наистина ли е възможно да се автоматизира процесът на проверка на фактите?
Мисля, че пълна автоматизацията в момента е невъзможна. Въпреки това можем да автоматизираме отделни стъпки, като например извличането на подходящи документи и търсенето на подходящ пасаж в документите. Дори и процеса на класифициране като подкрепящи или опровергаващи твърдението или може би неутрални. Постижимо е да са автоматизират подобни стъпки.
Тези задачи са сравнително лесни за машината. А и имаме търсачки с висока точност например за извличане на информация. Въпреки това, разсъжденията върху извлечените доказателства са много трудна задача дори за хората. А също така е много трудна за машините.
Това е доста трудно и за самите журналисти.
Вие всъщност извършвате много проверки на фактите в работата си. И това е подобно на работата, която извършват и алгоритмите при проверката на фактите.
Може ли да ми дадете примери как развивате тази автоматизация на процесите?
Разбира се, че използваме изкуствен интелект. Моята област е естествената обработка на машинен език. Така както за търсачките, има известно сходството между измерванията на твърдението, което е „на входа“ и документите, или изречението е в рамките на документите. Така че, ако изреченията са подобни, те се считат за подходящи. И тогава има втора стъпка на класификация. И тук обикновено използваме контролирано машинно обучение. Ние създаваме данни за обучение, където имаме случаи, които са обозначени от хората като подкрепящи или опровергаващи твърдението. И след това използваме тези данни за обучение, за да извлечем статистически характеристики, които ни позволяват класифицира нови данни, които пристигат. И така работи…..
А до каква степен може да бъде развита тази технология за автоматична проверка на фактите?
В днешно време всички говорят за големите езикови модели. Така че технологията напредва много, много бързо. Мисля, че тази технология може да улесни проверката на фактите по много начини. Технологията обаче има и огромен недостатък, тъй като знаем, че големите езикови модели са перфектни за генериране на фалшиви новини. И ние ги наричаме халюцинации. Освен това е голямо изследователско предизвикателство как да не позволяват на езиковите модели да халюцинират факти. Например по време на пандемията от КОВИД имахме твърдения, че хидрокси-хлоро-хин-а може да лекува. Това беше разпространено в социални мрежи. И някои хора възприемат тези твърдения за верни. Имаше случаи, в които това вещество е боло приемано. А хората са починали от него. Другият тип фалшиви новини всички знаем, че е например пропаганда относно войната, която се случва в Близкия изток. Така че в такива много емоционални настройки, тази дезинформация може да доведе до ескалация на конфликта и може да доведе до огромен брой убити. Или както беше със съобщенията за ударите по болницата в Газа.
Ние не знаем кое е истина или не. Обикновено в такива случаи моделът прави извод в рамките на най-простия случай - вярно невярно, или не знам. В по-напредналите модели те биха извели и вероятността това да е правилно или грешно, плюс обяснение защо. И това обяснение ще включва доказателствата. Така че потребителят може разбере как машината прави своя извод.
Така че крайната преценка зависи от потребителя. Без значение кой прави проверката на фактите – машина или човек, или група хора, или журналист.
Смятам, че технологията не е в степен на такава зрялост, която да вземе решението сама. Мисля, че крайното решение трябва да бъде на човека. И човекът, който дълго време би използва тази технология, може и да я персонализира, така че машината да може да учи от обратната връзка на потребителя. Например ако потребителят се доверява на определени източници, моделът може да го възприеме като доверен.
Проф. Гуревич, а как стои въпросът със изображенията?
Да. Изображенията в днешно време може да са силно подвеждащи, защото могат да бъдат заснети в един контекст и представени за достоверни в друг. И това ги прави много трудни за разпознаване от потребителя. След това има всички тези фалшиви изображения, които могат много лесно да бъдат генерирани в наши дни от технологията. Или изображения, които не са напълно ефектни, но които са модифицирани, за да представят неверни факти. За тяхното разпознаване има технологии, които се разработват. Но не мога сега да ви споделя. Но най- просото, което всеки потребител може да направи, е да постави изображението в търсачката на Google за изображения и по този начин можете да донякъде реконструира историята зад изображението. Можете да видите подобни изображения. И по този начин става по-лесно за да направите заключение дали изображението може да е истинско или не.
По какви проекти работите сега?
Първият проект е за твърдения в социалните медии. Твърдения, които са придружени от научна статия, която подкрепя твърдението. Обикновено, ако видим „научна статия“, смятаме, че щом науката е достоверна, няма да се наложи да отваряме статията. Ние смятаме, че твърдението е вярно, но всъщност твърдението е невярно. Има логическа заблуда, неправилно аргументиране, което свързва твърдението със съдържането на статията. Тези неправилни аргументи са описани в статии, посветени на проверка на фактите. И ние ги анализираме, за да разкрием тези заблуди. Това е нашето тренировъчно поле, за да изградим автоматичен инструмент, който може да намери тези заблуди в нови с известни такива случаи. Така че това е първият проект. Такива случаи има много в социалните медии. Аз не съм голям потребител на социални медии, просто ги ползвам от време на време. Но именно тези логически заблуди се използван доста често, за да се разпространява дезинформация.
Като учен това не ви ли плаши?
Да. Плаши ме до някаква степен. Особено сега, когато знам, че това се случва в света. Това е много, много смущаващо и пропагандата е изключително силна. Така че дори високо професионални потребители на информация не могат да оценят точно информацията. Така че това е много трудна задача.
Вторият проект е в мултимодална проверка на факти. Това е всъщност проучването ни за проверка на изображения. Макар че моята основната област на работа е обработката на естествен език и много често изображенията биха имали придружаващ текст, който може да използваме, за да разсъждаваме за изображението; но изображенията стават изключително широко разпространени. Много е лесно да направите снимка, за да генерирате снимка. А изображения може да предизвикат много емоции у хората, нали? Много бързо, защото не е необходимо прочетете дълга статия. Можете просто да погледнете изображението и ако видите ранени деца. Това веднага вашите емоциите експлодират. И резултатът от този продукт би трябвало да бъде инструмент, който помага за проверката на фактите, за да отговори на пет въпроса: за произхода, датата, съдържанието на изображението, за да се оцени достоверността и истинността зад изображението.
Проф. Гуревич, като учен можете ли да ми кажете вие лично, какво бихте посъветвали хората, които са доста по-чести потребители на социалните медии от вас?
Бих ги посъветвала да бъдат изключително внимателни с информацията, която те четат в социалните медии. Бих ги посъветвал да се постараят да получат известна цифрова грамотност. Как да оценяват съдържание, за да не бъдат подведени от някои кампании. За тази дигиталната грамотност мисля, че образователните институции носят отговорност. В германските училища децата получават обучение как да използват Уикипедия, как да ползват интернет. Това е добра практика.39-то издание на "Киномания" ще се състои от 13 ноември до 30 ноември в София, Варна, Пловдив и Стара Загора . Мотото е "Нежността е новият пънк". То е цитат от режисьора Йоаким Триер, който го споменава по време на пресконференцията в Кан на най-новия му филм “Сантиментална стойност”, а това според критиците е и най-зрелият му филм...
Жителите на горнооряховското село Поликраище излизат на протест срещу проблемите с водоподаването в населеното място. След 11 ч. се очаква недоволните да блокират при автогарата в селото главния път Русе-Велико Търново. Причината за проблемите с безводието в Поликраище е остарялата водопроводна мрежа. Заради непрекъснати и тежки аварии, местните..
С празнични богослужения Българската православната църква чества светите ангели и техния предводител Архангел Михаил. Денят е познат като Архангеловден. Отбелязва се и като професионален празник на полицаите. Имен ден имат близо 240 хил. българи. Според свещеното писание ангелите са духове, служители на бога и пазители на човеците. Ангелите..
В Националния археологически резерват "Деултум-Дебелт" ще бъдат чествани 1160 години от покръстването на българския народ. Годишнината ще бъде отбелязана с благодарствен молебен и програма, включваща старинна музика. На събитието ще присъстват вицепрезидентът Илияна Йотова и представители на държавната и местната власт.
Националното сдружение на Общопрактикуващите лекари в България провежда в Пловдив отчетно-изборното си събрание, на което ще избере ново ръководство на съсловната организация. Ще бъде представен отчет за дейността на Управителния съвет за периода юли 2021-септември 2025 г. Участниците във форума ще изберат и членове на Контролната комисия и Комисията по..
Временна автобусна линия М3 ще замества Линия 3 на метрото на 8 и 9 ноември. Причината е пускането в експлоатация на трите нови станции от разширението на Линия 3 по бул. "Владимир Вазов“ и необходимостта от актуализация на софтуера на системите за контрол и управление на влаковото движение. Линия 3 на метрото ще бъде затворена за периода от..
В Ловеч се проведе общо събрание на сдружението на Регионалното депо за неопасни битови отпадъци на общините Ловеч, Летница и Угърчин по повод писмо от РИОСВ-Плевен за установени нарушения при управление на депото и запълнения му капацитет. По време на общото събрание с участието на 3 общини и областния управител Дора Стоянова са приети мерки..
Всеки трети българин изразява готовност да изложи на риск личния си живот, за да защити демокрацията, а всеки пети е готов да се запише като доброволец..
Нас, българите, ни чакат много, много тежки моменти, купуване на коли на лизинг и апартаменти на кредит - ще вием, предупреди в интервю пред..
"Става дума за това да не може да се мине годишен технически преглед (ГТП), ако има влезли в сила глоби, тоест такива, които са връчени, а и за които..