7-9 сентября состоялась международная конференция KES 2022 (26th International Conference on Knowledge-Based and Intelligent Information & Engineering Systems). В ходе этого мероприятия были представлены научные исследования по выявлению важных источников информации в различных темах и языковых версиях Википедии. В этом году конференция KES была организована в Вероне (Италия) в гибридном режиме.
Информация в Википедии должна основываться на проверенных источниках. Однако не каждый сайт может выступать источником информации в этой энциклопедии. В правилах Википедии сказано, что информация в ее статьях должна создаваться на на основе заслуживающего доверия, независимого, опубликованного контента с хорошей репутацией в отношении достоверности и точности. Однако достоверность — понятие субъективное, и репутация одного и того же источника может оцениваться по разным критериям в зависимости от человека (или группы людей). Таким образом, каждая языковая версия Википедии может иметь свои собственные правила или критерии оценки веб-сайта, прежде чем его можно будет использовать в качестве источника информации. Поэтому авторитетность одного и того же источника в Википедии зависит от темы и языковой версии. Кроме того, рейтинг доверия (репутации) одного и того же веб-сайта может меняться со временем.
В рамках представленного исследования было проанализировано более 230 миллионов ссылок в статьях различных языковых версий Википедии. Например, самая развитая английская Википедия содержит более 70 миллионов ссылок, тогда как польская версия Википедии — более 7,5 миллионов ссылок на различные источники информации. Уникальные веб-сайты были определены на основе метаданных ссылок. В случае с английской версией количество таких сайтов превысило 1,7 миллиона, тогда как для польской версии Википедии можно найти более 200 000 уникальных сайтов.
Кроме того, были выявлены ссылки на научные публикации. Это позволило получить индекс «Sci», показывающий частоту встречаемости научных источников информации в пределах анализируемой языковой версии Википедии. Затем статьи в Википедии были разделены на темы и с использованием разных моделей оценки достоверности источников был проведен сравнительный анализ сайтов в разных тематиках и языковых версиях.
Источник: kie.ue.poznan.pl