Моделирование популярности и достоверности источников в многоязычной Википедии

Одним из важнейших факторов, влияющих на качество информации в Википедии, является наличие достоверных и надежных источников. Посредством следующих ссылок читатели могут проверить факты или найти более подробную информацию по описанной теме. Статья в Википедии может быть независимо отредактирована на любом из более чем 300 языков, даже анонимными пользователями, поэтому информация по одной и той же теме может быть непоследовательной. Это также относится к использованию ссылок в разных языковых версиях конкретной статьи, поэтому одно и то же утверждение может иметь разные источники. В этой статье авторы проанализировали более 40 миллионов статей из 55 наиболее развитых языковых версий Википедии, чтобы извлечь информацию о более чем 200 миллионах ссылок и найти наиболее популярные и надёжные источники.

В исследовании авторы представили 10 моделей оценки популярности и надежности источников, основанных на анализе мета-информации о ссылках в статьях Википедии, просмотрах страниц и авторах статей. Используя DBpedia и Викиданные, авторы автоматически определяли соответствие источников конкретному домену. Кроме того, авторы анализировали изменения популярности и надёжности во времени и определяли лидеров роста в каждом из рассматриваемых месяцев. Результаты могут быть использованы для улучшения качества контента в различных языковых версиях Википедии. Например, среди наиболее популярных научных журналов в ссылках английской Википедии есть: Nature, Astronomy and Astrophysics, Science, The Astrophysical Journal, Lloyd’s List, Monthly Notices of the Royal Astronomical Society, The Astronomical Journal и другие.

Научная статья опубликована в журнале Information 2020, 11(5), 263. Некоторые результаты доступны в проекте BestRef.

Polski
English
Русский