Нейтральная точка зрения (англ. Neutral point of view, NPOV) является одним из основных принципов, действующих в Википедии. Согласно этому правилу, материалы должны представляться объективно, с учётом всех значимых точек зрения, без выделения какой-либо одной позиции.
Из-за открытого характера редактирования Википедии соблюдение этого принципа представляет серьёзную задачу: редакторы могут непреднамеренно переносить в статьи собственные предубеждения и эмоции. В связи с этим возрастает значение методов, позволяющих автоматически отслеживать степень нейтральности содержания.
Анализ тональности
Анализ тональности (англ. sentiment analysis) — это метод машинного обучения, широко применяемый для изучения мнений в социальных сетях, отзывах или комментариях. Он позволяет классифицировать тексты как положительные, нейтральные или отрицательные. Однако чаще всего используется для коротких и неформальных текстов, что затрудняет его прямое применение к энциклопедическим статьям. Статьи Википедии отличаются большей длиной и более формальной структурой.
Презентация исследования на IJCAI 2025
На международной научной конференции IJCAI 2025 (34th International Joint Conference on Artificial Intelligence), которая прошла в августе 2025 года в Монреале (Канада), была представлена работа под названием «Cross-Topic Sentiment Analysis of Wikipedia Articles: A Comparative Study of AI Models».
В рамках выступления были представлены результаты анализа почти 7 миллионов статей англоязычной Википедии с использованием четырёх моделей анализа тональности: словарных (TextBlob, VADER) и трансформерных (RoBERTa, DistilBERT).
Исследование показало, что:
- тональность статей Википедии существенно различается в зависимости от тематики,
- разные модели дают разные оценки тональности, что подчёркивает важность выбора инструмента для подобных анализов,
- возможно создание практических инструментов для мониторинга нейтральности содержания Википедии в масштабах всей энциклопедии.
Кроме того, исследователи опубликовали на платформе Hugging Face набор данных, содержащий результаты классификации тональности статей Википедии, полученные с помощью используемых моделей.
Значение исследования
Работа вносит вклад в развитие методов автоматической оценки качества содержания Википедии. В отличие от предыдущих исследований, сосредоточенных на коротких текстах или отдельных выборках, представленное решение охватывает всю англоязычную Википедию. Это позволяет систематически контролировать соблюдение принципа нейтральной точки зрения на одной из важнейших платформ знаний в интернете.
Предложенная методология может также применяться для оценки качества и надёжности других онлайн-ресурсов, что имеет особое значение в условиях борьбы с дезинформацией и необходимости обеспечения доступа к достоверным источникам знаний в сети.