Слов’янські вікіпедії – більш концептуальні

Такий висновок міститься у доповіді “Зміст Вікіпедій – тематична статистика”, яку підготували українські вікіпедисти Андрій Бондаренко і Юрій Пероганич для міжнародної конференції “Вікіманія 2011“, що проходить у ці дні в Хайфі, Ізраїль.

Українська вікіпедія нині нараховує більше 300 тисяч статей, а найбільші Вікіпедії – від 1 до 3,5 мільйонів статей, однак питання про те, по скільки статей припадає на ту чи іншу галузь знань довгий час лишалося відкритим. На українській Вікіпедії такі дослідження були розпочаті у березні 2009 року методом статистичної вибірки. В січні 2011 року ми публікували дані обробки вибірки з 1000 статей української Вікіпедії, а в березні 2011 року ми вперше представили порівняльний аналіз, в якому було досліджено п’ять вікіпедій – англійську, польську, російську, українську та чеську. Цього разу для доповіді на Вікіманії були включені ще три вікіпедії – німецькою, французькою та італійською мовами, які за кількістю статей наразі посідають 2-4 місця.

З’ясувалося, що кожна Вікіпедія має не тільки певні індивідуальні відмінності, але намічаються і загальні тенденції для “західних” і “східних” європейських мовних розділів (географічний поділ мов, звісно, умовний). Діаграми нижче представляють розподіл кількості статей за їх типом (статистична похибка до 1%):

Приблизно 34% статей західних Вікіпедій стосуються окремих осіб або організацій, тоді як у найбільших слов’янських – тільки 22%. Зате наукові поняття, а також об’єкти природи й цивілізації ширше представлені в слов’янських вікіпедіях (в загальному підрахунку – 54%, тоді як в західних – 37 %).

Аналіз статей за тематикою показує більшу увагу до спорту наших західних колег і більшу увагу до географії – у слов’ян:

Втім, усі вікіпедії мають і певні індивідуальні відмінності. Так, німецька має ширший сектор політиків та філософів, французька різноманітніша в культурі, італійська виборює першість у футбольній тематиці, а ось англійська – єдина, де нам в окремий сектор довелося виділити сексуальну тематику. Що ж, кожному своє, як то кажуть.

В українській Вікіпедії найбільшим у порівнянні з іншими лишається сектор населених пунктів і територіально-адміністративних одиниць, а ось спортом і поп-культурою вітчизняні вікіпедисти, схоже, опікуються менше ніж наші іноземні колеги. Чи можна вважати, що тематичний розподіл статей певним чином відображає структуру суспільного потенціалу націй для творення культурного продукту, про який говорить професор Білецький? Це питання лишатиметься лейтмотивом наших подальших статистичних досліджень.

Advertisements
Опубліковано у Статистика. Додати до закладок постійне посилання.

Залишити відповідь

Заповніть поля нижче або авторизуйтесь клікнувши по іконці

Лого WordPress.com

Ви коментуєте, використовуючи свій обліковий запис WordPress.com. Log Out / Змінити )

Twitter picture

Ви коментуєте, використовуючи свій обліковий запис Twitter. Log Out / Змінити )

Facebook photo

Ви коментуєте, використовуючи свій обліковий запис Facebook. Log Out / Змінити )

Google+ photo

Ви коментуєте, використовуючи свій обліковий запис Google+. Log Out / Змінити )

З’єднання з %s