Группа социологов (университеты Пенсильвании, Кембриджа) продемонстрировала способ автоматического распознавания пола, возраста, некоторых психологических параметров пользователей Facebook, основываясь на их статусах (краткого, в предложение-два, текста отражающего мышление и настроение, состояние пользователя соцсети), изучении лексики этих статусов. Ученые хотят формализовать способ (превратить его «в алгоритм») и получить инструментарий для своих исследований.
Социологи обработали данные о 136000 пользователях, обновивших свой статус более 13 млн. раз. Брались только те, которые написали тысячу и более слов в статус. В целом выборка включила 15.4 млн. статусов (309 млн. слов, 74941 чел.). Такие выборки в обычной (не онлайновой) практике – редки.
Затем социологи проанализировали на корреляционные связи слов статуса с чертами характеристик участников заполненные онлайн-опросники. Статистико-математический анализ продемонстрировал: даже произвольная комбинация слов в статусе позволяет узнать, например, пол пользователя. В частности, сочетание знаков «<» и «3» говорит достоверно о принадлежности строки статуса женщине, а ругательство - мужчине.
Некоторым участникам установили приложение My Personality с опросниками, основанными на психологических тестах по разным шкалам: сговорчивость, экстравертность-интравертность, сознательность, открытость, невротизм.
Анализ результатов тестирования показал: экстраверты используют «вечеринка», «девушки» чаще, интровертам – по душе компьютеры (интернет). Ученые выявили характерные выражения для определенных возрастов, например, школьников выдают «домашнее задание», название предметов, старше 30 лет – «дочь», «муж».
Работа позволит отделить стереотипы по категориям пользователей от реальных их характеристик. Важен не анализ частотности слова, а сочетаний символов, слов присутствующих изначально в выборке.
Появление соцсетей продвинуло социологию на совершенно новый уровень: онлайн-опросы и исследования позволяют быстро и надежно собирать выборки порядковых объемов, анализировать их автоматически, алгоритмически. Это позволит отслеживать реакцию сообществ, групп на события, например, при подготовке к ЕГЭ и определять характер пользователя по его «лайкам», узнавать о намерениях сетевых сообществ.
|