Ученые разработали детектор школьников в соцсетях

Англии изучали

На протяжении собственной работы сотрудники Кембриджского университета и университета Пенсильвании в Англии изучали лексику, применяемую в статусах Facebook.Несколько социологов показала возможность машинально распознавать пол, ряд и возраст психотерапевтических черт пользователей социальной сети Facebook на базе их статусов. По словам ученых, это разрешает формализовать последовательность наблюдений и дает новый инструмент с целью проведения изучений. Подробности ссылаясь на публикацию исследователей в издании PLoS One приводит сайт Университета Пенсильвании.

На протяжении собственной работы сотрудники Кембриджского университета и университета Пенсильвании в Англии изучали лексику, применяемую в статусах Facebook. Под статусом понимается маленький текст, размещаемый от собственного имени в соцсетях.

В тексте в большинстве случаев показывают текущее занятие, настроение либо другую данные.Социологи собрали информацию о 136 тысячах пользователей (все они подписались на участие в научном изучении), каковые в общем итоге обновили собственную строчок статуса более 13 миллионов раз. Чтобы получить корректную данные, ученые брали лишь тех, кто за время опыта написал более 1000 слов в строчок статуса.

В итоге выборка авторов изучения включала 15,4 миллиона статусов с 309 миллионами слов от 74941 человека.Потом социологи забрали заполненные теми же людьми онлайн-опросники и постарались отыскать корреляции встречаемости тех либо иных слов в статусе с теми либо иными чертями человека.

Матанализ материала показал, что кроме того сочетания знаков, каковые были выделены в слова сугубо формально (как произвольная комбинация между двумя пробелами), разрешают определить, например, пол пользователя. Сочетание символа больше и цифры 3 разрешает с уверенностью сказать о том, что строка статуса обновлена дамой, а не мужчиной. Одновременно с этим ругательство "fuck" показывает на мужской пол обладателя аккаунта.Исследователи кроме этого внесли предложение добровольцам установить онлайн-приложение My Personality с психотерапевтическими опросниками, основанными на тесте NEO Personality Inventory Revised (NEO-PI-R).

Данный тест выдавал результаты по пяти различным шкалам: экстраверсия, сговорчивость, сознательность, невротизм и открытость; сокращенная версия для того чтобы теста уже употреблялась в второй посвященной Facebook работе.Анализ материала тестов продемонстрировал, что экстраверты чаще применяют слова "вечеринка" и "девушки", тогда как интроверты предпочитают интернет и компьютеры, и аниме — не смотря на то, что коэффициент корреляции для аниме и интроверсии был ниже, чем для интроверсии и смайла "^_^". Помимо этого, ученые заметили и характерные для определенного возраста выражения: к примеру, "домашнее задание" и заглавия предметов выдают школьников, а "дочь" либо "супруг" свойственны для тех, кому больше тридцати лет.Исследователи считают, что их работа разрешает отделить стереотипы о той либо другой категории пользователей от ее настоящих черт.

Они вычисляют успешным ответ не подсчитывать частотность того либо иного слова из закрытого перечня (скажем, из "хороших чувств" либо из множества "ругательства"), а забрать сочетания и слова знаков, изначально присутствующие в выборке. Еще одно преимущество подхода — сравнительная быстрота обновления данных.

Появление социальных сетей с миллионами активных пользователей вывело (как утверждается во введении к статье американо-британской группы) социологию на новый уровень. В случае если ранее опрос хотя бы тысячи человек потребовал непростой полевой работы, то онлайн-изучения разрешают оперативно собирать на порядки громадные выборки и разбирать их с применением автоматических способов.

Так уже удалось отследить реакцию общества на разные события, проследить за эпидемиями гриппа и отыскать метод выяснить характеристики пользователя по "лайкам" (не смотря на то, что и с громадной погрешностью).

Зов тайги