Стиль электронных сообщений может многое рассказать о человеке. Например, о его поле, эмоциях или даже о каких-то личностных качествах. В эпоху тотальной обеспокоенности Интернет-слежкой это исследование учёных наверняка не останется незамеченным.
Саиф Мохаммед (Saif Mohammad) и его коллеги из Национального исследовательского совета Канады (National Research Council Canada) проанализировали настроения, чтобы понять чувства, "спрятанные" в электронной переписке людей.
"Это весьма эффективный способ получения данных об эмоциональном содержании текста, – комментирует Мохаммед. – Существует множество исследований положительных и отрицательных эмоций, и с помощью всех этих данных мы смогли понять, как изучить все эмоции".
Команда создала глобальную "базу настроения". Для этого учёные использовали данные, полученные от работников краудсорсинговой платформы Amazon Mechanical Turk. Она позволяет людям координировать использование человеческого ресурса для выполнения задач, на которые не способен компьютер.
Испытуемые должны были связать 24200 слов с определёнными эмоциями (например, "мороженое" – это "радость", "садоводство" – "умиротворение" и так далее). Затем они давали определения словам, использованным в 32 тысячах сообщений электронной почты, обнародованных после "Дела Enron": оценивали их эмоциональный тон и гендерную принадлежность.
Результаты показали заметную разницу между сообщениями разных полов. Женщины старались употреблять лексику, относящуюся к радости или печали, в то время как мужчины чаще употребляли те слова, что связаны со страхом или доверием. Оба пола использовали более радостные и весёлые слова, ведя переписку с женщинами.
Мужчины, переписываясь с женщинами, использовали более предупреждающие выражения, такие как "подготовить" или "надежда".
Учёные также попытались разглядеть черты личности через эмоциональное содержание. "Если ты злишься время от времени, это нормально, – объясняет Мохаммед. – Но если ты всё время зол, то это уже неотъемлемая часть личности". С помощью другой базы данных из 585 эмоций и связанных с ними слов, полученных в ходе изучения твитов и хэштегов, команда получила алгоритм, с помощью которого попыталась определить типы личности, исходя из короткого текстового сообщения.
Тысячи постов – короткий поток осознанных очерков, каждый из которых дал психологом возможность судить об одной из Большой пятёрки личностных черт, а именно – экстраверсии, невротизме, доброжелательности, добросовестности и открытости опыту. Все образцы были использованы для получения алгоритма, способного комбинировать эмоциональные черты. Результат, показанный алгоритмом, в 99% случаях совпадал с мнением психологов относительно качеств авторов сообщений.
По мнению исследователей, определение черт личности и пола анонимного собеседника могли бы помочь выявлению тревожных признаков депрессии или даже предоставить информацию для судебно-медицинской экспертизы онлайн-преступлений. Также подобный анализ может предоставить подробное описание реакции общественности на какое-либо важное событие.
Тем не менее, прежде чем широко применять данные исследования, необходимо провести и другие тесты. Так как общение по электронной почте — "привилегия" ограниченной группы людей, нынешние результаты нельзя назвать общеприменимыми.