Геолокационные твитты знают, где мы находимся

Twitter – это лупа для изучения человечества. Так, твитты стали содержать информацию о местоположении пользователя. А значит, можно с легкостью сказать, где он находится, откуда приехал и куда отправится дальше.

Постоянно растущее количество геолокационных твиттов может рассказать о перемещении людей в различных странах.

База данных «жителей» Twitter

Bartosz Hawelka (Бартош Хавелка) из университета Зальцбурга в Австрии и ещё несколько исследователей ухватились за эту идею. Они проанализировали геолокационные данные, связанные с сообщениями в соцсети со всех континентов, и выявили определенную закономерность международных путешествий. Их подход относительно несложный. Они начали со сбора данных почти миллиарда геолокационных твиттов за период с 1 января по 31 декабря 2012 года. Потом Хавелка и его команда исключили всю нечеловеческую деятельность, а именно рекламу и определённые типы игр, а также все аккаунты, где пользователь перемещался быстрее пассажирского самолета. Затем они определили домашнее местоположение каждого пользователя, проанализировав места, откуда приходит наибольшее количество сообщений. В итоге у них получилась база данных «жителей» Twitter.

Самая густонаселенная страна Twitter – США, в ней более 3,8 миллионов пользователей, затем идут Великобритания, Индонезия, Бразилия, Япония и Испания, где в общей сложности более 500 000 пользователей. Далее исследователи вычислили отношение между количеством пользователей Twitter и общей численностью населения. Интересно, что чем выше ВВП у страны, тем больше там поклонников соцсети.

Топ стран с самым высоким показателем туристических перемещений

 

Тенденции путешествий

После команда узнала процент пользователей, посетивших хотя бы одну другую страну в течение всего 2012 года. Оказывается, самыми мобильными являются жители Гонконга, Бельгии и Австрии. Домоседами являются США, Индонезия, Венесуэла и Саудовская Аравия.

Команда Хавелки также определила среднее расстояние между пользователями соцсети, назвав это радиусом циркуляции. Страны с самым высоким показателем являются самыми изолированными. Так, в Австралии и Новой Зеландии, например, средний радиус циркуляции составляет около 700 километров.

Удивительно, но подобный показатель не связан с расстоянием от остальной части света

 

Это говорит о том, что даже в эру глобализации и кажущегося уменьшения значения расстояния, люди все ещё склонны путешествовать в местном масштабе, посещая соседние страны чаще, чем более дальние.

 

Глобальный паттерн перемещения пользователей в течение 2012 года

 

Наконец, Хавелка изучил тенденцию перемещения пользователей в течение долгого периода времени. Оказалось, что люди более мобильны в выходные, а за границу предпочитают выезжать в июле и августе, а также в конце года.

Но это общая закономерность. Интереснее изучить каждую страну в отдельности. Так, в арабских странах, например, путешествия имеют культурную ценность.

Нормализованные значения сезонной мобильности для каждой страны отдельно

 

Значения для каждой страны масштабируются от 0 до 100% от максимального суточного количества путешественников, находившихся за границей в 2012 году.

«В период Рамадана за рубеж практически не ездят, а в конце сентября происходит массовое паломничество в Мекку», — говорит Бартош.

Вопрос заключается в том, насколько достоверны эти данные. Ведь в ходе исследования были изучены лишь пользователи Twitter, которые являются социальной группой общества. Применима ли эта тенденция ко всему населению в целом или только к его маленькой части? Единственным способом это проверить было сравнить данные Twitter с общими тенденциями путешествий. Однако собрать эти данные в глобальном масштабе не так-то просто. В итоге они сравнили свои результаты с глобальной статистикой туризма и обнаружили достаточно хорошую корреляцию (см. графики ниже).

Конечно, мобильные данные не дают подробной информации, лишь общие оценки. Но их легко получить, и они относительно точные.
Хавелка и его команда планируют продолжить работу с данными Twitter и изучить тенденцию путешествий более подробно. Сейчас всё большее количество твиттов привязано к координатам GPS, которые показывают местоположение пользователя в пределах нескольких метров.
«Эта информация имеет большой потенциал, который мы должны использовать»,— подытожил исследователь.

Интересно, что еще может рассказать о нас наша же информация из социальных сетей?

Источник: http://research.ria.ru/audience/20131121/918666786.html