К основному контенту

Методы исследования социальных сетей


В исследованиях социальных сетей находит применение ряд методов прикладной математики, прежде всего из области теории информации.

Теория графов
Социальный граф — граф, узлы которого представлены социальными объектами, такими как пользовательские профили с различными атрибутами (например: имя, день рождения, родной город), сообщества, медиаконтента и так далее, а рёбра — социальными связями между ними.

С помощью социальных графов решают такие задачи, как: 
  • идентификация пользователей; 
  • социальный поиск; 
  • генерация рекомендаций по выбору «друзей», медиаконтента, новостей; 
  • выявление реальных связей или сбор открытой информации

Особенности социального графа характеризуются такими метриками, как: взаимоотношения, связи и сегментация. Для решения задач на социальном графе используются специальные модели, с помощью которых можно заменить «реальные» графы.

Обработка данных социальных графов связана с рядом проблем, как например различия социальных сетей, закрытость социальных данных


Граф иллюстрирует отношения, в которых состоят разные социальные объекты.

Пользователь Ева находится в дружеских отношениях с пользователями Адам и Катя, при этом Адам и Катя не являются друзьями друг другу, но у них есть общий друг Ева. Фотография Петра была оценена многими пользователями, в том числе она понравилась и Еве. Также Ева слушает радио CoffeeFM и смотрит видео с Youtube.

В задачах на социальном графе используют понятие метрик — показателей, которые в числовой форме отображают характеристики социальных объектов, сегментов, групп объектов и их связей.


Функционально-управляемые модели нацелены на воспроизведение статистических характеристик графа, таких как степенное распределение и динамические изменения плотности графа.

Целенаправленно-управляемые модели сфокусированы на эмуляцию процесса создания оригинального графа.

Структурно-управляемые модели охватывают статистические данные из структуры графа, позволяя соответствующему генератору воспроизводить случайные графы с теми же структурными ограничениями

Литература
С. Бартунов, А. Коршунов Идентификация пользователей социальных сетей в Интернет на основе социальных связей (рус.). — Институт системного программирования Российской академии наук, 2012.
A.Sala, L. Cao, C. Wilson, R. Zablit, H. Zheng, B. Y. Zhao Measurement-calibrated Graph Models for Social Network Experiments (англ.). — WWW 2010, April 26–30, 2010, Raleigh, North Carolina, USA, 2010.
C. Kadushin. Understanding social networks: Theories, concepts, and findings. — Oxford: Oxford University Press, 2012. — С. 288

Теория случайных сигналов и шумов
«Нет ничего более противного разуму и постоянству природы, чем случайность.
Сам бог не может знать того, что произойдет случайно. Ибо если знает, то это определенно произойдет, а если определенно произойдет, то не случайно».
Марк Туллий Цицерон. О девинации.
Марк Туллий Цицерон 
(3 января 106 до н. э., — 7декабря 43 до н. э.) 
 древнеримский политический деятель, оратор и философ

Специфическая особенность исследований социальных сетей определена важной ролью Теории случайных сигналов и шумов в приложении к задачам сетевого пространства.

В отличие от специализированых информационных ресурсов, контент социальных сетей носит характер шума. К его изучению применимы те же инструменты, что используются при исследовании случайных сигналов и шумов.
Наиболее распространенными моделями случайных сигналов и шумов являются :
•телеграфный сигнал,
•белый шум,
•гауссовский случайный процесс,
•гауссовский шум

Телеграфный сигнал - это случайный процесс , представляющий собой последовательность прямоугольных положительных и отрицательных импульсов со случайными длительностями и детерминированными значениями амплитуд .

Если считать случайной величиной телеграфного сигнала значение n - количество перемен знака внутри интервала t, то распределение вероятностей значений n будет описываться законом Пуассона.


Корреляционная функция телеграфного сигнала

Белый шум является стационарным случайным процессом  с постоянной спектральной плотностью . Другими словами, все спектральные составляющие белого шума имеют одинаковую энергию (как белый цвет содержит все цвета видимого спектра).
Идеального белого шума на практике не может существовать, так как для него должно было бы выполняться условие, при котором мощность шума и его дисперсия равны бесконечности, а значения шума не коррелированы для любых |t| ≠ 0

Корреляционная функция телеграфного сигнала

Скачать и прослушать 10 секунд белого шума

Гауссовский шум возникает при суммировании статистически независимых белых шумов и имеет следующую функцию корреляции.


Гауссовское нормальное распределение

Обмен информацией в социальных сетях имеет характер шума, со специфическими спектральными характеристиками

Броуновский (красный, «коричневый») шум - спектральная плотность обратно-пропорциональна квадрату частоты

I=1/f2

где
I – интенсивность сигнала (dB);
f – частота (периодичность) (Hz)

Спектрограмма броуновского шума

Скачать и прослушать 10 секунд броуновского шума

Серый шум - сигнал, соответствующий психоакустической кривой постоянной громкости по всем частотам, то есть для человеческого слуха он имеет одинаковую громкость на всех частотах.

Спектрограмма  серого шума

Диаграмма чувствительности человеческого уха

Спектр серого шума получается, если сложить спектры броуновского и фиолетового шумов. В спектре серого шума виден большой «провал» на средних частотах, однако из-за повышенной чувствительности уха к этой части спектра, человеческий слух субъективно воспринимает серый шум как равномерный по спектральной плотности (без преобладания каких-либо частот).

Чёрный шум – интенсивность колебаний обратно пропорциональна кубу частоты (или прямо пропорциональна степенному значению периодов одиночных сигналов, для любой степени >2).

I=1/f3


Спектрограмма чёрного шума


Аудиодорожка чёрного шума

Скачать и прослушать 10 секунд чёрного шума

Чёрный шум - со спектром 1/fβ, где β > 2 .

Используется для моделирования различных природных процессов. Считается характеристикой «природных и искусственных катастроф, таких как наводнения, обвалы рынка и т. п.»


Манфред Роберт Шредер (Manfred Robert Schroeder)
(12 июля 1926 - 28 декабря 2009г.) 
- немецкий физик, известный фундаментальными исследования в области акустики и компьютерной графики. 
Книга:
Manfred Schroeder, «Fractals, chaos, power laws»: Minutes from an Infinite Paradise (Freeman, 1991)

ПРАКТИЧЕСКОЕ ЗАНЯТИЕ
Изучение лингво-профиля социальной сети

Исследовать частоту употребления ключевых слов на форуме журнала «Катера и яхты»
(10 221 зарегистрированный аккаунт).
Заданы условия:
18 Июнь 2016г. Пользователь с ником «Mr. S» создал ветвь на тематическом форуме «Парусные яхты», разместив сообщение «Bavaria cruiser 30 - достоинства и недостатки».
Постоянный адрес ветки
http://forum.katera.ru/index.php?/topic/53493-bavaria-cruiser-30-dostoinstva-i-nedostatki/
Требуется оценить перспективу развития дискуссии на этой ветке*
-----------
*По состоянию на 01.10.2017 ветка неактивна более года.
«Приветствую уважаемую публику!
Присматриваюсь к Баварии 30, с точки зрения приобретения. Сходил на ней в чартер. Лодочка против ветра конечно капризничает, но думаю можно приноровиться к настройке парусов, это придет с практикой. В остальном она меня порадовала и вызвала желание владеть ей. У кого какое мнение на сей счет? Надежность, "болячки", сильные стороны?»
К посту присоединён демонстрационный видеоролик на Youto.be продолжительностью 5 минут.

Предмет обсуждения
год изготовления: 2007, Верфь: Bavaria (DE)
длина: 9,45 m
ширина: 3,29 m
осадка: 1.40 m
место стоянки: Italien Adria
Цена € 48.500,-
Ход обсуждения
В обсуждении приняло участие 16 человек, которые сделали в общей сложности 51 сообщения, в том числе 11 непосредственно в адрес топикстартера.
Топик был активным 39 суток, из которых наиболее интенсивный обмен происходил в первые 4 дня.
Участниками обсуждения было создано дополнительно 17 суб-топиков

Граф взаимодействия участников обсуждения

Анализ контента
Текст ветки (контент) содержит 9 295 слов (46 518 знаков, включая знаки препинания и служебные символы).
В статистике учтено взаимное цитирование.
Ключевое слово употребляется параллельно с 6-ю словами-синонимами, к числу которых относится и точное определение предмета топика.

Система синонимов ключевого слова

Текстовый массив топика

Обработка текстового массива контента

Ключевое слово использовано 92 раза (включая слова-синонимы). Интенсивность использования кучевого слова на протяжении дискуссии топика не равномерна.


Обработка текстового массива

Диаграмма интенсивности употребления ключевого слова в ходе дискуссии

Выводы
Интенсивность употребления ключевого слова в целом соответствует спектрограмме «чёрного шума».
Разрушение контента начинается на 11-м периоде, путём появления многочисленных синонимов и связанных с ним субтопиков (форк контента). Дискуссия окончательно завершается на 20-м периоде.
Вероятность возобновления дискуссии незначительна.

Литература
  1. Давенпорт В.Б., Рут В.Л. Введение в теорию случайных сигналов и шумов. М.: ИЛ, 1960. - 467 с. 
  2. Баскаков С.И. Радиотехнические цепи и сигналы: Учебник для вузов. - М.: Высшая школа, 1988.- 448 с. 
  3. Бендат Дж., Пирсол А. Прикладной анализ случайных данных. – М.: Мир, 1989. – 540 с. 
  4. Сергиенко А.Б. Цифровая обработка сигналов. – СПб.: Питер, 2003. – 608 с. 
  5. Вероятностные методы в вычислительной технике: Учебное пособие для вузов./ А.В.Крайников и др. - М.: Высшая школа, 1986. - 312 с. 
  6. Гурский Е.И. Теория вероятностей с элементами математической статистики: Учебное пособие для вузов. - М.: Высшая школа, 1971.- 328 с. 
  7. Игнатов В.А. Теория информации и передачи сигналов. - М.: Советское радио, 1979


Социологические методы




Международная сеть исследователей социальных сетей ( INSNA ) является профессиональной академической ассоциацией исследователей и практиков: объединяет более 1 тыс. действительных членов и почти 3 тыс. членов-корреспондентов.
Основана в 1977 г. Барри Уэлманом.
Официальный сайт организации  http://insna.org/
Российское членство представляет:
Государственный Академический университет гуманитарных наук
https://gaugn.ru

Совместный ресурс Высшей школы экономики (РФ) и Университета Амстердама (Дания)
http://asocialnetworks.blogspot.ru/


Литература


1. Градосельская Г. В. Сетевые измерения в социологии: Учебное пособие / Под ред. Г. С. Батыгина. М.: Издательский дом «Новый учебник», 2004. — 248 с.

http://socioline.ru/pages/gradoselskaya-g-v-setevye-izmereniya-v-sotsiologii



Экономические методы



Литература

Зайонц В.В. Социально-антропологический подход к исследованию интернет-сообществ // Журнал социологии и социальной антропологии. - 2011. - Т. XIV. - С. 200 205.


Sanches F. P. Competitively Groups on Social Network Sites // Mathematical and Computer Modeling. - 2010. - Vol. 52. - N 7-8. - P. 1052-1057

Iba T., Nemoto K., Peters B., Gloor P.A. Analyzing the Creative Editing Behavior of Wikipedia Editors Through Dynamic Social Network Analysis // Procedia Social and Behavioral Sciences. - 2010. - N 2. - P. 6441–6456.

Hand D.J. Information Generation: How data rule our world. OneWorld Publications, 2007.

Hinduja S., Patchin J.W. Personal information of adolescents on the Internet: A quantitative content analysis of My Space // Journal of Adolescence. - 2008. - Vol. 31. - N. 1. - P. 125-146.


Комментарии