Руководства, Инструкции, Бланки

Pajek инструкция

Категория: Инструкции

Описание

ТЕХНОЛОГИИ ПОЛИТИЧЕСКОЙ МОБИЛИЗАЦИИ В СОЦИАЛЬНОЙ СЕТИ ВКОНТАКТЕ: СЕТЕВОЙ АНАЛИЗ ПРОТЕСТНОГО И ПРОВЛАСТНОГО СЕГМЕНТОВ

Архив научных статей

Шерстобитов Александр Сергеевич, Брянов Кирилл Александрович
Санкт-Петербургский государственный университет

Аннотация. Анализируется деятельность политически активных пользователей социальной сети "ВКонтакте" в период избирательного цикла 2011-2012 гг. В рамках исследования авторы моделируют ядра протестных и провластных сетевых структур, выявляют основные технологии политической мобилизации в социальных сетях, изучают эффективность различных приемов влияния на поведение участников и демонстрируют практическое значение разработки сетевых стратегий в политических кампаниях.

Ключевые слова и фразы: политическая мобилизация, социальные сети, политическое действие, ядро сети, сетевое взаимодействие, сетевое моделирование, сетевые связи, сетевые параметры, political mobilization, social networks, political action, core of network, networking, network m.

Открыть полный текст статьи в формате PDF. Бесплатный просмотрщик PDF-файлов можно скачать здесь .

Список литературы:
  1. Блог А. Навального [Электронный ресурс]. URL: http://navalny.livejournal.com (дата обращения: 29.05.2012).
  2. Волкова А. В. Бунт и традиции российской политической культуры // Исторические, философские, политические и юридические науки, культурология и искусствоведение. Вопросы теории и практики. Тамбов: Грамота, 2013. № 3 (29): в 2-х ч. Ч. II. C. 49-53.
  3. Градосельская Г. В. Сетевые измерения в социологии: учебное пособие / под ред. Г. С. Батыгина. М. Издательский дом "Новый учебник", 2004. 248 с.
  4. Делицын Л. Л. Подлесная Т. А. Стохастические модели распространения новых идей в социальных сетях // Открытое образование. 2011. № 2. С. 242-244.
  5. Зуев А. С. Федянин Д. Н. Модели управления мнениями агентов в социальных сетях // Проблемы управления. 2011. № 2. С. 37-45.
  6. Курочкин А. В. Трансформация государственного суверенитета в условиях становления сетевого общества // Исторические, философские, политические и юридические науки, культурология и искусствоведение. Вопросы теории и практики. Тамбов: Грамота, 2012. № 2 (26). Ч. III. C. 95-99.
  7. Статистика по профилям пользователей ВКонтакте [Электронный ресурс]. URL: http://habrahabr.ru/post/123856/ (дата обращения: 14.04.2012).
  8. Статистика Vkontakte.ru [Электронный ресурс]. URL: www.vkstat.com (дата обращения: 14.04.2012).
  9. Шерстобитов А. С. Коммуникативный подход к анализу политических сетей // Вестник Санкт-Петербургского университета. Серия 6. 2010. Вып. 1.
  10. Batagelj V. Mrvar A. Pajek – Program for Large Network Analysis [Электронный ресурс]. URL: http://vlado.fmf.uni-lj.si/pub/networks/pajek/ (дата обращения: 20.12.2011).
  11. Morozov E. The Net Delusion: the Dark Side of Internet Freedom. N. Y. Public Affairs, 2011. 432 р.
  12. Nahed Eltantawy, Julie B. Wiest. Social Media in the Egyptian Revolution: Reconsidering Resource Mobilization Theory // International Journal of Communication. 2011. Vol. 5. P. 1207-1224.


© 2006-2016 Издательство "Грамота"
Копирование материалов раздела "Архив научных статей" в сети Интернет ЗАПРЕЩЕНО.
Допускается копирование материалов остальных разделов при обязательном
условии – указании активной гиперссылки на www.gramota.net
разработка и создание сайта, поисковая оптимизация: krav.ru

Pajek инструкция:

  • скачать
  • скачать
  • Другие статьи

    Построение корреляционного графа и его анализ - Форум врачей-аспирантов

    Группа: Пользователи
    Сообщений: 936
    Регистрация: 13.01.2008
    Из: Челябинск
    Пользователь №: 4704

    Пробую разобраться в элементах анализа социальных сетей (Social Network Analysis - SNA). Материал: в группах больных и здоровых измерена концентрация 30 биохимических показателей. Хочу сделать следующее:
    1) На основании предварительно расчитанных ранговых корреляций построить для обеих групп корреляционные графы, в которых бы рёбра положительных и отрицательных корреляций изображались линиями разного типа, например: сплошной и пунктирной.
    2) Используя в качестве порогового значения заданный мной показатель коэффициента корреляции (например +/- 0,3 или +/- 0,5) создать бинарную матрицу смежности. Т.е например, все корреляции менее 0,3 по абсолютной величине станут 0, а |0,3| и более - |1|.
    3) Покрутить полученное решение разными алгоритмами и выбрать наиболее наглядное решение. Линии тоже - сплошные и пунктирные.
    4) Желательно встроенными в пакет средствами определить кластеры показателей в полученном решении.
    5) Сравнить 2 сети и построить некий обобщённый граф, в котором бы различия между ними были хорошо видны.

    Много чего скачал и урывками просмотрел хелпы (Pajek, yEd Graph Editor, KrackPlot, Cytoscape, Meerkat, ORA и ещё несколько, включая 2 пакета для R). Основная проблема: разные пакеты не хотят работать с корреляциями или с отрицательными корреляциями. Если работают, то нет возможности автоматически генерировать из них матрицы смежности с разными пороговыми значениями r. Сложилось впечатление, что эволюция пакетов идёт исключительно в сторону возможностей обработки всё больших массивов данных и преимущественно из интернета, а у меня микросеть и несколько другая задача.
    Хотелось бы сделать работу в таком ключе: http://www.barabasilab.com/pubs/CCNR-ALB_P. NetMedicine.pdf

    Кто работал с сетевым анализом? Подскажите, пожалуйста, какой пакет подойдёт для моих целей? Может посоветуете разные программы для отдельных этапов? Не понятно пока как сравнить сети и визуализировать различия.

    PS Всех женщин-участников и читателей форума - с Праздником! Успехов в научных и житейских делах!

    Сообщение отредактировал nokh - 8.03.2012 - 17:02

    p2004r

    Просмотр профиля

    Группа: Пользователи
    Сообщений: 861
    Регистрация: 26.08.2010
    Пользователь №: 22699

    Все манипуляции с графами может делать igraph в R. В том числе находить кластеры узлов. Преобразовать матрицу коэффициентов корреляции как описано проблем никаких не составляет.

    Что касается найти общее в двух графах с именованными узлами, то по моему это просто проверка ребер на существование (или равенство для ориентированного графа).

    Красиво выводит графы graphviz. Он тоже интегрирован в R (только надо брать по моему с биокондуктора).

    А цель именно освоить манипуляции с графами, или получить информацию от датасета?

    Группа: Пользователи
    Сообщений: 936
    Регистрация: 13.01.2008
    Из: Челябинск
    Пользователь №: 4704

    Цитата(p2004r @ 8.03.2012 - 22:57)

    Что касается найти общее в двух графах с именованными узлами, то по моему это просто проверка ребер на существование (или равенство для ориентированного графа).
    А цель именно освоить манипуляции с графами, или получить информацию от датасета?


    Цель именно в освоении этой технологии: хотелось посмотреть как она работает в качестве самостоятельно нестатистического метода, хотя и базирующегося на исходных статистических данных: насколько интерпретируемо расположатся вершины в пространстве, что может дать информации о числе связей каждой вершины и т.п.
    В принципе, сама задача уже решена. Мы провели 2 нелинейных анализа главных компонент отдельно для группы доноров и группы больных, выделили факторы, сравнили 2 факторные структуры отдельно для каждого фактора (с помощью коэффициентов конгруэнтности) и целиком (с помощью прокрустового анализа), по остаткам прокрустового анализа нашли показатели, по которым факторные структуры наиболее отличались. Оказалось, что в группе здоровых ряд показателей дали нагрузку и на первый и на второй фактор, тогда как в группе больных они чётко разделились по факторам. На основании этого я предположил, что число связей между показателями больше в группе здоровых, а в группе больных число связей сокращается, а их сила увеличивается. Тупо посчитали корреляции более 0,5 в обеих группах и подтвердили предположение. Вот я и задумался: а нельзя ли эти связи представить наглядно в виде корреляционного графа, а если возможно, то и сравнить 2 структуры с помощью технологий сетевого анализа.
    В терминологии SNA я пока не силён. Если "проверка рёбер на существование (или равенство для ориентированного графа)" это оценка статистической значимости корреляции, то тут не всё однозначно. Поскольку одна группа была в 2 раза больше другой, то в одной статистически значимыми были связи c r=0,3, а во второй - только с r=0,5. Поэтому я и решил "плясать" не от значимости, а от r.

    Цитата(DoctorStat @ 8.03.2012 - 23:59)

    Бегло прочитал рекомендуемую англоязычную статью. Из нее следует, что простые коэффициенты корреляции не подойдут. Причина этого аналогична проблеме вычисления частных коэффициентов корреляции для множественной регрессии. Предположим, что у нас есть последовательность реакций превращения веществ: 1 => 2 => 3. Коэффициент корреляции этой схемы r13 положителен, т.к. чем больше вещества 1, тем больше получится вещества 3. Но непосредственной связи (химич.реакции) для узлов 1 и 3 нет, следовательно, не существует и соединяющего эти узлы ребра. Таким образом, прямое использование матрицы корреляций не позволяет построить метаболическую сеть взаимодействия веществ.


    Думаю, попробовать всё равно стоит. Ведь чем длиннее цепочка, тем слабее связь элементов на её концах. Поэтому, подобрав удачное пороговое значение корреляции для её включения с сеть, вероятно возможно добиться, такого графа, когда ребра между 1 и 3 не будет.
    ***
    К сожалению за свободную неделю особо не продвинулся, а сейчас времени будет меньше. Склоняюсь к мысли, что возможно начинать нужно было не с корреляций и SNA, а с чего-то типа путевого анализа или SEM. А богатые возможности накачанного софта использовать исключительно для визуализации полученного решения. Graphviz скачал, но ещё не смотрел (в R он идёт как rgraphviz).

    Анализ социальных сетей

    Форум Сообщества Практиков Конкурентной разведки (СПКР)

    Всего сообщений: 6053
    Рейтинг пользователя: 43


    Дата регистрации на форуме:
    7 июня 2009

    Профиль | Игнорировать
    NEW! Сообщение отправлено: 8 июня 2013 13:47
    Сообщение отредактировано: 8 июня 2013 13:50

    Инструменты расследования. Анализ социальных сетей

    На сегодняшний день ценность аналитических инструментов, позволяющих визуализировать отношения между людьми, организациями и транзакциями, очевидна. По мнению независимого эксперта в области финансовой информационной безопасности Криса Свекера (Chris Swecker), ранее работавшего на постах помощника главы ФБР и руководителя службы информационной безопасности Bank of America, мошенничества со стороны организованных криминальных групп наносят финансовым институтам наибольший ущерб. И лучший способ борьбы с ними – удар по организации в целом, а не по отдельным ее участникам. Инструментом, дающим аналитикам возможность спланировать и осуществить этот удар, является анализ социальных сетей.

    Анализ социальных сетей (АСС) эффективно используется для борьбы с отмыванием денег, кражами личности, сетевыми мошенничествами, кибератаками и др. В частности методики АСС использовались при расследовании незаконных операций с ценными бумагами, проводившемся Австралийской комиссией по ценным бумагам и инвестициям (Australian Securities and Investment Commission).

    Автор ряда книг и эксперт в области безопасности и анализа данных Джисус Мина (Jesus Mena) назвал АСС «техникой интеллектуального анализа данных, представляющей их структуру в виде связанных между собой объектов». Эта техника базируется на таких математических дисциплинах, как теория графов и матричная алгебра, и обеспечивает аналитиков инструментарием, позволяющим моделировать и изучать структуру связей между различными объектами.

    В соответствии с базовыми теориями два основных инструмента АСС – матрица и диаграмма связей. Соответственно алгоритм работы аналитика с собранными данными включает в себя следующие этапы: создание матрицы (или матриц) связей, построение диаграммы связей (графа), анализ связей.

    Матрицы могут быть квадратными, если анализируются однородные объекты (например, люди), и прямоугольными для анализа связей разнородных объектов (например, люди и организации). Принципы их построения идентичны в обоих случаях: наличие связи между объектами помечается выбранным символом в ячейке, лежащей на пересечении соответствующих строки и столбца.

    Можно заметить, что квадратная матрица симметрична относительно диагонали, то есть принимается версия: если Алексей знает Сергея, то и Сергей знает Алексея. В диагональных ячейках матрицы проставлены нули, поскольку игнорируется связь человека с самим собой.

    СИМВОЛЫ, ТРАДИЦИОННО ИСПОЛЬЗУЕМЫЕ ПРИ ПОСТРОЕНИИ МАТРИЦЫ СВЯЗИ

    1 наличие связи между объектами
    0 отсутствие связи между объектами
    - предполагаемая, но не подтвержденная связь между объектами


    Матрицы позволяют сделать связи между различными объектами анализа более наглядными, но еще большей степенью визуализации обладают диаграммы связи.

    Построению диаграммы связи предшествует детальный анализ матрицы. Чтобы диаграмма оказалась максимально удобной и наглядной начинать ее построение следует с объектов, имеющих наибольшее количество связей. Для этого требуется просуммировать показатели строк матрицы для каждого индивида. А если мы имеем дело с прямоугольной (несимметричной) матрицей, то просуммировать нужно и показатели столбцов. Таким образом, диаграмма строится от более активных к менее активным участникам расследования.

    В отдельных случаях диаграмму можно построить сразу, минуя этап создания матрицы, но это возможно только для ситуаций с относительно небольшим количеством объектов анализа. Так, если требуется создать диаграмму связей 150 сотрудников компании, без предварительного формирования матрицы не обойтись.

    Диаграмма связи позволяет аналитику выявлять неочевидные на первый взгляд закономерности: определять ключевых игроков, важных для коммуникаций участников. Эти сведения могут стать основанием для дальнейшего наблюдения за человеком или проведения с ним беседы.

    В простейшей диаграмме связей не учитывается ни направление, ни вес связи. В реальной жизни эти характеристики имеют критическое значение. Например, Сергей может знать Олега, но это не значит, что Олег знает Сергея. Или с партнером по бизнесу исследуемое лицо может иметь гораздо более тесные отношения, чем с клиентом своей компании. И вес, и направление связей можно отобразить с помощью диаграмм социальных сетей, которые представляют собой усовершенствованное развитие матриц и диаграмм связи. В этом случае матрица уже не будет симметричной относительно диагонали.


    В данном примере каждая связь имеет свою значимость и направление. Таким образом, аналитик получает гораздо более точную картину ситуации и соответственно может давать более точные прогнозы и рекомендации относительно дальнейшего расследования.

    Если оперировать математическими понятиями, диаграмма социальной сети представляет собой типичный граф, состоящий из множества вершин (объектов) и множества ребер (связей).

    Для того, чтобы эффективно бороться с организованными преступными группами, требуется знать их слабые и наиболее уязвимые места. По мнению профессора Калифорнийского университета социологии Роберта Ханнемана (Robert Hanneman), представители организации, обладающие большим количеством связей являются наиболее влиятельными и важными. И этому есть объяснение, ведь люди с большим количеством связей имеют более широкий доступ к информации, круг знакомств с коллегами и, как следствие, большую возможность влиять на ситуацию в организации. Таким образом, информация о связях между членами группы может указать на ключевых игроков и возможные точки уязвимости.

    Анализ диаграмм социальных сетей базируется на целом ряде характеристик, и одними из ключевых среди них являются плотность и центрированность.

    Плотность. Отношение количества связей к общему количеству участников сети. Является мерой скорости, с которой информация может распространяться по сети. Чем больше связей в сети, тем выше скорость, и тем быстрее организация может адаптироваться к новым условиям. Хорошо защищенная сеть содержит избыточное количество связей. Такие сети являются более гибкими и устойчивыми к внешним воздействиям.

    Решающим моментом при анализе социальных сетей является поиск объектов, обладающих наибольшей важностью внутри группы, то есть наиболее близких к центру сети. Фактически это поиск людей, без которых группа не сможет дальше существовать. Для выявления таких людей существует несколько подходов:

    Определение степени вершины. То есть числа связей объекта внутри сети. Участники сети, обладающие наибольшим количеством связей являются наиболее влиятельными в организации.

    В приведенной сети объект А будет наиболее важным, так как обладает наибольшим количеством связей. В то время как объект С, имея всего одну связь, находится на периферии сети.

    Для ориентированных сетей этот показатель учитывает соотношение входящих и исходящих связей. В таких сетях объект с более высоким статусом будет иметь существенно более высокую входную степень по сравнению с выходной, то есть его будут знать значительно больше людей, чем знает он сам.

    Определение среднего расстояния (близости). В масштабах сети среднее расстояние - это мера близости членов организации друг к другу, за сколько в среднем шагов один член сети может связаться с другим. Центральным по данному показателю будет считаться тот объект, для которого расстояние до остальных вершин минимально. Поскольку путь от центральных объектов к прочим является наиболее простым, они имеют большую вероятность получения информации, циркулирующей в сети, и могут контролировать распространение этой информации.

    Определение степени промежуточности (посредничества). Промежуточность – это степень включенности объекта в маршруты связи между другими участниками сети. Фактически промежуточность демонстрирует насколько часто объект лежит на кратчайших путях между другими объектами. Например, в графе перелетов наибольшим показателем промежуточности будут обладать крупные международные аэропорты. Центральным по данному критерию объектом считается тот, что может контролировать наибольшее число путей в сети.

    Методики и инструменты анализа социальных сетей постоянно развиваются. Подходы первого поколения подразумевали выполнение всех работ вручную: построение матриц и диаграмм связей, анализ полученных структур. Например, основатель orgnet.com, специалист по социальным сетям Валдис Кребс (Valdis Krebs) на основании информации, опубликованной в нескольких крупных изданиях, вручную построил карту террористической сети, ответственной за события 11 сентября 2001 года.

    Инструментарий второго поколения уже включал программные продукты, позволяющие специалистам автоматически строить сети на основании собранных данных. Таким образом, на аналитика возлагалась только задача анализа и интерпретации результатов.

    Наконец, третье поколение инструментов наделено богатой аналитической функциональностью, позволяющей экспертам работать с большими объемами данных.

    На текущий момент на рынке программного обеспечения представлено множество инструментов для сбора и ввода данных, построения сетей и их статистического анализа.

    UCINET
    URL: www.analytictech.com/ucinet/
    Последняя доступная версия 6.
    Условно-бесплатное ПО: 60 дней бесплатного использования, затем 40$ для студентов, 150$ для профессорско-преподавательского состава, 250$ для компаний.
    Разработка компании Analytic Technologies служит для анализа социальных сетей. Версии программы часто обновляются. UCINET включает все основные методы анализа и средства преобразования данных. Для визуализации социальной сети используется интегрированная в UCINET программа NetDraw. Продукт совместим с форматом данных Pajek.

    Pajek
    URL: pajek.imfm.si
    Последняя доступная версия 2.
    Бесплатное ПО.
    Программа предназначена для анализа больших сетей. Pajek обладает богатыми средствами визуализации сетей, возможностью преобразования данных, поддерживает разные форматы файлов. Продукт позволяет легко создавать визуальные представления взаимосвязей между исследуемыми объектами.

    STOCNET
    URL: stat.gamma.rug.nl/stocnet
    Последняя доступная версия 1.8.
    Бесплатное ПО.
    Программа ориентирована на продвинутый статистический анализ социальных сетей и сфокусирована на вероятностных (стохастических) моделях.

    С большим количеством инструментов можно познакомиться на en.wikipedia.org .

    Финансовые мошенничества – одна из наиболее активно растущих категорий преступлений. Многие организации закладывают потери от мошенничеств в свои операционные расходы и считают это частью своего бизнеса. Но ввиду роста типов, общего количества и, как следствие, урона от мошенничеств, компаниям, так или иначе, придется уделять этой проблеме больше внимания.

    Аналитические инструменты, в том числе и методы АСС, играют важную роль в борьбе с преступлениями, и они должны продолжать развиваться. По мнению исполнительного директора по управлению рисками SAS Canada Уэсли Джилла (Wesley Gill): «Анализ социальных сетей – это метод сегодняшнего дня. Сейчас это передний край, но мы не хотим стоять на месте».

    1. «Counterterrorism Analysis Course. Defense Intelligence College: Introduction To Terrorist Intelligence Analysis», GlobalSecurity.org
    2. Marilyn B. Peterson «Applications in Criminal Analysis: A Sourcebook», Praeger Paperback, 1998
    3. John P Scott «Social Network Analysis: A Handbook», Sage Publications Ltd, 2000
    4. Robert Hanneman, Mark Riddle «Introduction to social network methods», 2005
    5. Luis R. Izquierdo, Robert Hanneman «Introduction to the Formal Analysis of Social Networks Using Mathematica», 2006
    6. Howard Silverstone, Michael Sheetz «Forensic Accounting and Fraud Investigation for Non-Experts», Wiley, 2006
    7. Jesus Mena, «Investigative Data Mining for Security and Criminal Detection», 2003
    8. Jennifer Kavur, «Fighting Fraud with Social Network Analysis», CIO.com, 2009
    9. Jesus Mena «Investigative Data Mining for Security and Criminal Detection», Butterworth-Heinemann, 2002
    10. Peter Klerks «The network paradigm applied to criminal organizations: theoretical nitpicking or a relevant doctrine for investigators? Recent developments in the Netherlands», Connections, № 3, 2001
    11. Valdis Krebs «Mapping networks of terrorist cells», Connections, №3, 2001

    Pajek инструкция

    § 3.2. Специальное программное обеспечение сетевых исследований


    В этом параграфе представлен краткий обзор и сравнительный анализ нескольких программных продуктов, специализирующихся на автоматизации исследовательских процедур, описанных в предыдущей главе. Начиная с 1970 года, когда увидела свет первая специализированная программа такого рода, было создано около сотни программ (Всего по данным Википедии, где ведется специальный список программ для сетевого анализа, насчитывается около 70 программных продуктов [Social network analysis software]. Они отличаются между собой довольно значительно по самым разным параметрам: функциональным возможностям, рабочей среде, удобству пользовательского интерфейса и т. п. Считает
    ся, что первая программа автоматического построения социограмм была создана в 1970 г. и она называлась SOCK [Прохоров, Ларичев]. С ее помощью была построена первая созданная автоматическим образом социограмма американских интеллектуальных кругов. В качестве исходных данных использовались тексты научно-публицистической периодики.
    Далее, в 1978 г. увидела свет программа NEGOPY, которая использовалась для поиска связей в социальных группах. Она могла обрабатывать данные не более чем о тысяче членов и не более чем 20 тысяч связей. В 80-е годы программа использовалась в 100 ведущих университетах мира для научных исследований. Основными областями применения данной программы были поиск социальных связей в коллективах, выявление внутренних группировок (клик), а также сортировка узлов в ограниченный набор ролевых категорий [Там же]. В 1991 г. появилась известная программа STRUCTURE, которая получила широкое признание в эти годы. Она работала в среде DOS, не имела графического интерфейса и управлялась при помощи командной строки [Huisman, van Duijn].
    На сегодняшний день существует большое разнообразие специальных программ для социального сетевого анализа. И это разнообразие продолжает усиливаться быстрыми темпами. Если 10 лет назад насчитывалось около 30 программных продуктов, то сегодня, как уже упоминалось, около 70 [Huisman, van Duijn, p. 270]. При этом, необходимо отметить, что на рынке современного программного обеспечения для традиционных социологических исследований уже сформировались лидеры, которые получили широкую известность. Мы имеем ввиду программы SPSS и STATISTICA [Боровиков, Ивченко; Бююль, Цефель; Наследов]. Вероятно, со временем и в результате конкурентной борьбы разнообразие рынка программного обеспечения для сетевых исследований также сократится. Однако сейчас мы имеем огромный выбор, где наряду с платными продуктами существуют вполне работоспособные бесплатные программы.
    Именно поэтому мы посчитали важным представить сравнительный анализ некоторых, наиболее подходящих для политического прогнозирования программ в области сетевых исследований. В отечественной литературе практически отсутствуют издания, описывающая как пользоваться конкретными программами для сетевого анализа. В то время как за рубежом этой теме уделяется большое внимание [Computational Social Network Analysis; Handbook of Social Network Technologies and Applications; Knoke, Yang; Memon, Alhajj; Nooy, Mrvar, Batagelj]. Фактиче
    ски существует всего две работы, проливающие свет на эту проблему [Нейронные сети; Прохоров, Ларичев]. Однако одна из них, «Нейронные сети. STATISTICA Neural Networks» посвящена исключительно одной программе и освещает тему исследований и прогнозов с использованием одного метода — метода нейронных сетей. Вторая работа, «Компьютерная визуализация социальных сетей» с одной стороны, весьма компактна, а с другой стороны, довольно сильно устарела. Так, например, сильно устарела классификация программ для сетевого анализа, предложенная авторами этой статьи. В частности, они предлагают делить все программы на две большие категории: для ручного рисования социограмм и для автоматической обработки и визуализации данных. На наш взгляд, такая классификация совершенно устарела, во-первых, в связи с повсеместным распространением офисных пакетов, в которые автоматически входят инструменты рисования алгоритмов и разного рода схем, а, во-вторых, в связи с тем, что программы для ручного рисования социограмм, собственно, не являются специализированным программным обеспечением для социального сетевого анализа. Они созданы в первую очередь для рисования организационных диаграмм и схем.
    Очевидно, что требуется новая классификация, построенная на использовании комплексного подхода и учитывающая современные реалии. На наш взгляд, более правильной классификацей выступает деление программ, в первую очередь, по функциональным возможностям. В результате этого деления можно говорить о трех группах специализированных программ для социального сетевого анализа: «Полного цикла» (включают обработку данных, элементы дескриптивной статистики, модуль визуализации и т. п.). «Неполного цикла» (отсутствует 1-2 модуля от программ «полного цикла»). «Узкой специализации» (созданные для решения специальной задачи).
    Кроме того, можно с высокой степенью вероятности предсказывать внедрение модулей сетевого анализа в традиционные статистические пакеты. Собственно, уже сегодня программа STATISTICA включает модуль анализа нейронных сетей. Скорее всего, через некоторое время крупные компании, занимающиеся разработкой программного обеспечения, обратят внимание на эту нишу и разработают соответствующие приложения.
    Для сравнительного анализа программного обеспечения в области
    сетевого анализа нами были выбраны несколько программ. Наш выбор был ограничен несколькими параметрами. Во-первых, наш обзор должен быть достаточно компактным. Во-вторых, мы предпочли сконцентрироваться на тех программах, которые созданы для работы под управлением операционной системы Windows, так как именно эта операционная система наиболее привычна российским пользователям. В-третьих, мы постарались выделить наиболее популярные программы, ориентируясь при этом на упоминания в специальной литературе. Также, к большому сожалению, из нашего обзора автоматически выпало несколько программ, распространяемых на условии платной лицензии и не имеющих демонстрационной версии. В результате отбора для сравнительного анализа было выбрано шесть программ (табл. 6).
    Т а б л и ц а 6. Список программ социального сетевого анализа, выбранных для сравнения


    Выявление и анализ клик


    Бесплатно для некоммерческого использования


    Общий сетевой анализ с использованием графического интерфейса


    Платно, 30-дневная демо-версия


    Визуализация больших сетей


    Бесплатно для некоммерческого использования


    Статистический пакет с модулем нейронных сетей

    />Платно, 30-дневная демо-версия


    Бесплатно для некоммерческого использования


    UCINET и NetDraw


    Продвинутый сетевой анализ


    Платно, 60-дневная демо-версия

    Среди множества критериев сравнительного анализа программного обеспечения для сетевого анализа, как мы уже упоминали выше во время описания проблемы классификации, следует в первую очередь выделить функциональные возможности этих программ. Однако, сами эти функциональные возможности в свою очередь также различаются. Так, самый первый функционал относится к введению и редактированию исходных данных. Во-вторых, надо рассмотреть аналитические возможно
    сти программ, которые базируются на осуществлении различных методов вычисления данных. Среди них выделяют три типа методов: Дескриптивные методы вычисления простых статистических данных сети (например, индекса плотности сети); Стандартные процедуры вычисления более сложных аналитических техник (кластерный анализ); Статистическое моделирование, основанное на стохастических моделях (к примеру — экспоненциальные модели случайных графов).
    Далее, следует остановиться на возможностях визуализации результатов исследования. В последнее время большой интерес вызывают возможности трехмерной или 3D-визуализации сетей. И наконец немаловажное значение имеют дружественность интерфейса программы, наличие разного рода руководств, справочников, а также возможности получения технической поддержки.
    Таким образом, дальнейшее сравнение будет базироваться на семи критериях: Данные; Дескриптивные методики; Стандартные процедуры; Статистическое моделирование; Визуализация; Интерфейс; Поддержка.
    Мы решили начать наш обзор с программ UCINET и NetDraw, так как авторы этих программ - С. Боргатти, М. Эверетт и Л. Фриман - были одними из первых исследователей, кто начал разрабатывать специально программное обеспечение для сетевого анализа. Данное направление исследований получило широкую поддержку в Гарвардском университете, США. Программа была создана при поддержке данного университета. Они создали программный продукт, который до сих пор широко используется в научных исследованиях.

    При этом, Л. Фриман считается первооткрывателем ведущим специалистом в области промежуточной центральности [Freeman]. Мы также решили объединить эти две программы, так как они дополняют друг друга, а работа в NetDraw базируется на данных, полученных из UCINET. Фактически NetDraw выступает в качестве бесплатного и не требующего регистрации модуля к программе UCINET, которая в свою очередь бесплатна, но требует регистрации.
    Минималистский дизайн программы UCINET вызван как достаточ
    ным количеством времени, прошедшим после ее появлением, так и задачей, которую ставили ее создатели — добиться большой производительности. И по сей день, на наш взгляд, этот модуль является одним из лучших среди имеющихся в наличии. В программе UCINET реализованы основные функции дескриптивной статистики, стандартных процедур, кластеризации и т. п. Визуализация сетей в программе UCINET отсутствует, однако она реализована при помощи специальной программы NetDraw. Такая особенность вызвана во многом тем, что UCINET обладает разнообразными возможностями импортирования и экспортирования данных. Что позволяет использовать ее с другими программами.
    Надо отметить, что UCINET является одной из самых, если так можно выразиться, авторитетных программ в научных кругах. С ее помощью выполнено большое количество исследований. В частности - работа М. Лонкила «Интернет и антивоенный активизм в России» [Lonkila].
    Программа Pajek (паук - на словенском языке) по уверению создателей создана для анализа очень больших сетей, количество вершин в которых насчитывает сотни тысяч и даже миллионы. Создатели программы начали свою работу в ноябре 1996 г. На сегодняшний день программа Pajek стала одной из самых упоминаемых среди ученых, практикующих сетевые методы исследований [Nooy, Mrvar, Batagelj]. Причина данного положения вещей заключается в том, что до появления этой программы большинство исследований вынужденно ограничивались несколькими десятками вершин. Так, например, программа UCINET может работать с сетью, состоящей максимум из 32767 вершин (фактически комфортная работа возможна не более чем с 5000. Однако сегодня наиболее важные социальные сети являются большими, то есть содержат более 100 тысяч вершин. Так, например, в социальной сети Facebook зарегистрировано несколько сотен миллионов участников. Для анализа больших сетей Pajek использует различные методики декомпозиции, которые позволяют упростить огромные массивы данных, выделяя в них наиболее крупные узлы и связи. При весьма простом интерфейсе, Pajek справляется с выполнением весьма сложных вычислений, которые требуют очень серьезной математической подготовки. При этом программа поддерживает импорт различных форматов данных. Интерфейс программы едва ли можно отнести к дружеским.
    Программа NetMiner является одной из немногих платных программ, созданных специально для сетевого анализа. Возможно, именно поэтому ее отличают прекрасный пользовательский интерфейс. Большинство
    функций реализованы в этой программе на уровне интуитивно понятной последовательности действий. Редактор исходных данных, на наш взгляд, является наиболее приятным и удобным для использования. Визуализация в программе NetMinet реализована на самом высоком уровне, включая самые новейшие приемы 3D-моделирования. Особенно следует отметить возможность навигации по картам больших сетей. Большинство дескриптивных статистик и вычислительных процедур выполнены на отличном уровне, отличаются удобством и широкими возможностями формирования разнообразных отчетов, включающих в том числе графики и диаграммы. Также следует отметить, что в программе NetMiner на высоком уровне реализована задача поиска клик в социальных сетях.
    STATISTICA Neural Networks являются «единственным в мире программным продуктом для проведения нейросетевых исследований, полностью переведенным на русский язык» [Нейронные сети, с. 3]. Несомненно, это два обстоятельство ставят данный программный продукт в особое положение. Поскольку статистический пакет STATISTICA достаточно известен, а его интерфейс однообразен для всех модулей, постольку мы остановимся на том, каковы особенности анализа данных и прогнозирования результатов с использованием модуля Neural Networks. Сам модуль следует установить отдельно, если он не поставляется в комплекте. И тут надо отметить, что данный продукт слабо подходит для анализа реальных социальных сетей. Речь идет об искусственных нейронных сетях, которые можно использовать для прогнозирования. При этом, сети могут носить, как линейный, так и вероятностный характер.
    В отличие от всех остальных программ, представленных в обзоре, StOCNET не имеет модуля ввода и редактирования данных, а также визуализации. Ее основное предназначение связано с дополнительным статистическим обеспечением сетевого анализа в области. StOCNET предоставляет возможности статистического моделирования, основанного на стохастических моделях. Она содержит шесть разных статистических модулей. В частности, первая модель BLOCKS используется для построения стохастических алгоритмических моделей [Nowicki, Snijders]. Это делает программу StOCNET на сегодняшний день уникальной.
    Программа CFinder является бесплатным программным продуктом для нахождения и визуализации пересекающихся плотных групп (клик) вершин в сетях. Данная программа работает на основе метода перколя- ции клик, разработанного венгерскими исследователями [Palla, Derenyi,

    Farkas, Vicsek]. CFinder имеет настолько узкую специализацию, что не предлагает пользователям никаких способов редактирования матриц смежностей, дескриптивной статистики всей сети или статистического моделирование. Все в этой программе подчинено задаче нахождения и визуализации клик. Исследователю, имеющему в своем распоряжении матрицу смежностей, остается только импортировать данные и изучать полученные результаты. Визуализация результатов выполнена на приемлемом уровне.
    Как справедливо замечают авторы главы о программном обеспечении для сетевого анализа в книге «Модели и методы в социальном сетевом анализе», «невозможно сделать полностью справедливого сравнения между программными продуктами потому, что их цели разные, что ведет к разной функциональности» [Huisman, van Duijn, p. 311]. Поэтому, видимо, нужно осуществлять выбор конкретной программы, ориентируясь на конкретные задачи исследования. Однако, на наш взгляд, можно выделить несколько очень важных моментов (табл. 7). Большая часть современных программ предлагают очень интересные средства визуализации данных, которые несомненно не только «украсят» исследование, но и сделают анализ данных более доступным для понимания.
    Т а б л и ц а 7. Оценка программ, выбранных для анализа


    Описател
    ьная
    статистик
    а


    Экспликация: «0» - функция отсутствует, «+» - функция присутствует минимально, «+ -» функция присутствует, но реализованной с некоторыми недостатками, «+ +» хорошо реализованная функция.

    Во-вторых, большинство программ предлагают набор описательной статистики.
    В-третьих, для большинства случаев, не требующих сверхсложных методов исследования, наиболее удобным вариантом выглядит программа NetMiner, самым большим недостатком которой является ее платность. Вместе с тем, данная программа может быть заменена 2-3 бесплатными, используя которые можно добиться хороших результатов.
    В заключении следует особенно подчеркнуть, что к большому сожалению все программы (за исключением статистического пакета STATISTICA), представленные в обзоре, не имеют русскоязычного интерфейса. Это значит, что для того чтобы использовать предлагаемую технику исследования необходимо не только разбираться в теории и методологии сетевого анализа, но и иметь представление о том, как основные термины и процедуры переводятся на английский язык.

    Еще по теме § 3.2. Специальное программное обеспечение сетевых исследований: