Материал: bikkulov_as_chugunov_av_setevoi_podkhod_v_sotsialnoi_informa

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Глоссарий

Интернет-коммуникации — методы общения, при которых передача информации происходит по каналам Интернет с использованием стандартных протоколов обмена и представления данных. Данные могут передаваться в различной форме — голос, видео, документы, мгновенные сообщения, файлы.

Интернет-сообщество — сложившаяся в процессе совместной деятельности относительно устойчивая система связей и отношений между пользователями сетевого информационного пространства в Интернете.

Информационное общество — концепция в рамках постиндустриализма; новая историческая фаза развития цивилизации, в которой главными продуктами производства являются информация и знания. Отличительными чертами информационного общества являются увеличение роли информации и знаний в жизни общества; возрастание доли информационных коммуникаций, продуктов и услуг в валовом внутреннем продукте; создание глобального информационного пространства, обеспечивающего а) эффективное информационное взаимодействие людей, б) их доступ к мировым информационным ресурсам и в) удовлетворение их потребностей в информационных продуктах и услугах.

Информационные коммуникационные технологии (ИКТ)

совокупность методов, производственных процессов и программнотехнических средств, объединенных в технологическую цепочку, обеспечивающую сбор, обработку, хранение, вывод и распространение информации для снижения трудоемкости процессов использования информационных ресурсов, повышения их надежности и оперативности.

Информационный подход — методологический принцип научного познания, заключающийся в рассмотрении объектов изучения через призму категории информации (определение А.В. Соколова).

Искусственный интеллект — свойство автоматизированных систем брать на себя отдельные функции интеллекта человека, например выбирать и принимать оптимальные решения на основе ранее полученного опыта и рационального анализа внешних воздействий (определение А.В. Рунова).

Кибернетика (от греч. kybernetike — искусство управления, от kybernáo— правлю рулём, управляю) — наука об управлении, связи и переработке информации (БСЭ).

Массовая информация — предназначенные для неограниченного круга лиц печатные, аудио-, аудиовизуальные и иные сообщения и материалы («Словарь по экономике и финансам»).

Моделирование — замещение одного объекта, обозначаемого системой (или объектом-оригиналом), другим объектом, называемым моделью, и также проведение исследования свойств модели (эксперимент на модели) с целью получения информации о системе (объекте).

Модель — это концептуальный инструмент, ориентированный на управление моделируемым процессом или явлением. При этом функции предсказания и прогнозирования служат целям управления. С позиции структурно-функционального подхода «модель» — это физически существующий или мысленно представляемый объект, который в процессе исследования замещает оригинал таким образом, что изучение модели дает новые знания об объекте-оригинале.

Научная информация — логическая информация, получаемая методами опытно-рационального познания объективного мира, не противоречащая господствующей системе научных представлений и используемая в общественно-исторической практике (определение А.И. Михайлова, А.И. Черного и Р.С. Гиляревского).

Плотность сети (density) — показатель, определяемый соотношением всех возможных прямых связей и фактически существующих, показывает, в какой степени люди, связанные с неким лицом, поддерживают контакты между собой.

Сетевое общество — общество, в котором значительная часть информационных взаимодействий производится с помощью информационных сетей («Словарь по естественным наукам»).

Сеть — форма спонтанного порядка, который возникает в результате действий децентрализованных агентов, а не создается какой-либо централизованной властью. Сеть можно рассматривать как группу индивидуальных агентов, которые разделяют неформальные нормы или ценности, помимо тех, которые необходимы для обычных рыночных операций (определение Ф. Фукуямы).

Системный подход — подход, при котором любая система (объект) рассматривается как совокупность взаимосвязанных элементов (компонентов), имеющая выход (цель), вход (ресурсы), связь с внешней средой, обратную связь.

Социализация — совокупность взаимосвязанных процессов усвоения

ивоспроизводства индивидом необходимого и достаточного для полноценного включения в общественную жизнь социокультурного опыта

ифило-онтогенетического формирования и развития соответствующих

80

81

свойств и качеств индивида, его становления как конкретно-исторического типа личности и субъекта (актора) социокультурных практик данного общества (Социология: Энциклопедия / Сост. А.А. Грицанов и др.).

Социальная информатика — научная дисциплина, обеспечивающая систематическое изучение и анализ процессов сбора, обработки, хранения, организации, распространения, оценки и использования информации в социально-экономической сфере, в том числе процессов трансформации общественных отношений и социальных институтов под влиянием развития информационно-коммуникационных технологий.

Социальная структура — совокупность сложившихся в данном обществе норм и вытекающих из этих норм требований к поведению представителей тех или иных социальных групп (определение Т. Парсонса).

Социальное время — интуитивно ощущаемое людьми течение социальной жизни, зависящее от интенсивности социальных изменений (определение А.В. Соколова).

Социальное пространство — один из видов пространства (наравне с физическим, экономическим, политическим, образовательным, экологическим, символическим и иными); совокупность процессов, отношений и взаимозависимостей всоциальной сфере, иерархически связанных междусобой.

Социальный институт — совокупность исторически сложившихся неформальных социальных норм (обычаев или стереотипов), концентрирующихся вокруг какой-то главной цели, ценности или потребности. Типичные примеры: институт семьи, экономический институт (производство и распределение товаров), институт морали.

Социальный капитал — совокупность неформальных норм, которые способствуют сотрудничеству между двумя и более индивидуумами. Социальный капитал как определенный потенциал общества или его части возникает в результате наличия доверия между его членами. Он может быть воплощен и в мельчайшем базовом социальном коллективе — семье, и в самом большом коллективе из всех возможных — нации, и во всех коллективах, существующих в промежутках между ними. Социальный капитал отличается от других форм человеческого капитала тем, что он создается и передается посредством культурных механизмов — таких, как религия, традиция, обычай (определение Ф. Фукуямы).

Структурный подход к изучению общества — понимание общества как целого, где составные части идентифицируются через свои отношения с целым.

Электронная коммуникация — взаимодействие участников, опосредованное электронными каналами связи.

Рекомендуемая литература и информационные материалы

Основная литература

Вайдлих В. Социодинамика: системный подход к математическому моделированию в социальных науках. М.: Либроком, 2010.

Градосельская Г.В. Сетевые измерения в социологии: учебное пособие. М.: Изд. дом «Новый учебник», 2004. С. 10.

Плотинский Ю.М. Модели социальных процессов: Учебное пособие для высших учебных заведений. Изд. 2-е, перераб. и доп. M.: Логос, 2001.

Дополнительная литература и ссылки на интернет-ресурсы

Бизнес пошел в социальные сети. URL: http://www.bigness.ru/articles/2012- 06-07/socseti/135020/

Назарчук А.В. О сетевых исследованиях в социальных науках // Социологические исследования. 2011. № 1. С. 39 — 51.

Ожиганов Э.Н. Моделирование и анализ политических процессов: учеб. пособие. М.: РУДН, 2009.

Полтерович В.М. Становление общего социального анализа // MPRA Paper No. 26085, posted 21. October 2010. URL: http://mpra.ub.unimuenchen.de/26085/1/MPRA_paper_26085.pdf.

Филонович С.Р., Кушелевич Е.И. Теория жизненных циклов организации И. Адизеса и российская действительность // Социологические исследования. 1996. № 10. С. 63—71.

Фукуяма Ф. Великий разрыв. М.: Издательство АСТ, 2003.

Фукуяма Ф. Доверие. Социальные добродетели и путь к процветанию. М.: Издательство АСТ, 2004.

Хафизова И.Ф. Авторская модель экспертной системы для определения настроения граждан в социальных сетях // Власть. 2012. № 4. С. 90 —

92. URL: http://www.isras.ru/files/File/Vlast/2012/04/ Hafizova.pdf.

82

83

Приложение

Веб-центр «Социодинамика» как инструментарий для выполнения лабораторных работ

Web-ориентированный производственно-исследовательский центр в области социодинамики и ее приложений (далее — веб-центр) объединяет современные концепции web 2.0 и возможности доступа к прикладным инструментам исследования, визуализации, анализа и моделирования социальных сетей, проведения научных исследований социальных сетей на основе этих инструментов, а также возможность организации обучения теории и практике исследования социальных сетей для студентов и аспирантов.

Веб-центр разработан в 2012 г. в рамках проекта «Разработка web-

ориентированного производственно-исследовательского центра в области социодинамики и ее приложений» и в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007—2013 гг.», (государственный заказчик: Минобрнауки РФ; исполнитель: НИУ ИТМО, научный руководитель проекта: А.В.Бухановский, проф., докт. технич. наук, директор НИИ НТК НИУ ИТМО).

Веб-центр представляет собой портал, на котором пользователи могут заводить свой профиль, проводить виртуальные лабораторные работы, научные исследования, сохранять результаты своей работы и иметь возможность просматривать методики и результаты проведенных исследовательских проектов. Программная платформа предлагает пользователям 4 вида сервисов:

сервисы сбора данных в социальных сетях, а также исследования по уже собранной и сохраненной базе данных сообщений и сетей;

сервисы статистической обработки и анализа данных результатов исследования социальных сетей;

сервисы выполнения преднастроенных сценариев и моделирования собственных сценариев исследования социальных сетей;

сервисы визуализации социальных сетей.

Web-центр создан на основе многофункциональной инструментально-

технологической платформы CLAVIRE (Cloud Applications Virtual Environment). Программное обеспечение web-центра включает в себя непосредственно ядро-оболочку, набор расчетных сервисов — прикладных пакетов, доступных в рамках бизнес-модели SaaS, а также дополнительные

средства, обеспечивающие функционирование виртуального профессионального сообщества пользователей в рамках концепции web 2.0. Они включают в себя интерактивные средства общения, совместное ведение проектов, единое рабочее пространство, позволяющее вести дискуссии в режиме online с использованием графических и текстовых средств общения.

В ходе разработки и апробации работы веб-платформы были реализованы несколько демонстрационных задач в соответствии со следующими сценариями:

построение социограммы неформального сообщества, анализ скорости и каналов распространения информации;

анализ и прогноз индексов общественных настроений;

выявление групп влияний в социальной сети и определение лидеров мнений;

выявление призывов к оффлайн общественным/экстремистским акциям;

обнаружение источников умышленной дезинформации.

Учебные материалы веб-центра включают лекции по тематике работы веб-центра, электронные видеоуроки-тьюторы по использованию возможностей веб-центра, виртуальные лабораторные работы для получения навыков его использования, а также методические указания для выполнения самостоятельных работ.

Википедия содержит пополняемый перечень терминов по тематике работы веб-центра.

Веб-центр доступен по адресу — http://socio.escience.ifmo.ru/.

84

85

Лабораторная работа 1.

Формирование перечня ключевых слов для отбора исследуемой совокупности текстов социальной сети

ВВЕДЕНИЕ

Целью лабораторной работы является получение навыков формирования перечня ключевых слов и словосочетаний для релевантного отбора исследуемой совокупности текстов социальной сети. Значимость умения правильно формировать перечень ключевых слов и словосочетаний обусловлена тем, что это, пожалуй, — самый важный из всех этапов исследования, так как именно он формирует совокупность текстов для анализа, и все последующие выводы будут зависеть от правильности подобранных ключевых слов. Неверный выбор ключевых слов, кроме формирования непредсказуемой совокупности текстов, не пригодных для анализа, также может непредсказуемо увеличить продолжительность сбора данных программой-краулером из-за обработки и скачивания в базу данных большого количества лишней нерелевантной информации.

Методика исследования заключается в выборочной проверке результатов выдачи стандартной поисковой формы социальной сети (например, «Живого журнала») в ответ на ввод проверяемых ключевых слов и словосочетаний. В качестве дополнительного средства проверки можно использовать краулинг по накопленной базе данных веб-центра и выборочный контроль попавших в совокупность сообщений.

Информационная база лабораторной работы включает в себя собранные базы web-центра «Социодинамика» по темам «Зеленый weekend», «Введение платности среднего образования» и «Законы о пропаганде гомосексуализма», которые делят между студентами по одной на каждого.

Особенностью данной лабораторной работы является применимость получаемых навыков для широкого спектра исследований социальных сетей как традиционными методами (контент анализ, выборочный метод), так и автоматизированными.

Результат выполнения работы:

совокупность ключевых слов и выражений, которые позволяют отбирать релевантные тексты для проведения исследования, не допуская «мусора» в результатах поиска по ключевым словам, статистика проверки релевантности выдачи по ним;

перечень отбракованных слов и словосочетаний и причин выбраковки, примеров и статистики нерелевантных сообщений, отбираемых по ним.

ОСНОВНЫЕ СВЕДЕНИЯ ТЕОРИИ

В данной лабораторной работе мы имеем дело с первым этапом исследования с использованием метода автоматизированного контентанализа. Первый этап состоит в формировании совокупности исследуемых текстов, так как перечень ключевых слов в нашем случае и формирует совокупность текстов для последующего автоматизированного анализа как параметров сообщений, так и связей авторов сообщений.

Контент-анализ — это метод многомерного, многостороннего исследования содержания коммуникаций. Характеризуя различные типы контент-анализа необходимо отметить, что качественный (не количественный) контент-анализ основан на нечастотной модели содержания текста (при этом фиксируется или учитывается наличие или отсутствие той или иной характеристики текста — элемента содержания или индикатора соответствующей категории содержания). Количественный контент-анализ рассматривает частоту появления в анализируемых текстах отдельных тем, слов, символов. Его задача — получить количественную структуру содержания текста»75.

Этапы контент-анализа

1.Определение совокупности изучаемых источников или сообщений с помощью набора заданных критериев, которым должно отвечать каждое сообщение.

2.Формирование выборочной совокупности сообщений. В некоторых случаях можно изучать всю определенную на первом этапе совокупность источников, поскольку подлежащие анализу случаи (сообщения) часто ограничены по числу и хорошо доступны, однако иногда контент-анализ должен опираться на ограниченную выборку, взятую из большего массива информации.

3.Выявление единиц анализа. Ими могут быть слова или темы. Простейшим элементом сообщения является слово. Тема — это другая единица, представляющая собой отдельное высказывание о каком-либо предмете.

4.Выделение единиц счета, которые могут совпадать со смысловыми единицами или носить специфический характер.

5.Непосредственно процедура подсчета. Она в общем виде сходна со стандартными приемами классификации по выделенным группировкам. Применяется составление специальных таблиц, компьютерных программ, специальных формул, статистических расчетов.

75 Тюрина И.О. Контент-анализ // Политическая энциклопедия: В 2 т. / Нац. обществ.-науч. фонд. М.: Мысль, 1999. Т. 1. С. 560.

86

87

6. Интерпретация полученных результатов в соответствии с целями и задачами конкретного исследования. Возможно выявление процента распространенности в обществе субъективных смыслов объекта или явления.

Рекомендации к формированию перечня ключевых слов

Прежде чем начинать подбирать ключевые слова, необходимо разобраться в интересующей тематике. Так, для исследования экологической тематики необходимо почитать сайты экологических организаций, например, Гринпис или Фонда дикой природы, изучить новости и обратить внимание на их представительства в социальных сетях, найти через обычные поисковые системы различные тематические интернет-ресурсы. Причем в качестве ключевых слов могут выступать и гиперссылки на профильные ресурсы, представительства в социальных сетях, новости и т.п.

Не рекомендуется брать в качестве ключевых слов часто используемые в обыденной жизни слова и выражения, так как в поисковой выдаче будет много сообщений, не связанных с целью вашего исследования. Вы легко можете (и должны) проверить релевантность ключевых слов, вводя проверяемые ключевые слова и выражения в поисковую форму социальной сети (например, ЖЖ) и выборочно просматривая найденные ссылки на сообщения, где встречается проверяемое ключевое слово. Так, например, не удастся попытка выделить совокупность записей по суицидальной тематике, вводя в качестве ключевого слова «смерть» — вы обнаружите в поисковой выдаче множество использований этого слова в нерелевантном контексте. Все мы знаем выражения «до смерти хочу…», « мне до смерти надоел…» и т.п. Даже слово «самоубийство» встречается в основном в текстах не лиц, склонных к суициду, а криминальных новостей и пересказов и комментариев произошедших громких самоубийств в записях совершенно не склонных к суициду людей.

Если вы хотите выделить сообщество людей, объединенных интересом к некоторой тематике, лучше всего использовать информацию, которая, скорее всего, будет распространяться (и обсуждаться) только интересующими вас людьми, входящими в сообщество.

Идеальный вариант — некоторое будничное мероприятие по теме, интересное только людям, интересующимся исследуемой тематикой. Так, нескандальные, обычные экологические акции, как правило, интересны только самим людям, озабоченным темой экологии. Другие пользователи посчитают эту информацию скучной и не будут размещать ее у себя в записях. Название такого мероприятия (если оно является более-менее

уникальным) и ссылки на страницы ресурсов, где размещены анонсы мероприятия, скорее всего, станут удачными ключевыми словами.

Кроме того, важно помнить, что люди могут упоминать некоторую информацию как в позитивном, так и в негативном контексте. При этом ключевые слова будут встречаться одни и те же, а записи будут противоположно окрашенными, и чем жарче споры, тем больше вероятности найти одни и те же ключевые слова в абсолютно противоположно окрашенных сообщениях. Сегодня продолжают активно развиваться методики семантического поиска и автоматизированного анализа эмоционального контекста текстов (позитивный или негативный эмоциональный окрас), однако они еще не до конца отработаны, поэтому нами не используются.

Этой особенностью разнородно окрашенной информации можно пренебречь в случае, когда мы не пытаемся выделить сообщество сторонников или противников, и нам просто интересны каналы распространения и скорость распространения информации, независимо от того, в позитивном или негативном ключе она распространяется и обсуждается, но и в этом случае желательно брать для исследования какиелибо четко очерченные мероприятия с характерными (а лучше — уникальными) названиями, не встречающимися в обыденной речи. В этом смысле темы «Зеленый weekend»/«Введение платности среднего образования»/«Законы о пропаганде гомосексуализма» достаточно простые, так позволяют найти набор ключевых слов и гиперссылок на ресурсы (также использующихся в качестве ключевых слов), практически не встречающихся в ином контексте, кроме интересующего исследователя.

АНАЛИЗ И ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ

Интерпретация результатов на этапе проверки релевантности перечня ключевых слов и словосочетаний с помощью поисковой формы «Живого журнала»

С учетом того, что поисковая форма ЖЖ располагает в начале выдачи самые релевантные результаты, а затем — по убыванию релевантности, и далее — практически нерелевантные нестрогие соответствия, нужно определить границы строго соответствия выдачи (на какой из страниц выдачи начинаются нестрогие соответствия), а затем в рамках этих границ оценить степень релевантности выдачи исследовательской задаче.

Предлагается оценить полностью 10 страниц из разных частей выдачи (в рамках строгого соответствия ключевым словам). В случае, если количество страниц со строгим соответствием ключевому слову меньше 10, соответственно оцениваются все имеющиеся страницы, а если таких страниц больше 10, для оценки выбираются равномерно распределенные по выдаче 10 страниц с некоторым шагом (например, при количестве 20

88

89