страниц строгого соответствия, оценивается каждая вторая страница, при количестве 30 страниц строгого соответствия, оценивается каждая третья страница и т.п.). При рассмотрении выдачи 10 отобранных для оценки страниц анализируется соответствие содержания найденных постов заданной теме исследования. Часто для оценки даже не приходится открывать сообщение полностью, так как приведенный в выдаче кусок текста дает возможность оценить контекст употребления ключевого слова, однако в неясных случаях и при сомнении необходимо открывать само сообщение. Если сообщение соответствуют заданной нами теме, мы считаем его релевантным, если не соответствует, то считаем нерелевантным. В итоге мы должны получить статистические данные, содержащие информацию о том, сколько постов попало в проверяемую совокупность (при строгом соответствии заданному ключевому словосочетанию), сколько постов было проанализировано на 10 отобранных для оценки страницах выдачи, сколько постов из них было релевантных, сколько — нерелевантных. Эта статистика приводится в отчете, где также описывается характер и примеры нерелевантных сообщений.
Результаты оценки релевантности ключевых слов/словосочетаний
№ |
Проверяемое |
Общее |
Количество |
Количест- |
Относи- |
Остав- |
|
ключевое слово/ |
количество |
постов на 10 |
во |
тельное |
лено в |
|
словосочетание |
найденных |
отобранных |
нерелева- |
кол-во |
списке |
|
|
поиском ЖЖ |
для оценки |
лентных |
нерелева- |
ключе- |
|
|
постов, |
страницах |
постов, |
лентных |
вых слов |
|
|
содержащих |
выдачи, шт. |
шт. |
постов*, % |
(да/ нет) |
|
|
проверяемые |
|
|
|
|
|
|
слова, шт. |
|
|
|
|
1 |
Ключевое слово 1 |
|
|
|
|
|
2 |
Ключевое слово 2 |
|
|
|
|
|
.. |
… |
|
|
|
|
|
* Рассчитывается как отношение количества нерелевантных сообщений к количеству оцениваемых постов, умноженное на 100
В конце отчета отдельно приводится список прошедших проверку (одобренных) ключевых слов и словосочетаний.
Интерпретация результатов на этапе проверки релевантности перечня ключевых слов и словосочетаний с помощью страницы краулинга веб-центра «Социодинамика» по накопленной базе данных веб-центра
Дополнительная верификация подобранных словосочетаний проводится с помощью краулинга и накопленной базы данных веб-центра «Социодинамика». Используется страница краулинга http://socio.escience.ifmo.ru/crawler/ и свободно распространяемое
программное обеспечение Notepad++, доступное для скачивания по адресу http://notepad-plus-plus.org/download/v6.2.3.html.
На странице краулинга проверяемое ключевое слово вводится в окно краулинга, выбирается соответствующая теме база данных («Зеленый weekend» — greenweekend, « Введение платности среднего образования» — law_83, «Законы о пропаганде гомосексуализма» — homosexuality).
После проведения тестового краулинга по накопленной базе данных веб-центра результаты краулинга сохраняются на компьютер пользователя в соответствии с тем, как это описано в видеоуроках (электронных тьюторах). Результат работы краулинга с названием файла вида «output.documents» необходимо открыть в предварительно скачанной и установленной свободно распространяемой программе Notepad++, либо в другой программе-блокноте. В файле «output.documents» есть ссылки на все найденные сообщения с их датами, можно скопировать в браузер ссылку на конкретное сообщение и увидеть само сообщение. Рекомендуется равномерно распределить проверяемую выборку сообщений по совокупности найденных документов, т.е. брать, сообщения с некоторым шагом (каждое пятое, каждое десятое и т.п.). Рекомендуется проанализировать содержание 50—100 постов.
Если проверяемое сообщение соответствует заданной нами теме, мы считаем его релевантным, если не соответствует — нерелевантным. В итоге мы должны получить статистические данные, содержащие информацию о том, сколько постов попало в проверяемую совокупность, сколько было проанализировано, сколько постов из проверенных было релевантных, сколько — нерелевантных.
Эта статистика приводится в отчете, где также описывается характер и примеры нерелевантных сообщений. Интерпретируется как процент релевантности выдачи, так и степень отклонения от темы сообщений, признанных нерелевантными (в каких-то случаях это могут быть сообщения по схожей теме, что полбеды, но в каких-то случаях будут попадать посты из абсолютно других тем, что говорит об уязвимости выбора анализируемого ключевого слова/словосочетания и, возможно, необходимости его выбраковки).
В отчете помечается, прошло ли каждое из ключевых словосочетаний проверку, либо было отбраковано по результатам проверки.
Отчет о работе должен включать в себя следующие компоненты:
1) перечень проверенных ключевых слов для отбора совокупности исследуемых текстов для тем «Зеленый weekend»/«Введение платности среднего образования»/«Законы о пропаганде гомосексуализма», перечень отбракованных ключевых слов/словосочетаний. В случае
90 |
91 |
самостоятельного выполнения лабораторной работы для самопроверки можно использовать перечни проверенных ключевых слов по данным темам по ссылке;
2) описание выполнения работы с интерпретацией результатов лабораторного исследования.
Рекомендуемая структура отчета о выполнении лабораторной работы
Введение. Краткая аннотация введения к данной лабораторной работе, ее цели и задачи.
Проверка релевантности перечня ключевых слов и словосочетаний с помощью поисковой формы «Живого журнала». Данный раздел должен содержать результаты проверки релевантности перечня ключевых слов и словосочетаний с помощью поисковой формы «Живого журнала», как это было описано выше, а также интерпретацию произведенных проверочных действий. В конце раздела приводится итоговый список прошедших проверку слов и словосочетаний, а также список выбракованных слов и словосочетаний.
Проверка релевантности перечня ключевых слов и словосочетаний
с помощью страницы краулинга веб-центра «Социодинамика» по накопленной базе данных веб-центра. Данный раздел должен содержать результаты проверки релевантности перечня ключевых слов и словосочетаний с помощью с помощью страницы краулинга веб-центра «Социодинамика» по накопленной базе данных веб-центра, как это было описано выше, а также интерпретацию произведенных проверочных действий. В конце раздела приводится итоговый список прошедших проверку слов и словосочетаний, а также (при наличии) список выбракованных слов и словосочетаний.
Заключение. Должно содержать основные выводы лабораторного исследования в соответствии с целями и задачами, обозначенными во введении.
Список использованных источников. Должен включать библиографическое описание источников, использованных при написании отчета по лабораторной работе.
РЕКОМЕНДУЕМЫЕ ИСТОЧНИКИ
Аверьянов Л.Я. Контент-анализ. М.: Кнорус, 2009. 451 с.
Мангейм Дж.Б., Рич Р.К. Политология: Методы исследования. М.: Весь мир, 1997. 544 с.
Таршис Е.Я. Перспективы развития метода контент-анализа // Социология: 4М. 2002. №15.
Stritjbos J.W., Martens R.L., Prins F.J., Jochems W.M. Content analysis: What are they talking about//Computers & Education. Vol. 46. Is. 1. 2006. P.29
— 48. URL: http://www.sciencedirect.com/science/article/ pii/S0360131505000540.
КОНТРОЛЬНЫЕ ВОПРОСЫ
1.Что является целью исследования?
2.Какова методика исследования?
3.Какие программные продукты и пакеты используются при выполнении данной лабораторной работы?
4.Что является результатом выполнения лабораторной работы?
5.Что такое контент-анализ?
6.Какие этапы включает в себя исследование по методике контентанализа?
7.Перечислите основные рекомендации к формированию перечня ключевых слов.
92 |
93 |
Лабораторная работа 2.
Анализ размера и сетевых параметров сообщества. Построение социограммы сетевого сообщества
ВВЕДЕНИЕ
Объектом исследования является структура связей дружбы/подписки в неформальных сообществах социальных сетей. Значимость их исследования обусловлена как исследовательским интересом к размеру, структуре и сетевым параметрам различных неформальных групп по различным тематикам, их сплоченности/разрозненности, так и прикладными выводами о способах работы и наиболее эффективных способах воздействия на исследуемые неформальные сообщества.
Целью исследования является выявление «лидеров мнений» в сообществах обсуждения по различным темам.
Методика исследования заключается в рассмотрении неформальных сообществ пользователей «Живого журнала», проявляющих интерес к тематике обсуждений «введения платности среднего образования» и «законов о пропаганде гомосексуализма». Данные неформальные сообщества представлены в виде совокупности сообщений пользователей и информации о сообщениях и пользователях-авторах, разместивших в течение апреля— июня 2012 г. (период проведения пилостного сбора информации) сообщений по этой теме (характеризуемой набором ключевых слов) во фрагменте социальной сети.
Сценарий исследования использует основанный на ключевых словах краулинг информации по предварительно собранной в web-центре «Социодинамика» базе данных сообщений и связей подписки в социальной сети. После обработки результатов краулинга пользователь получает данные о размере и параметрах сетей исследуемых неформальных сообществ, а также визуализированный граф (социограмму) неформального сообщества.
Информационная база лабораторной работы: собранная база web-
центра «Социодинамика» по темам «Пропаганда гомосексуализма», «Зеленый weekend», «Введение платности среднего образования» (апрель— июнь 2012 г.).
Результат выполнения работы:
−анализ размера и основных параметров сетей неформального сообщества по темам «Зеленый weekend», «Введение платности среднего образования» и «Законы о пропаганде гомосексуализма», выводы об их разрозненности/сплоченности, плотности связей в сообществах;
−иллюстрация сетевых процессов взаимосвязи членов неформальных сообществ и визуальный анализ социограммы сообществ в сравнении с социограммами других сообществ.
ОСНОВНЫЕ СВЕДЕНИЯ ТЕОРИИ
В данной лабораторной работе рассматриваются понятия неформального сообщества и особенностей его структуры, выражаемой как визуально в виде социограммы неформального сообщества, так и в ряде параметров сетевого сообщества, таких как общее число вершин, плотность сети, средняя степень вершины.
Неформальное сообщество — это социальная общность, формирующаяся на основе межличностных отношений и не имеющая официально утвержденного статуса.
В литературе также встречаются термины «официальное» и «неофициальное» сообщество. Неформальное сообщество может функционировать как само по себе (группы по интересам, неформальные молодежные объединения), так и в рамках формальной группы (например, трудового коллектива), образуя свою внутреннюю структуру связей внутри формальной группы, не совпадающую с формальной структурой.
Характерной чертой неформального сообщества является его самоорганизация. При этом некоторые неформальные сообщества могут в дальнейшем приобрести официальный статус (общественная организация и т.д.). В современном мире, пронизанном влиянием информационных технологий, неформальные сообщества образуются как в реальной, так и в виртуальной среде. Исследование виртуальных социальных сетей методом краулинга страниц пользователей и их сообщений по заданным ключевым словам позволяет обнаружить существование неформальных сообществ, объединенных сферой интересов и взаимными связями дружбы/подписки.
Одним из основных исследовательских методов исследования взаимоотношений в неформальных сообществах является социометрия. Социометрия — это раздел в социологии, посвященный изучению межличностных взаимодействий. Теоретическое и идеологическое обоснование социометрии как метода познания и измерения социальных явлений дал Я.(Дж) Л. Морено76. Традиционно предметную область социометрии составляли эмоциональные отношения людей в группах (симпатии, неприязнь, безразличие). По Морено эмоциональные отношения людей в группах представляют атомистическую структуру общества, которая недоступна простому наблюдению и может быть
76 Морено Я.Л. Социометрия: Экспериментальный метод и наука об обществе / Пер. с англ. А. Боковикова, под научной ред. Р.А. Золотовицкого. М.: Академический Проект. - 2001 г.
94 |
95 |
вскрыта только с помощью социальной микроскопии. «Микросоциология,
— писал Морено, — фактически возникла с появлением моей теории «социальной микроскопии».
Одними из основных инструментов социометрии является построение социограммы сообщества и вычисление его сетевых параметров, таких, например, как общее число вершин, плотность сети, средняя степень вершины.
Социограмма — способ представления, межличностных и межгрупповых отношений (симпатий/антипатий) в виде системы связей (графа) между индивидами или социальными группами.
Социограммы бывают двух типов: групповые и индивидуальные: первые изображают картину взаимоотношений в группе в целом, вторые
— систему отношений, существующих у интересующего исследователя индивида с остальными членами его группы.
Групповые социограммы, в свою очередь, могут быть представлены в
виде
−конвенциональной социограммы — индивиды, составляющие группу, изображаются в виде кружочков, соединенных между собой стрелками, символизирующими социометрические выборы или отклонения;
−«социограммы-мишени» — представляет собой систему концентрических окружностей, количество которых равно максимальному количеству выборов, полученных в группе (все члены группы располагаются на окружностях в соответствии с количеством полученных выборов; вся социограмма-мишень делится на секторы по социально-демографическим характеристикам группы
— пол, возраст и т.п.).
Индивидуальные социограммы применяют для более наглядного представления о положении отдельных лиц в группе, на которых изображают индивида в совокупности всех его связей с другими членами группы.
Другими важными показателями структуры сетевого сообщества являются такие его основные параметры, как общее число вершин, плотность сети, средняя степень вершины.
Общее число вершин отражает количество членов сообщества.
Плотность сети — это отношение числа имеющихся в сообществе связей к максимально возможному (в социометрической матрице аналогом данного показателя является «сплоченность»). Плотность сети представлена числовыми значениями от 0 до 1, где значение «1»
соответствует ситуации, когда каждый из членов сообщества связан со всеми другими членами сообщества, а ноль — когда совокупность состоит из одиночек, не связанных между собой.
Средняя степень вершины отражает среднее количество связей подписки между членами сообщества. Средняя степень вершины отражает среднее количество друзей (внутри сообщества) у членов сообщества. Соответственно, чем выше этот показатель, тем более активно члены сообщества общаются друг с другом.
АНАЛИЗ И ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ
Интерпретация результатов выполнения сценария на этапе завершения работы пакета Pajek
При анализе основных параметров, рассчитываемых в результате работы свободно распространяемого программного обеспечения Pajek, мы должны проанализировать значения этих параметров в качестве показателей размера, а также плотности/разрозненности сообщества, а именно — предложить интерпретацию значений
−общего количества вершин сети сообщества;
−плотности сети сообщества;
−средней степени вершины.
Врезультате работы СПО Pajek должен быть получен результирующий файл, содержащий
−общее количество вершин сети сообщества (Number of vertices);
−плотность сети сообщества (Density);
−среднюю степень вершины (Average Degree).
Полученные данные дают нам основную информацию о сообществе: количество вовлеченных в обсуждение авторов ЖЖ (показатель «общее количество вершин» сети сообщества). Среднее количество подписчиков авторов сообщества (показатель «средняя степень вершины»), цифровое отражение плотности связей авторов сообщества (показатель «плотность сети сообщества»). Большая плотность сети сообщества по сравнению с показателями других сообществ говорит о более сплоченном сообществе.
Сравнение показателей по всем трем темам обсуждения дает возможность сопоставить их между собой по размеру сообществ, популярности вовлеченных в обсуждение авторов, степени внутренней сплоченности сообществ.
96 |
97 |
Интерпретация результатов выполнения сценария на этапе завершения работы пакета i-Graph
В результате построения социограммы (визуализации связей между участниками) неформального сообщества обсуждения темы «Пропаганда гомосексуализма» с помощью пакета СПО i-Graph при заданных ключевых словах должен быть получен графический файл следующего вида (см. рис.)
Социограмма неформального сообщества обсуждения темы «Пропаганда гомосексуализма». Результат работы пакета СПО igraph.
Кружки обозначают членов неформального сообщества темы обсуждения «Пропаганда гомосексуализма» в «Живом журнале», а линии
— связи подписки между ними. Соответственно одиночные кружки обозначают пользователей, не связанных подпиской с другими членами сообщества обсуждения темы, а кружки, находящиеся в самом центре круга, на пересечении связей — наиболее популярных членов сообщества, имеющих максимальное число связей с другими членами сообщества. Кроме того, диаметр круга зависит от количества связей члена неформального сообщества с другими членами сообщества, т.е. круги с большим диаметром обозначают пользователей, имеющих наибольшее число подписчиков среди членов неформального сообщества.
После получения результатов по всем трем темам необходимо сравнить социограммы трех сетей: «Пропаганда гомосексуализма», «Зеленый weekend» и «Введение платности среднего образования».
Можно анализировать как размер неформального сообщества (по количеству кругов), так и тесноту связей между ними и наличие лидеров мнений в сообществе (количество кругов с большим диаметром, частоту линий). Эта визуализированная информация коррелирует со значениями «плотность сети сообщества», полученными на этапе завершения работы пакета Pajek.
Сравнение социограмм по всем трем темам дает возможность сопоставить их между собой: какие сообщества из рассмотренных — более сплоченные по сравнению с другими сообществами, какие — более разрозненные; где больше лидеров мнений, где — меньше; в каком сообществе лидеры мнений более «весомые» (диаметр круга больше) или, наоборот, имеют не особенно большое влияние (небольшой диаметр даже самых больших кругов).
Отчет о работе должен включать в себя следующие компоненты:
−файлы результатов работы цепочки задач (Workflow) «Построение социограммы неформального сообщества» на примере тем обсуждения: «Пропаганда гомосексуализма», «Зеленый weekend» и «Введение платности среднего образования»;
−описание выполнения работы с интерпретацией результатов лабораторного исследования.
Рекомендуемая структура отчета о выполнении лабораторной работы
Введение. Краткая аннотация введения к данной лабораторной работе, ее цели и задачи.
Основные параметры сетей неформальных сообществ обсуждения тем «Пропаганда гомосексуализма», «Зеленый weekend» и «Введение платности среднего образования» в «Живом журнале». Данный раздел должен содержать результаты работы пакета Pajek, а также интерпретацию основных параметров сети неформального сообщества (см. подробнее
раздел «Основные сведения теории» данной лабораторной работы).
Описание и интепретация социограмм неформальных сообществ
обсуждения тем «Пропаганда гомосексуализма», «Зеленый weekend» и «Введение платности среднего образования». Данный раздел должен содержать результаты работы пакета Jung в виде скопированного графического файла визуализации социограммы неформальных сообществ, а также их интерпретацию, как это было описано выше.
98 |
99 |