Дипломная работа: Факторы либерализации антинаркотической политики (на примере США)

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Вторая модель повторно подтверждает выводы относительно зависимости либерализации и типа законодательства и урбанизированного населения, но при этом, исключая одну переменную, объяснительный потенциал модели сокращается до 63% (56%) В то время как третья модель демонстрирует значимость у новых переменных: состав легислатуры, партийная принадлежность губернатора и распространение образования. Обратная связь переменной законодательного органа сигнализирует, что штаты, в легислатуре которого превалирует демократическая партия, более склонны к либерализации. Но одновременно с этим, прямая связь партийной аффилиация губернатора можно интерпретировать следующим образом: республиканские губернаторы ратуют за либерализацию в области наркотической политики. Данный конфликт может быть объяснён как ограничения исследования, так и стратегическим поведением губернатора на фоне электоральных циклов. Переменная, измеряющая образование, является значимой в моделях 4-5 и имеет прямую связь с зависимой, следовательно, чем больше показатель высшего образования в штате, тем вероятнее либерализация.

Резюмируя, МНК анализ продемонстрировал несколько значимых переменных, которые связаны с либерализацией: прогрессивность законодательства, принадлежность к региону, экономическое развитие и наличие либеральной инициативы в области наркотиков. Данные выводы частично подтверждают выведенные гипотезы, но, возможно, проблема заключена в построенных моделях, более того, метод линейной регрессии может быть не самым оптимальным для порядковой зависимой переменной.

3.3.3 Логистические регрессии

Можно было бы считать данное эмпирическое исследование законченным, но после более тщательного ознакомления с литературой Winship, C., Mare, R.D. Regression Models with Ordinal Variables // American Sociological Review. 1984. Vol. 49. № 4. P. 512; Will the results of an ordinal logit model be different from OLS regression, with discrete dependent variables? [Electronic source]. URL: https://www.researchgate.net/post/Will_the_results_of_an_ordinal_logit_model_be_different_from_OLS_regression_with_discrete_dependent_variables (Retrieved: 04.05.2019). было выявлено, что для категориальной зависимой переменной лучше использовать регрессию другого вида - логистическую. Блок с линейной регрессией был оставлен, поскольку мнения относительно оптимальности метода разнятся, и существует позиция, что МНК метод можно использовать и для категориальных переменных, более того, проведение двух регрессий позволяет сопоставить полученные результаты, тем самым внести вклад в существующую дискуссию. В данном блоке будет представлено три вида логистических моделей: первая - логистическая регрессия для дихотомической зависимой переменной; вторая - порядковая, и в заключение блока - полиноминальная, которая может быть чрезмерной, но была использована из-за непрохождения моделью теста параллельности линий.

Прежде чем перейти к результатам регрессионного анализа, необходимо провести и прокомментировать технические анализы логистического метода, которые позволяют определить достоверность выходных данных. Поскольку нулевой блок не предоставляет интереса, поскольку содержит информацию о модели без независимых переменных, будут представлены результаты тестов (Таблицы 4-7) для модели 6 (Таблица 8) из первого блока.

Табл. 4

Универсальные критерии коэффициентов модели

Хи-квадрат

ст.св.

Знач.

Шаг 1

Шаг

42,583

7

,000

Блок

42,583

7

,000

Модель

42,583

7

,000

Поскольку независимые переменные использовались в модели при помощи метода одновременного «введения», то показатели в Таблице 4 у всех строк одинаковые. В целом, данная Таблица демонстрирует, насколько значимо введение независимых переменных относительно модели без предикторов. Поскольку тест Хи-квадрата статистически значимый, то можно сказать, что данная модель превосходит по значимости «пустую» модель - модель, содержащую только константу без предикторов.

Табл. 5

Сводка для модели

Шаг

-2 Log-правдоподобие

R-квадрат Кокса и Снелла

R-квадрат Нэйджелкерка

1

7,898

,566

,901

В Таблице 5 представлены значения, аналогичные R-квадрату в линейных регрессиях, в частности, максимально приближенным показателем по смыслу является R-квадрат Нэйджелкерка, который демонстрирует, что модель 6 может предсказать 90% случаев.

Табл. 6

Проверка согласия Хосмера-Лемешева

Шаг

Хи-квадрат

ст.св.

Знач.

1

1,030

8

,998

В отличие от теста Хи-квадрата, в ходе которого необходимо получить p-значение ниже порогового для отказа от нулевой гипотезы, то в случае теста Хосмера-Лемешева диаметрально противоположенная ситуация. Если значение превышает пороговое, то в таком случае, модель лучше подходит для описания кейса.

Табл. 7

Таблица классификации (Значение отсечения -,500)

Наблюденные

Предсказанные

lib

Процент правильных

prohib

legal

Шаг 1

lib

prohib

40

1

97,6

legal

1

9

90,0

Общая процентная доля

96,1

Поскольку логистические регрессии используются для прогнозирования исходов, то в данной модели представлено количество правильно предсказанных исходов (accuracy). То есть, если рассматривать матрицу два-на-два (confusion matrix - выделена полужирным), то можно видеть, что в модели был обнаружен 41 случай запрета на марихуану, и 40 из них было правильно предсказано моделью (ячейка prohib-prohib), что выражается в 97.6% правильности. В случае легализации, изначально было 10 случаев легализации, и 9 из них было предсказано моделью - 90% (ячейка legal-legal). Общая предсказательная способность модели 6 находится на уровне 96%, то есть, наша модель может объяснить как случаи легализации, так и случаи запрета.

Табл. 8

Регрессионные выдачи для бинарных логистических моделей 6-8

М6

М7

М8

Шаг 1a

educ_pc

-

20,815

(,449)

41,008

(,027)

exp_JS_pc

-

5,589

(,175)

6,247

(,047)

leg_comp_sum

-

,035

(,593)

-,058

(,190)

ur_pop

-,316

(,049)

-,216

(,019)

-,059

(,097)

GSP_per_cap

,000

(,117)

,000

(,953)

,000

(,482)

values

,809

(,056)

,455

(,014)

-

StateCollectionsperCapita

-,002

(,285)

-

-

subregion_text

(,703)

-

-

subregion_text(1)

-20,919

(,998)

-

-

subregion_text(2)

-2,787

(,235)

-

-

subregion_text(3)

-20,176

(,998)

-

-

Константа

-1,967

(,695)

-5,578

(,293)

-9,661

(,004)

R-квадрат Нэйджелкерка

,901

,742

,456

-2 Log-правдоподобие

7,898

18,446

33,264

Непосредственно сами результаты регрессии представлены в Таблице 8. На основании бэта-коэффициентов можно сделать вывод о шансе попадания (речь идёт о logit/ logodds, поскольку в Таблице 8 не представлены Exp(B), на основании которых можно было бы говорить о непосредственных шансах (odds), но данный нюанс никак не сказывается на интерпретации) в группе штатов, которые легализуют марихуану. Например, переменная процента населения, проживающего в урбанизированных районах, чем она ниже, тем выше вероятность легализации марихуаны в штате. Другая же значимая переменная на уровне 0,05 - тип законодательства, иллюстрирует, что чем выше инклюзивность законодательства, тем выше шанс легализации. Остальные переменные в модели 6 статистически не значимы. Модель 7, в свою очередь, лишилась части переменных, но при этом продолжает отмечать значимость не урбанизированного населения и прогрессивного законодательства. Но при удалении «ценностей» значимость обретают распространение образования и расходы на систему правосудия. Имея прямую связь с легализацией, обе переменные означают следующее: чем выше расходы штата на полицию, суды и тюрьмы, и чем больше распространено высшее образование, тем выше вероятность легализации. Закономерным является тот факт, что при исключении переменных условный объяснительный потенциал понижается с 0,901 в шестой модели до 0,456 в восьмой. Стоит отметить, что результаты логистической регрессии не противоречат выводам линейной регрессии, несмотря на тот факт, что часть переменных, которые имели статистическую значимость в линейной регрессии, потеряли её в логистической. Говоря о гипотезах, то относительно линейной модели, выдача Таблицы 8 позволяет оценить меньшее количество предположений: в данной Таблице в очередной раз опровергается гипотеза Н5.2, что одновременно подтверждает работоспособность линейной модели, но вместе с тем заставляет задуматься, чем объясняется связь между легализацией и сельским населением. Три гипотезы повторно подтвердились: Н3 - чем прогрессивнее законодательство, тем выше шанс легализации; Н5.1 - чем больше доля населения с высшим образованием, тем вероятнее легализация; и Н9 - расходы имеют прямую связь с легализацией, чем выше издержки поддержания запрета, тем выше шанс легализации.

Дальнейшее повествование строится по тематическому принципу, прежде чем строить итоговую общую модель, определяющую значимые факторы либерализации, будут построены промежуточные экономические, политические и социальные модели. Поскольку переменная либерализации не дихотомическая, будет использована порядковая логистическая модель - в данном случае могла бы подойти полиноминальная, но из-за кодирования зависимой переменной имеется один уровень, который состоит из одного случая и регрессионную выдачу которого нельзя корректно трактовать, несмотря на это, полиноминальная логистическая регрессия будет использована в качестве заключительной, причина для этого будет описана ниже. Технические тесты для порядковой регрессии будут проведены для каждой модели без исключений (Приложение 4-5), но описание (Таблица 9-12) будет представлено только для экономической (Таблица 13).

Табл. 9

Сводный отчет по наблюдениям

N

Маргинальный процент

dv

Prohib

14

27,5%

2

15

29,4%

3

12

23,5%

4

1

2,0%

Full leg

9

17,6%

Допустимо

51

100,0%

Пропущенные

1048373

Всего

1048424

Таблица 9 содержит информация о выборке наблюдений, как упоминалось ранее, зависимая переменная находится в диапазоне [1-5], только крайние значения заменены на Prohib и Full leg соответственно. Здесь наглядно изображено, что категория 4 содержит в себе одно наблюдение. Пропущенные значения - пустые ячейки в таблице.

Табл. 10

Информация подгонки модели (Функция связи: Логит.)

Модель

-2 Log-правдоподобие

Хи-квадрат

ст.св.

Знач.

Только свободный член

146,723

Окончательная

124,137

22,586

7

,002

Таблица 10 отображает результат Хи-квадрата - значение p (0,002) позволяет утверждать, что введённые независимые переменные в модели 9 имеют лучший объяснительный потенциал, чем модель без переменных.

Табл. 11

Критерий согласия (Функция связи: Логит.)

Хи-квадрат

ст.св.

Знач.

Пирсона

185,141

193

,645

Отклонение

124,137

193

1,000

Данные критерии согласия содержательно схожи с интерпретацией теста Хосмера-Лемешева, при p-значении больше порогового, модель лучше подходит для объяснения.

Табл. 12

Псевдо R-квадрат (Функция связи: Логит.)

Кокса и Снелла

,358

Нэйджелкерк

,379

McFadden

,154

Как и в бинарной логистической регрессии, данные значения (Таблица 12) условно можно трактовать как R-квадрат для линейной, поэтому они будут размещены в нижних строчках каждой регрессионной выдачи.