Необходимо также построить модели с фиксированными и случайными эффектами, поскольку появляется необходимотсь учитывать индивидуальные особенности объектов.
Таблица 7 иллюстрирует модель с фиксированными эффектами. Sigma_u - стандартная ошибка для индивидуальных эффектов u, sigma_e -
стандартная ошибка для е (остатков). Для состоятельности МНК-оценок модели с фиксированными индивидуальными эффектами требуется только некоррелированность е и X . Корреляция между X и u допустима. Это - проявление гибкости модели. В данном случае
Таблица 7
Результаты оценки модели с фиксированными эффектами
|
corr(u_i, Xb) =-0.0716 |
||||||
|
Costs_E |
Коэф. |
Ст. Ошибка |
P>t |
[95% Дов. Интервал] |
||
|
lnCr_ind |
-0.1000408 |
0.0473386 |
0.036 |
-0.1936497 |
-.0064319 |
|
|
lnCr_org |
0.0313035 |
0.0362156 |
0.389 |
-0.0403104 |
0.1029175 |
|
|
lnEquity |
0.1241565 |
0.0775989 |
0.112 |
-0.0292899 |
0.2776029 |
|
|
Secur_E |
0.5866144 |
0.5076784 |
0.250 |
-0.4172846 |
1.590513 |
|
|
H3 |
0.1642867 |
0.0538857 |
0.003 |
0.0577315 |
0.2708419 |
|
|
Block |
-8.213097 |
1.652854 |
0.000 |
-11.4815 |
-4.944693 |
|
|
Block_lnE |
0.42253 |
0.089934 |
0.000 |
0.2446918 |
0.6003682 |
|
|
_cons |
-2.367977 |
0.5473399 |
0.000 |
-3.450304 |
-1.28565 |
|
|
sigma_u |
0.14037819 |
|||||
|
sigma_e |
0.64263483 |
В таблице 8 приведена модель со случайными эффектами. Ее можно рассматривать как компромисс между сквозной регрессией, которая накладывает сильное ограничение гомогенности на все коэффициенты уравнения, и регрессией с фиксированными эффектами, которая вводит для каждого объекта выборки свою константу и, следовательно, учитывает существующую в реальности, но ненаблюдаемую гетерогенность. При оценивании такой регрессии используется обобщенный метод наименьших квадратов (GLS), поскольку индивидуальная гетерогенность учитывается не в самом уравнении, а в матрице ковариаций. Равенство иллюстрирует гипотезу, лежащую в основе модели. Регрессоры не должны коррелировать с ненаблюдаемыми случайными эффектами. Иначе оценки модели будут несостоятельными.
Таблица 8
Результаты оценки модели со случайными эффектами
|
corr(u_i,X) = 0 |
||||||
|
Costs_E |
Коэф. |
Ст. Ошибка |
P>z |
[95% Дов. Интервал] |
||
|
lnCr_ind |
-0.1016919 |
0.0477238 |
0.033 |
-0.195229 |
-0.0081549 |
|
|
lnCr_org |
0.0238421 |
0.0363075 |
0.511 |
-0.0473192 |
0.0950035 |
|
|
lnEquity |
0.1341624 |
0.0780665 |
0.086 |
-0.0188451 |
0.2871699 |
|
|
Secur_E |
0.5098374 |
0.5100259 |
0.317 |
-0.489795 |
1.50947 |
|
|
H3 |
0.172794 |
0.0541134 |
0.001 |
0.0667338 |
0.2788543 |
|
|
Block |
-8.160968 |
1.666508 |
0.000 |
-11.42726 |
-4.894673 |
|
|
Block_lnE |
0.4239034 |
0.0906787 |
0.000 |
0.2461763 |
0.6016305 |
|
|
_cons |
-2.400453 |
0.5511596 |
0.000 |
-3.480706 |
-1.320201 |
|
|
sigma_u |
0 |
|||||
|
sigma_e |
0.64263483 |
Следующим этапом служит сравнение моделей с фиксированными и случайными эффектами и выбор наболее адекватной. Этот процессс может быть осуществлен с помощью тетса Хаусмана, нулевая гипотеза которой гласит, что индивидуальные эффекты могут быть случайными, то есть модель со случайными эффектами предпочтительнее. Таким образом, принимается нулевая гипотеза, в данном случае модель со случайными эффектами лучше (prob. = 0,6605). Вывод логичен, так как данные рандомизированные, то есть они выбирались случайным образом из большой генеральной совокупности элементов.
Так, в качестве лучшей на данном этапе была выбрана нелинейная модель с масштабированными переменными и случайными эффектами:
Наибольший интерес в данном исследовании представляет интерпретация дамми - переменной, отвечающей за использование технологии блокчейн. Если высчитать производную (эффект) по переменной Block, то выходит, что в среднем, при прочих равных изменение расходов банков, использующих технологию блокчейн, равно величине:
.
Как и предполагалось ранее, эффект внедрения технологии блокчейн может зависеть от величины собственного капитала. Другими словами, если значение собственного капитала достаточно велико, соответственно, банк является крупным, то эффект от внедрения технологии блокчейн сильнее повлияет на его расходы, тогда как более маленький банк может не ощутить существенной разницы от внедрения этой технологии. При подстановке значений логарифма собственного капитала по каждому наблюдению в полученную формулу можно сделать вывод, что эффект будет отрицательным. Следует учитывать, что значения издержек вошли в выборку с минусом, а значит интерпретация эффекта будет с обратным знаком. То есть, издержки у банков, которые применяют данную технологию, будут выше. Таким образом, гипотеза о сокращении издержек после внедрения технологии отвергается.
Однако в данных наблюдается сильная асимметрия между количеством 1 и 0 (банки с блокчейн и без соответственно). На данный момент лишь 8 банков используют рассматриваемую технологию в своей деятельности, а само внедрение произошло в конце 2016 года. Недостаточное количество единиц может привести к тому, что модель не будет их учитывать. То есть эффект будет одинаков как для фактических участников (банков с блокчейн), так и для не участников. Следовательно, банки, использующие блокчейн, будут рассмотрены, как обычные, и нельзя будет корректно оценить эффект от применения технологии.
Таким образом, при анализе результатов исследований необходимо использовать такой способ включения наблюдений в анализ, который мог бы обеспечить максимальную сопоставимость основной и референтной групп по имеющимся переменным. Одним из таких способов является метод «Propensity score matching» (PSM) - мэтчинг по индексу склонности/соответствия.
3.3 Мэтчинг по индексу склонности (propensity score matching)
Характерной чертой метода PSM является то, что он сводит широкий набор факторов каждого наблюдения к единому вариационному ряду значений PS. Алгоритм метода следующий:
1. Выбор переменных для дальнейшего анализа.
2. Расчет PS для каждого наблюдения.
3. Проверка баланса распределения значений PS и переменных между группами сравнения.
4. Подсчет мер эффекта воздействия.
5. Оценка эффективности устранения дисбаланса переменных после использования выбранного метода подбора пар или «взвешивания» (Гржибовский А. М., Иванов С. В., Горбатова М. А., 2016).
Значения PS рассчитываются при помощи логистической регрессии. В качестве переменной, отвечающей за отклик, является факт принадлежности к основной группе (находящейся под действием «лечения»). В литературе в качестве основной группы предлагают брать ту, в которую входит меньше наблюдений.
Это способствует расширению возможности подбора пар из группы сравнения к объектам основной группы. В настоящей работе в основную группу будут входить банки, которые используют технологию блокчейн. Таким образом, в качестве зависимой переменной теперь будет выступать дамми на блокчейн, а издержки банков будут представлять исход.
Существует несколько основных мер эффекта воздействия изучаемого фактора на исход:
1. ATT (average treatment effect for the treated) - средний эффект воздействия для тех, кто подвергся воздействию (объекты основной группы). Это эффект воздействия на те единицы, которые действительно получили выгоды от воздействия.
2. ATNT или ATC (average treatment effect for the non-treated/control group) - средний эффект воздействия, не подвергшихся воздействию объектов. Показывает, каким был бы средний эффект от программы для не участников, если бы они участвовали в программе.
3. ATE (average treatment effect) - средний эффект воздействия для случайного индивида из выборки (Гржибовский А. М., Иванов С. В., 2015).
Исходя из цели исследования, наибольший интерес представляет показатель ATT, поскольку необходимо понять, на сколько в среднем издержки банков с бокчейн отличаются от обычных банков.
Как и ранее, анализ будет проводится в статистическом программном пакете STATA. Для начала необходимо установить случайный порядок наблюдений, чтобы правильно рассчитать значения PS. Затем требуется произвести сам подсчет значений PS. Опция comsup в коде фиксирует зону «перекреста» значений PS между основной группой и группой сравнения («common support»).
В данном случае в зону «перекреста» попадает 99 значений из 147. Для оценки эффекта наиболее подходящими будут наблюдения, которые попадают в эту зону. Следовательно, чем больше таких объектов, тем лучше.
На рисунке 6 представлена двойная гистограмма распределения значений PS в основной и референтной группе. Видно, что различия в них существенны. Другими словами, существуют различия между группами по распределению переменных.
Рис. 6. Распределение значений PS в группе банков без блокчейн («Treated») и группе банков с блокчейн («Untreated»)
Также необходимо, чтобы был достигнут баланс значений PS и выбранных переменных между группой сравнение и основной группой в пределах каждого блока.
Балансировка PS проверяется при помощи сравнения средних значений PS в этих двух группах в пределах каждого блока: если статистических различий нет, то такой блок считается сбалансированным. В данном случае количество блоков сбалансировано и равно 4.
На следующем шаге требуется выбрать метод, который наиболее адекватно позволяет сбалансировать группы по переменным.
В качестве переменных были выбраны масштабированные кредиты физическим лицам, расходы/доходы по операциям с ценными бумагами и собственный капитал. Были отобраны именно эти переменные ввиду высокой коррелированности как с блокчейн, так и с исходом (издержками).
Вдобавок, учитывая эти переменные, можно достичь баланса. Сначала рассмотрим метод стратификации (субклассификации), используя блоки PS. Этот метод опирается на ранее сформированные блоки PS.
Применение данного метода позволяет рассчитать только значение ATT, причем методом бутстрэппинга. Количество повторов бутстрэппинга можно задавать вручную (в нашем случае 100 повторов).
Значение эффекта от внедрения технологии представлено в таблице 9 и имеет отрицательный знак, однако интерпретация будет противоположная. Таким образом, у банков с блокчейном (основная группа) в среднем издержки выше на (0.340 ±0.260) тыс. руб., чем у обычных банков без блокчейна.
Таблица 9
Результаты расчета ATT с помощью метода стратификации (субклассификации)
|
Кол-во набл. в осн. группе |
Кол-во набл. в контр. группе |
АТТ |
Ст. Ошибка |
|
|
15 |
84 |
-0.340 |
0.260 |
Также можно рассмотреть метод подбора пар 1:1 при помощи поиска «ближайшего соседа», соответствующего заданному отрезку PS.
Идея метода заключается в том, чтобы подобрать каждому наблюдению из основной группы «пару» из группы контроля путем выбора наиболее близкого значения PS.
Но прежде чем начать подбирать «пары» следует указать значение, которое будет обеспечивать адекватное соотнесение наблюдений из групп.
Стандартное отклонение логита PS составляет 1,144 (Приложение 3). Установлено, что отрезок, равный 0,2 от стандартного отклонения логита PS, является достаточным для обеспечения близкого соотнесения наблюдений основной группы и группы контроля. При перемножении этих двух чисел получается 0,229 (это число вписывается в команду).
Для удовлетворительного подбора пар, доля стандартизированного смещения должна быть менее 10 %.
В данном случае максимальное смещение составило минус 3,4%, что является удовлетворительным для проведения корректного анализа (Таблица 10, рис. 7).
Рис. 7. График проверки смещения переменных в основной группе и группе контроля 1:1
Таблица 10
Результаты проверки смещения переменных в основной группе и группе контроля 1:1
|
Переменные |
Без пары (U) Пара (M) |
Среднее |
%bias (смещение) |
%уменьшение смещения |
||
|
Осн. группа |
Контр. группа |
|||||
|
lnCr_ind |
U |
18.239 |
16.567 |
57.4 |
||
|
M |
18.24 |
18.352 |
-3.0 |
94.9 |
||
|
lnEquity |
U |
18.409 |
16.584 |
92.7 |
||
|
M |
18.421 |
18.457 |
-3.4 |
96.3 |
||
|
Secur_E |
U |
-0.03382 |
0.02659 |
-32.4 |
||
|
M |
0.02248 |
0.01851 |
-3.0 |
90.7 |