параметр, показывающий достиг ли объем собранных средств максимально возможного значения (Hard_cup, дамми-переменная);
количество человек в команде-разработчиков (Team);
наличие White Paper (White_Paper, дамми-переменная);
возможность вкладываться в ICO фиатными валютами (Fiat, дамми-переменная);
Ethereum (Eth, дамми-переменная);
Bitcoin (BTC, дамми-переменная);
общее количество криптовалют, которыми можно было вкладываться в ICO (n_curr);
наличие бонуса для инвесторов при вкладывании в ICO (bonus, дамми-переменная).
Полная выборка представлена в приложении 2.
1. Платформы для реализации ICO.
Основная масса компаний реализует свои ICO на базе платформы Ethereum, что связано с большим количеством существующих проектов на базе Ethereum, а также высокой гибкостью кода Ethereum для разработки новых финтех продуктов. Распределение по платформам показано на рисунке 6.
Минимальный порог средств показывает количество средств в долларах США, которое необходимо для запуска проекта. Данная переменная является целочисленной и находится в диапазоне от 55 000 до 100 000 000. В таблице 11 представлены основные характеристики данной переменной.
Таблица 11 -- Минимальный порог средств
Источник: составлено автором
Для построения регрессионной модели, в частности линейной, одним из необходимых условий является нормальность распределения данных. В данной работе будет использоваться два способа проверки данных на нормальность: графический (построение гистограммы) и формальный (тест Шапиро-Уилка). Результаты графического способа представлены на рисунке 7.
Рисунок 7 -- Гистограмма распределения значений минимального порога средств
Источник: составлено автором
Как видно из графика, распределение является отличным от нормального. Убедимся в верности данного вывода формальным способом с помощью теста Шапиро-Уилка (см. таблица 12):
H0: значения минимального порога средств распределены нормально
H1: распределение значений минимального порога средств отличается от нормального
Таблица 12 -- Результаты теста Шапиро-Уилка для значений минимального порога средств
Источник: составлено автором
Так как параметр «Prob>z» меньше стандартных уровней значимости (0,01; 0,05 и 0,1), то мы отклоняем нулевую гипотезу о нормальности выборки и принимаем противоположную.
Для того чтобы попытаться нормировать данные, их необходимо логарифмировать. Построим гистограмму логарифмированных данных, результаты которых представлены на рисунке 8.
Рисунок 8 -- Гистограмма распределения логарифмов значений минимального порога средств
Источник: составлено автором
Графически данное распределение стало больше похоже на нормальное, но необходимо подтвердить данную гипотезу тестом Шапиро-Уилка (см. таблица 13):
Н0: логарифмы значений минимального порога средств распределены нормально
H1: распределение логарифмов значений минимального порога средств отличается от нормального
Таблица 13 -- Результаты теста Шапиро-Уилка для логарифмов значений минимального порога средств
Источник: составлено автором
Результаты данного теста не позволяют принять нулевую гипотезу о нормальности распределения выборки, в связи с чем принимается противоположная. Однако небольшое приближение к нормальности имеется, поэтому для дальнейшего регрессивного анализа необходимо составить логарифмы значений.
3. Фактический объем собранных средств (Collected)
Данная переменная показывает объем средств, который удалось привлечь компании для ICO, причем объем средств может быть как больше минимального порога средств, так и меньше. Основные характеристики данной переменной представлены в таблице 14.
Таблица 14 -- Фактически собранный объем средств
Источник: составлено автором
Данную выборку также необходимо графически и формально проверить на нормальность. Построенная гистограмма распределения значений фактически собранного объема средств представлена на рисунке 9.
Рисунок 9 -- Гистограмма распределения значений фактически собранного объема средств
Источник: составлено автором
Результаты построения указывают на распределение, отличное от нормального. Убедимся в этом формально (см. таблица 15):
H0: значения фактически собранного объема средств распределены нормально
H1: распределение значений фактически собранного объема средств отличается от нормального
Таблица 15 -- Результаты теста Шапиро-Уилка для значений фактически собранного объема средств
Источник: составлено автором
Результаты теста указывают на отказ от нулевой гипотезы и принятие противоположной о распределении данных, отличным от нормального.
Для нормализации данных прологарифмируем их и также построим гистограмму и проведем тест Шапиро-Уилка (см. рисунок 10).
Рисунок 10 -- Гистограмма распределения логарифмов значений фактически собранного объема средств
Источник: составлено автором
Результаты графического анализа указывает на нормализацию распределения данных. Подтвердим данный вывод формально (см. таблица 16):
Н0: логарифмы значений фактически собранного объема средств распределены нормально
H1: распределение логарифмов значений фактически собранного объема средств отличается от нормального
Таблица 16 -- Результаты теста Шапиро--Уилка для логарифмов значений фактически собранного объема средств
Источник: составлено автором
Значение параметра Prob>z указывает на то, что даже на уровне значимости в 0,1 мы не можем отклонить нулевую гипотезу о нормальности распределения данных, в связи с чем в дальнейшем эконометрическом анализе будут использоваться логарифмы значений фактически собранного объема средств.
4. Отличие фактического объема собранных средств от необходимого минимального порога (Success)
Данная переменная показывает, насколько фактически объем собранных средств отличается от минимального порога. Отрицательное значение указывает на то, что фактически собранного объема средств не хватает для преодоления минимального порога. Основные характеристики выборки представлены в таблице 17.
Таблица 17 -- Характеристики переменной Success
Источник: составлено автором
Так как данная переменная также является количественной, необходимо проверить распределение ее значений на нормальность. Гистограмма распределения значений представлена на рисунке 11.
Рисунок 11 -- Гистограмма распределения значений переменной Success
Источник: составлено автором
Данная гистограмма указывает на распределение, отличное от нормального. Подтвердим это формально с помощью теста Шапиро-Уилка (см. таблица 18):
H0: значения переменной Success распределены нормально
H1: распределение значений переменной Success отличается от нормального
Таблица 18 -- Результаты теста Шапиро-Уилка для значений переменной Success
Источник: составлено автором
Результаты теста подтверждают предположения о распределении значений переменной Success, отличного от нормального.
Прологарифмируем значения переменной Success и построим на основе их диаграмму (см. рисунок 12).
Рисунок 12 -- Гистограмма распределения логарифмов значений переменной Success
Источник: составлено автором
Распределение немного стало больше похоже на нормальное, но далеко от него, в чем можно убедиться с помощью формального теста (см. таблица 19).
Н0: логарифмы переменной Success распределены нормально
H1: распределение логарифмов значений переменной Success отличается от нормального
Таблица 19 -- Результаты теста Шапиро-Уилка для логарифмов значений переменной Success
Источник: составлено автором
Даже в результате логарифмирования значений переменной Success распределение не стало более похоже на нормальное. Учитывая, что данная переменная измеряется в процентах, то лучше будет оставить ее линейный вид.
5. Факт достижения максимального объема средств
Данный параметр представляет собой дамми-переменную, где 1 - это достижение потолка объема средств, собираемых для ICO, а 0 - его недостижение. Количественное распределение значений представлено на рисунке 13.
6. Численность команды разработчиков (Team)
Данный параметр является числовым и указывает на количество человек в команде, которые разрабатывали проект для ICO. Основные характеристики данного параметра представлены в таблице 20.
Таблица 20 -- Характеристики переменной Team
Источник: составлено автором
Так как данная переменная является числовой, то ее необходимо проверить на нормальность распределения. Гистограмма распределения значений представлена на рисунке 14.
Рисунок 14 -- Гистограмма распределения значений переменной Team
Источник: составлено автором
Внешний вид распределения отличается от нормального. Подтвердим данное предположение формально (см. таблица 21).
H0: значения переменной Team распределены нормально
H1: распределение значений переменной Team отличается от нормального
Таблица 21 -- Результаты теста Шапиро-Уилка для значений переменной Team
Источник: составлено автором
Результат теста отклоняет нулевую гипотезу о нормальности распределения, поэтому принимаем противоположную гипотезу, то есть распределение значений переменной Team отлично от нормального.
Прологарифмируем значения данной переменной для того, чтобы приблизить распределение к нормальному.
Гистограмма распределения логарифмов значений представлена на рисунке 15.
Рисунок 15 -- Гистограмма распределения логарифмов значений переменной Team
Источник: составлено автором
Распределение стало ближе к нормальному, однако необходимо провести формальный тест (см. таблица 22).
H0: логарифмы значений переменной Team распределены нормально
H1: распределение логарифмов значений переменной Team отличается от нормального
Таблица 22 -- Результаты теста Шапиро--Уилка для логарифмов значений переменной Team
Источник: составлено автором
По результатам теста мы можем принять нулевую гипотезу о нормальном распределении логарифмов значений переменной Team, то есть для дальнейшего регрессионного анализа будем использовать логарифмы значений переменной Team.
7. Наличие технического документа (White_Paper)
Переменная White_Paper указывает на наличие у разработчиков документа, описывающего технические особенности разработанного проекта. Эта переменная является дамми, где 0 - это отсутствие документа, 1 - его наличие. Какое количество проектов имеют white paper представлено на рисунке 16.
8. Фиатные валюты (Fiat)
Данная дамми-переменная указывает на то, принимала компания в качестве инвестиций для ICO фиатные валюты: 0 - не принимала, 1 - принимала. Соотношение таких компаний можно увидеть на рисунке 17.
9. Ethereum (Eth)
Дамми-переменная, показывающая, принимала ли компания в качестве инвестиций Ethereum: 0 - не принимала, 1 - принимала. Из 201 компании не принимала Ethereum только 1 компания.
10. Bitcoin (BTC)
Дамми-переменная, показывающая, принимала ли компания в качестве инвестиций Bitcoin: 0 - не принимала, 1 - принимала. Соотношение таких компаний представлено на рисунке 18.
11. Количество криптовалют, принимаемых во время ICO (n_curr)
Числовая переменная n_curr, характеризующая, какое количество криптовалют принимала компания в ходе ICO кампании. Основные ее характеристики представлены в таблице 23.
Таблица 23 -- Характеристика переменной n_curr
Источник: составлено автором
Так как переменная является целочисленной, то распределение ее значений необходимо проверить на нормальность. Гистограмма распределения значений представлена на рисунке 19.
Рисунок 19 -- Гистограмма распределения значений переменной n_curr
Источник: составлено автором
Графически распределение отличается от нормального, в чем также можно убедиться с помощью формального теста (см. таблица 24).
H0: значения переменной n_curr распределены нормально
H1: распределение значений переменной n_curr отличается от нормального
Таблица 24 -- Результаты теста Шапиро-Уилка для значений переменной n_curr
Источник: составлено автором
Результат теста подтверждает предположение о распределение значений переменной n_curr, отличного от нормального.
Прологарифмируем значения переменной n_curr и построим гистограмму их распределения (см. рисунок 20).
Рисунок 20 -- Гистограмма распределения логарифмов значений переменной n_curr
Источник: составлено автором
Распределение графически отличается от нормального. Проведем формальный тест, чтобы проверить, приблизилось ли распределение к нормальному после логарифмирования (см. таблица 25):
H0: логарифмы значения переменной n_curr распределены нормально
H1: распределение логарифмов значений переменной n_curr отличается от нормального