69% респондентов согласились с этим утверждением, что благодаря обучению и развитию сотрудников, банк укрепил с ними связь, однако, 12% (7% + 5%) оказались не согласны. Также обучение помогает сотрудникам развивать конкурентное преимущество, повышает приверженность сотрудников банку и, следовательно, уменьшает вероятность увольнения.
Было также установлено, что обучение, проведенное банком, мотивировало сотрудников, что увеличило коэффициент удержания сотрудника: 51% и 17% согласились с данным утверждением. Средний балл по вопросу составил 3,63, стандартное отклонение составило 1,049. Наконец, исследование показало, что у большинства сотрудников есть доступ к достаточному количеству ресурсов для обучения и развития.
Цель исследования состояла в том, чтобы изучить уровень консенсуса или несогласия респондентов с утверждениями о влиянии окружающей их рабочей среды на удержание сотрудников. Была использована шкала Лайкерта, оценки следующие: 1 = категорически против (SD), 2 = против (D), 3 = безразлично (I), 4 = согласен (A), 5 = категорически согласен (SA).
Таблица 26. Шкала Лайкерта 2
|
SD |
D |
I |
A |
SA |
Среднее |
Станд откл. |
||
|
Банк считает, что хорошие условия труда играют значительную роль в намерении сотрудника остаться |
3 |
12 |
2 |
44 |
39 |
4.03 |
1.098 |
|
|
Существует наличие надлежащей коммуникативной культуры, которая была обусловлена удержанием сотрудников в банке |
0 |
14 |
10 |
54 |
22 |
3.85 |
.925 |
|
|
Существует наличие компетентного руководства, которое привело к улучшению удержания сотрудников |
3 |
14 |
14 |
51 |
19 |
3.68 |
1.041 |
|
|
Намерение сотрудников остаться в банке было усилено хорошими отношениями между сотрудниками |
2 |
7 |
12 |
58 |
22 |
3.92 |
.877 |
|
|
Существует безопасная рабочая среда, которая хорошо зарекомендовала себя при удержании сотрудников в банке |
3 |
12 |
8 |
58 |
19 |
3.76 |
1.006 |
|
|
Банк всегда вовлекает сотрудников в повседневное принятие решений поэтому они чувствуют себя неотъемлемой частью банка |
8 |
17 |
17 |
37 |
20 |
3.34 |
1.226 |
|
|
Имеющиеся ресурсы рабочего места, системы / средства способствовали хорошей рабочей атмосфере, таким образом, сохранили сотрудников |
7 |
8 |
14 |
46 |
25 |
3.75 |
1.1139 |
|
|
Руководство банка позаботилось о том, чтобы гигиенические потребности были удовлетворены, поэтому большинство сотрудников готовы остаться |
5 |
10 |
10 |
47 |
27 |
3.81 |
1.106 |
В этом разделе исследования показаны результаты регрессии. Регрессия должна была определить взаимосвязь между независимыми переменными (обучение, рабочая среда, вознаграждение) и зависимой переменной (удержание сотрудников). Результаты приведены в ниже.
R - 0,97
R квадрат - 0,94
Скорректированный R Квадрат - 0.936
Стандартная ошибка - 4.5234
Модель показывает, что коэффициент детерминации R равен 0,97. Удержание 97% сотрудников положительно связаны с вышеперечисленными переменными удержания. Это очень сильная связь. Оставшиеся 3% не попали в зависимость, их удержание можно описать какими-то иными факторами.
Таблица 27. ANOVA ANOVA (Зависимая переменная - работники)
|
Модель |
Sum of sq |
Df |
Mean sq |
F |
Sig |
|
|
Регрессия |
16506,743 |
2 |
8244,732 |
404,154 |
,000 |
|
|
Остаток |
1154,351 |
56 |
21,031 |
|||
|
Итого |
17661,094 |
58 |
Эти расчеты представляют собой дисперсионный анализ или тестирование данных, пригодных для регрессионной модели. Результаты анализа коэффициентов регрессии Anova показали, что значимость F статистики составляет 0,014, что меньше 0,05. Делаем вывод, что между независимыми переменными существует значительная связь.
Коэффициенты (Зависимая переменная - удержание сотрудников)
Из таблицы видно, что удержание сотрудников увеличивается в 1,14 раз за счет увеличения числа учебных подразделений. Эта же переменная оказалась статистически значимой для удержания сотрудников на уровне 0,044 (доверительный уровень менее 0,05).
Таблица 28. Результаты
|
Модель |
Нестандартизированные Коэффициенты |
Стандартизированные Коэффициенты |
t |
Sig |
||
|
B |
Ст. ош. |
Beta |
||||
|
Константа |
9.180 |
1.578 |
5.835 |
.022 |
||
|
Обучение |
1.141 |
0.59 |
0.431 |
18.759 |
0.41 |
|
|
Рабочее окружение |
0.989 |
0.81 |
0.359 |
12.321 |
0.16 |
Было также установлено, что удельное увеличение показателей рабочей среды на единицу приведет к увеличению удержания сотрудников в банке на 97%. Также было установлено, что переменная была статистически значима 0,015, а р-значение было меньше необходимого доверительного уровня 0,05. Когда уровень значимости был равен 5% (0,05), а уровень детерминации 95%, все тестируемые переменные имели прямую положительную связь с удержанием сотрудников. Эти результаты совпали с опросом, проведенным выше, о взаимосвязи между обучением, развитием, вознаграждением и их связи с удержанием.
На основе этого исследования можно сделать вывод о том, что обучение способствует удержанию сотрудников в банках. Это подтверждается высоким процентом респондентов, которые согласны с тем, что банк укрепил свои отношения со своими сотрудниками в результате их, а, соответственно, улучшил показатели удержания сотрудников. К тому же, важную роль также сыграли хорошее окружение, наличие приятной и безопасной рабочей среды, доступные образовательные ресурсы.
Конечная практическая польза этого исследования состоит в том, что для удержания сотрудников банку необходимо создать все необходимые условия, такие как: комфортная трудовая сфера, что обеспечит лучшую коммуникацию между сотрудниками, а также, появилось или усилилось чувство принадлежности и пользы, а соответственно и подобающий стиль руководства.
3.2 Обоснование и разработка модели удержания персонала
Задача: Формирование модели удержания сотрудников. Данными для построения модели являются метрики - обезличенные показатели. Среди них: возраст, семейное положение, стаж в должности, значение производительности, отгулы, заработная плата, кредитные начисления, личные расходы, больничные и тип населенного пункта, в котором проживает работник.
Работа проведена в среде R. Данный инструмент выбран в связи с широким спектром возможностей и наличии большого количества полезных библиотек для анализа данных.
Мы имеем достаточно высокую гетероскедастичность в некоторых показателях, поэтому будет использоваться линейный логарифм, либо относительные значения от максимума. Мультиколлинеарность в показателях отсутствует, корреляционная таблица и тесты Пирсона показали низкие значения.
Для начала взглянем на простые линейные зависимости, в качестве зависимой переменной взят стаж работы, как показатель удержания, остальные переменные выступают предикторами:
Таблица 30. Предикторы
|
ВСП |
Возраст |
Семейное положение |
|
|
VSP |
Age |
Family |
|
|
Стаж в должности |
Среднее значение производительности |
Коэффициент результативности |
|
|
EXP |
Mid3 |
res |
|
|
Отгуляно дней отпуска, с начала года нарастающим итогом, ежемесячно |
Суммарный текущий месячный платеж по всем кредитным продуктам |
Количество дней отсутствия по причине болезни |
|
|
Hol |
Cred |
dis |
|
|
Количество дней отсутствия за исключением причины болезни, ежегодного отпуска |
Усредненная величина ежемесячных зарплатных начислений за последние 3 месяца |
Сумма операций покупок в категории «Туризм/Транспорт» в рублях за месяц по дебетовым картам |
|
|
Dis0 |
Sal |
Tour |
|
|
Общая сумма покупок по всем дебетовым картам клиента в месяц в рублях |
Количество дней с фактом неоплачиваемого больничного за отчетный месяц |
||
|
POS |
Dis1 |
Построение регрессии в R.
Fit <- lm(EXP ~ ., data = data)
Summary(fit)
Call:
lm(formula = EXP ~ ., data = data)
Residuals:
|
Min |
1Q |
Median |
3Q |
Max |
|
|
-5.9408 |
-0.5011 |
0.2818 |
0.8637 |
1.8822 |
Coefficients:
|
Estimate |
Std. Error |
T value |
Pr(>|t|) |
||
|
(Intercept) |
-1.217757 |
0.893122 |
-1.363 |
0.173 |
|
|
Age |
2.228811 |
0.084510 |
26.373 |
<2e-16*** |
|
|
Mid3 |
0.015031 |
0.024282 |
0.619 |
0.536 |
|
|
Res |
0.041112 |
0.028121 |
1.462 |
0.144 |
|
|
Hol |
-0.023008 |
0.019482 |
-1.181 |
0.238 |
|
|
Cred |
-0.009154 |
0.018883 |
-0.485 |
0.628 |
|
|
Dis |
0.003548 |
0.024172 |
0.047 |
0.883 |
|
|
Dis0 |
-0..020138 |
0.024169 |
-0.832 |
0.405 |
|
|
Sal |
0.015681 |
0.056878 |
0.276 |
0.783 |
|
|
Tour |
0.034946 |
0.044156 |
0.791 |
0.429 |
|
|
Bal6 |
-0.027716 |
0.021514 |
-1.288 |
0.198 |
|
|
POS |
-0.012665 |
0.019896 |
-0.637 |
0.524 |
|
|
Dis1 |
-0.004550 |
0.020074 |
-0.227 |
0.821 |
Signif. Codes: 0 “***” 0.001 “**” 0.01 “*” 0.05 “.” 0.1 “ ” 1
Residual standard error: 1.24 on 4176 degrees of freedom
Multiple R-squared: 0.1443, Adjusted R-squared: 0.1419
F-statistic: 58.7 on 12 and 4176 DF, p-value: < 2.2e-16
Как мы видим, сильная зависимость выявлена между стажем и возрастом работника. Средний возраст увольнения: 30 лет. Но чем старше работник, тем больше показатель его удержания.
Пробуя идти от обратного, мы можем убедиться, что зарплата работников не зависит ни от их возраста, ни от стажа работы.
Call:
lm(formula = sal ~ Age + EXP, data = data)
Residuals:
|
Min |
1Q |
Median |
3Q |
Max |
|
|
-17784.0 |
-8919.4 |
161.1 |
8796.2 |
17741.9 |
Coefficients:
|
Estimate |
Std. Error |
T value |
Pr(>|t|) |
||
|
(Intercept) |
32269.2168 |
689.2636 |
46.817 |
<2e-16 |
|
|
Age |
19.0713 |
25.1079 |
0.760 |
0.448 |
|
|
EXP |
-0.2388 |
0.2394 |
-0.998 |
0.319 |
Здесь мы можем заключить, что причиной ухода точно не является заработная плата. Если смотреть на модель выше, мы можем убедиться, что линейной зависимости между показателями, кроме возраста и стажа, не имеется.
Из перебора по остальным переменным была выявлена лишь сильная зависимость переменных: hol:dis:dis0:POS:cred c p-значениями < 0,01.
|
Estimate |
Std. Error |
T value |
Pr(>|t|) |
||
|
(Intercept) |
1.269442 |
0.065375 |
19.418 |
<2e-16*** |
|
|
Hol |
0.064181 |
0.061867 |
1.037 |
0.2996 |
|
|
Dis |
1.964502 |
1.153669 |
1.703 |
0.0887 |
|
|
Dis0 |
-3.153849 |
2.075354 |
-1.520 |
0.1287 |
|
|
Cred |
0.256383 |
0.014699 |
17.443 |
<2e-16*** |
|
|
EXP |
-0.014247 |
0.008848 |
-1.610 |
0.1075 |
Модель показала лишь, что чем выше сумма покупок работника по дебетовым картам, тем выше его выплаты по кредиту.
Других важных зависимостей выявлено не было. И при линейных переборах исходных значений, и при преобразовании их в линейные логарифмы, и при переводе в относительные коэффициенты.
Было решено прибегнуть к другому методу анализа - Random Forest (или Метод Случайного Леса).
Код для обучающей и тестовой выборки и построения леса:
data$EXP <- as.factor(data$EXP)
table(data$EXP)
set.seed(150)
ind <- sample(2, nrow(data), replace = TRUE, prob = c(0.7, 0.3))
train <- data [ind == 1,]
test <- data [ind == 2,]
head(data
library(randomForest)
set.seed(250)
rf <- randomForest(EXP~., data = train,
importance = TRUE,
proximity = TRUE,
na.action = na.roughfix)
print(rf)
attributes(rf)
Обучающая и тестовая выборки были распределены в отношении 70/30.
Рисунок 4. Скриншот распределения обучающей и тестовой выборки
Из-за высокого количества деревьев по умолчанию, мы получили высокое значение Out-Of-Bag и высокие показатели ошибок, поскольку многие показатели имеют огромный несвязанный разброс и не предсказывают целевую функцию. Но не все, например возраст, как и в линейной модели, так и в дереве, имеет высокую предсказательную силу.
Рисунок 5. Разброс ошибок дерева по предикторам
Несмотря на все это, дерево с хорошей точностью выполняет предсказание на тестовой выборке по имеющимся данным. Для сравнения, взглянем на предсказанные и исходные данные:
confusionMatrix(p1, train$EXP)