Дипломная работа: Моделирование поведения потребителя на рынке сотовой связи

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

- рассчитать количество уникальных базовых станций, с которых были совершены услуги в течение месяца;

- рассчитать через среднее взвешенное геометрическое, насколько сильно абонент колеблется вокруг своего центра масс;

- рассчитать индекс Херфиндаля-Хиршмана.

Подробнее речь о расчете, плюсах и минусах каждого показателя пойдет в разделе 3.

На предоставленных данных представляется возможным построить несколько моделей. Для начала будет построена Conditional logit модель, предложенная McFadden (1973), которая позволит понять, как характеристики текущего тарифного плана и альтернативных планов, а также мобильность индивида, могут влиять на вероятность выбора потребителей. Выбор этой модели объясняется тем, что, в отличие от модели Multinomial logit, Conditional logit позволяет исследовать влияние не только личностных характеристик индивида, величина которых никак не зависит от доступных альтернатив, но также факторов, которые уникальны для каждого тарифа. Например, мобильность индивида в течение месяца является величиной постоянной и никак не будет меняться, какой бы тариф он ни выбрал. В то же время, стоимость голосовых сообщений внутри сети для разных тарифов разная, и, следовательно, меняется в зависимости от выбора конкретной альтернативы.

Стоит отметить, что, как правило, потребители по-разному реагируют на изменение стоимости различных альтернатив (например, 10% удорожание разных брендов сока не приведет к одинаковому изменению спроса на эти продукты). Следовательно, предполагается разумным построить Mixed logit модель, которая позволяет проверить наличие гетерогенности потребителей по ценам для разных тарифных планов.

Кроме того, будет построена Nested logit модель. В рамках данной модели предполагается, что выбор происходит не из всего предоставленного множества тарифов, а из группы близких друг к другу. То есть на первом шаге индивид группирует тарифы между собой по некоторым признакам и выбирает для себя наиболее подходящую группу, на втором шаге - выбирает определенный тариф из выбранной на предыдущем шаге группы. Данное предположение является довольно реалистичным. Таким образом, данная модель позволит понять, каким образом происходит выбор тарифа: путем выбора из всего множества или выбора вначале типа тарифа, а на втором шаге - конкретного тарифного плана.

Выдвинутые гипотезы

Исходя из предыдущих работ, были сформулированы следующие гипотезы:

- Гипотеза 1. Наибольший эффект на решение индивида о переключении на другой тарифный план оказывает изменение цены на услуги внутри сети. Люди, как правило, выбирают тех мобильных операторов, которые пользуются наибольшей популярностью среди их круга общения, следовательно, они будут острее реагировать на изменение стоимости услуг внутри сети (Birke and Swann, 2006).

- Гипотеза 2. Потребители, пользующиеся тарифом с дифференциацией, менее вероятно сменят тарифный план. Объяснить это можно схемой ценообразования на данном типе тарифа: стоимость первых единиц пользования достаточно высока, однако по достижении определенной накопленной суммы минут или SMS сообщений стоимость снижается. Следовательно, можно предположить, что в силу нелинейного ценообразования при изменении прейскуранта на данном тарифе индивиду сложно рассчитать, как сильно изменятся его издержки. Таким образом, нелинейное ценообразование затрудняет понимание индивида о том, стоит ли осуществлять переход на другой тарифный план.

- Гипотеза 3. Более мобильные абоненты вероятнее переключатся на другой тарифный план. Это может быть объяснено тем, что такие люди больше общаются, следовательно, лучше обучаются и с большей вероятностью сменят тариф в целях минимизации своих издержек.

- Гипотеза 4. В силу того, что для потребителей характерен эффект обучения, то индивид делает выбор не из всего множества тарифов, а лишь из группы близких друг к другу тарифов. Данная гипотеза близка к реальности: люди руководствуются принципом ограниченной рациональности, то есть не рассматривают все возможные варианты, а некоторым образом классифицируют их и выбирают для себя вариант из наиболее подходящей им группы.

Предпосылки исследования

сотовый связь тариф переключение

Также в рамках данного исследования необходимо ввести некоторые предпосылки в силу того, что данные носят ограниченный характер: данные есть только по абонентам ОАО «Ростелеком».

- Предпосылка 1. Принцип максимизации полезности. Данная предпосылка исходит из выбранной модели и заключается в том, что индивид выбирает тот тарифный план, который максимизирует его полезность.

- Предпосылка 2. Высокие издержки смены мобильного оператора. В рамках данного исследования предполагается, что абоненты могут лишь перейти на тариф того же оператора в силу высоких издержек переключения, что подтверждено предыдущими работами (Ida and Kuroda, 2006; Grzybowski and Pereira, 2011; Kim, 2006).

- Предпосылка 3. Ограниченное количество возможных для подключения тарифов. Будем рассматривать не все теоретически возможные тарифы, а только основные.

- Предпосылка 4. Ограниченное количество возможных услуг. В рамках данного исследования будут рассматриваться стоимости лишь 5 самых популярных услуг, предоставляемых мобильным оператором (стоимость звонков внутри сети; стоимость звонков на номера фиксированной телефонной связи; стоимость звонков на номера других сотовых операторов; стоимость SMS сообщений внутри сети; стоимость SMS сообщений на номера других сотовых операторов). Предпосылки 3 и 4 вводятся для упрощения расчетов, так как учет всех услуг и тарифов, большинство которых несущественны в силу их малой доли пользования, не сильно улучшит качество модели, но значительно затруднит необходимые для исследования расчеты.

- Предпосылка 5. Мобильность индивида. Так как в предоставленных данных невозможно выделить тех абонентов, которые много передвигаются, но совершают звонки лишь с небольшого числа базовых станций, то будем предполагать, что базовые станции дают реальное представление о перемещениях абонента.

1. Методология

Так как исследовательский вопрос заключается в определении вероятности выбора потребителя того или иного тарифного плана в зависимости от изменений характеристик тарифа и индивида, то представляется возможным построить conditional logit model.

Данная модель впервые была представлена McFadden и основана она на модели, схожей с моделью логистической регрессии (McFadden, 1973). Модель относится к классу дискретных моделей с более чем двумя альтернативами, которые нельзя упорядочить естественным образом. Предположим, что индивид i делает выбор среди j различных тарифов. Индивид выберет тот тарифный план, который максимизирует его полезность. Функция полезности выражается следующим образом:

(1)

где: - уникальные по индивидам и по альтернативам регрессоры (case-specific regressors);

уникальные по индивидам, но не по альтернативам регрессоры (alternative-specific regressors).

Предположим, что тариф j приносит максимальную полезность индивиду, значит индивид выберет именно эту альтернативу: . Тогда вероятность того, что индивид i выберет альтернативу j равна:

(2)

Аналитическое решение может быть получено при предположении:

(3)

где: .

В этом случае вероятность выбора индивидом i тарифа j будет выглядеть следующим образом:

(4)

В данной модели вычисляются j - 1 коэффициентов для каждого регрессора, который уникален по индивидам, но не по альтернативам, так как необходима нормировка одного из набора коэффициентов (например, к нулю, то есть альтернатива j = 1 будет являться базовой. Интерпретация коэффициентов для case-specific регрессоров осуществляется относительно базовой альтернативы.

Однако недостатком conditional logit модели является предпосылка о том, что коэффициенты при переменных являются фиксированными, то есть влияние каждой переменной одинаково для любого индивида, что не является реалистичным. Поэтому в работе будет также построена mixed logit модель. Функция полезности в данной модели имеет следующий вид:

(5)

где: и - вектор параметров распределения случайной величины вi.

То есть в данной модели предполагается, что независимые переменные оказывают разные эффекты на людей. Иными словами, влияние конкретного фактора на полезность разное для разных индивидов, то есть в модели есть возможность учесть гетерогенность людей по различным параметрам. В данной работе будет учитываться гетерогенность по ценам на услуги.

Тогда условная по вi вероятность выбора альтернативы j индивидом i равна:

(6)

Но так как вi является случайной и неизвестной величиной, то вероятность выбора находится через взятие интеграла от , умноженной на функцию плотности вi, по вi (Revelt and Train, 1998):

(7)

Наконец, еще одной из возможных моделей является Nested logit модель. Данная модель является обобщением Conditional logit модели МакФаддена и позволяет группировать схожие между собой альтернативы (Heiss, 2002). Таким образом, предполагается, что выбор индивида происходит не из всего множества альтернатив, а носит двухуровневый характер: вначале выбирается тип тарифа, далее - тарифный план из выбранной на предыдущем шаге группы.

Разбиение тарифов на группы будет основано на предположении о том, что индивид выбирает тип тарифа в зависимости от своего уровня потребления, то есть индивиды группируют тарифы по минимальному объему потребления, который выгоден для конкретного тарифного плана:

1) Низкий уровень потребления;

2) Средний уровень потребления;

3) Высокий уровень потребления.

Индивид распределяет доступные альтернативы по вышеперечисленным группам в зависимости от их особенностей. Например, если индивид не является активным пользователем сотовой связи, то для него выгодным является тариф без дифференциации стоимости звонков и SMS-сообщений, то есть тариф с фиксированной платой за единицу пользования. Для пользователей средней активности выгоден тариф с дифференциацией, то есть тариф с высокой платой за первые единицы пользования и сниженной платой за последующие. Наконец, индивиды с высоким уровнем потребления понесут наименьшие издержки при подключении к двухчастному тарифу, так как, несмотря на высокую фиксированную ежемесячную плату, стоимость единицы пользования меньше, чем на других типах тарифов, и, как следствие, меньше предельные издержки. Таким образом, в работе рассматриваются три группы тарифов:

1) Тарифы без дифференциации (низкий уровень потребления);

2) Тарифы с дифференциацией по объему потребления услуг в течение суток или одного соединения (средний уровень потребления);

3) Тарифы с абонентской платой (высокий уровень потребления).

Таблица группировки тарифов представлена ниже.

Таблица 1

Группировка тарифов по их особенностям

Тариф

Особенности тарифа

Группа

Капитал Platinum

Дифференциация по накопленной сумме (до 2500 руб.; свыше 2500 руб.)

Без дифференциации (one-part)

Кнопкины точка ру

Нет дифференциации

Без дифференциации (one-part)

Своя страна +

Нет дифференциации

Без дифференциации (one-part)

Знатоки общения

Дифференциация по накопленному количеству минут и SMS-сообщений в сутки

С дифференциацией (one-part_with_diff)

Пионер

Дифференциация по накопленному количеству минут в течение одного соединения

С дифференциацией (one-part_with_diff)

Радуга Фристайл

Дифференциация по накопленному количеству минут в сутки и SMS-сообщений в месяц

С дифференциацией (one-part_with_diff)

Пять звезд

Наличие абонентской платы

С абонентской платой (two-part)

Союз

Наличие абонентской платы

С абонентской платой (two-part)

Стоит отметить, что тариф «Капитал Platinum» рассматривается в качестве тарифа без дифференциации, потому что в рассматриваемой выборке нет абонентов, чьи месячные издержки превышают 2500 рублей.

Таким образом, структура выбора тарифного плана выглядит следующим образом:

Рис. 1 Структура выбора тарифа

Как и в вышеописанных моделях индивид выберет ту альтернативу, которая принесет ему максимальную полезность, где полезность выбора альтернативы j из группы s индивидом i выражается следующим образом:

(8)

где: - вектор характеристик группы s.

Вероятность данного выбора находится перемножением вероятности выбора группы s из всего множества групп n на вероятность выбора альтернативы j в группе s (Wen and Koppelman, 2001):

(9)

Далее необходимо определиться с переменными, оказывающее непосредственное влияние на уровень полезности индивида. В качестве alternative-specific регрессоров целесообразно выбрать услуги, пользующиеся наибольшей популярностью. Для этого взглянем на распределение издержек по десяти услугам, на которые приходится наибольшая доля всех затрат.

Рис. 2 Распределение затрат по услугам

Как видно, более 50% затрат приходится на исходящие звонки внутри сети и звонки на номера других операторов, на каждую остальную услугу приходится менее 10% затрат. Стоит отметить, что целесообразно включать в модель лишь исходящие услуги, то есть услуги, объем которых определяется и контролируется непосредственно самим индивидом. Также следует исключить из рассмотрения услуги, доля приходящихся издержек на которые велика не из-за частоты пользования, а из-за более высокой стоимости. В конечном итоге в качестве объясняющих переменных были выбраны стоимости пяти наиболее популярных услуг:

- стоимость звонков внутри сети;

- стоимость звонков на номера фиксированной телефонной связи;

- стоимость звонков на номера других сотовых операторов;

- стоимость SMS-сообщения внутри сети;

- стоимость SMS-сообщения на номера других сотовых операторов.

В связи с тем, что в предоставленных данных указана базовая станция, с которой был совершен вызов, предоставляется возможным включить мобильность индивида в его функцию полезности и определить, оказывает ли она значимое влияние на решение потребителя о выборе тарифного плана. Мобильность будет рассчитана тремя способами.

1) Количество уникальных базовых станций, в зоне действия которых индивид совершает звонки в течение месяца (mob_1).

Данный способ имеет существенный недостаток: индивид может совершать звонки с небольшого числа базовых станций, которые расположены на большом расстоянии друг от друга, что приводит к недооценке индекса мобильности индивида в плане территориального передвижения. Возможна и обратная ситуация, когда индивид пользуется большим количеством базовых станций, которые расположены на небольшом расстоянии относительно друг друга, что приводит к переоценке индекса мобильности индивида. Для того чтобы побороться с данной проблемой будет использован второй способ расчета мобильности.