Материал: 1_8ДХафф

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

1.8. Энтропийная оценка средней длины кода

Рассмотрим зависимость оптимального значения L_min(W) от входного набора . Здесь удобно использовать вероятностную интерпретацию: p_i – вероятность появления символа _i во входном потоке, а L(p, l) = _i_=1.._n p_i l_i – математическое ожидание длины кода случайно выбранного символа. Оптимальное значение L(p, l) обозначим как L_min(p).

Определение. Энтропия распределения вероятностей есть (считаем, что ).

Лемма 1. Для любых распределений вероятностей p и справедливо неравенство

Равенство имеет место тогда и только тогда, когда для всех .

Доказательство.



  .

Так как функция строго выпукла и касательной к кривой в точке (0, 0) служит прямая y = x, то справедливо неравенство , причем при имеем даже . Поэтому

что и требовалось доказать.

Утверждение. Пусть для и L_min(p) – средняя длина слова некоторого оптимального префиксного кода с априорным распределением p. Тогда .

Доказательство. 1) Докажем левое неравенство . Пусть  длины кодовых слов некоторого оптимального префиксного кода. Положим и . Можно рассматривать как некоторое распределение вероятностей. Из неравенства Крафта следует, что Q  1, а поэтому log₂Q  0. Из леммы вытекает, что

В случае, когда Q = 1 и для всех i, получим . Это, следовательно, справедливо, если и , т. е. .

2) Перейдем к доказательству правого неравенства . В общем случае , поэтому выберем . Отсюда вытекает, что и, в частности, . Тогда и , т. е. для набора выполняется неравенство Крафта, а следовательно, существует префиксный код с длинами кодовых слов . Итак,

что и требовалось доказать.

Следствие из теоремы: .

Приведенное доказательство позволяет сделать конструктивный вывод: если взять и построить, исходя из неравенства Крафта, префиксный код для набора , то этот код будет достаточно хорошим, поскольку для него .

Отметим, что для неравномерного распределения p энтропия H(p) может быть мала и средняя длина кода окажется тоже малой. Действительно, энтропия равномерного распределения вероятностей есть . Если же рассмотреть неравномерное распределение вероятностей, например такое, что для i 1..n 1 и , то для него . Например, при n =1024 получим , тогда как при равномерном распределении H(p) = 10.

1.9. Динамическое кодирование по Хаффману

Рассмотренный (статический) метод Хаффмана имеет некоторые недостатки, влияющие на эффективность его применения, например:

двухпроходность алгоритма (сначала вычисляются веса , затем строится дерево (код) Хаффмана);
необходимость передавать кодовое дерево вместе с последовательностью закодированных сообщений.

Этих недостатков лишен так называемый динамический (однопроходный) метод Хаффмана, в котором кодирование осуществляется «на лету». При этом используется динамически изменяющееся дерево Хаффмана (изменяющийся префиксный код). Кодировщик и декодировщик работают в этом случае синхронно: начиная с пустого дерева, они строят одно и то же дерево Хаффмана, причем кодировщик – по последовательности сообщений, а декодировщик – по последовательности кодовых слов. Можно представить этот процесс в виде схемы, изображенной на рис. 1.1 (здесь ДХ(i) – дерево Хаффмана, построенное по последовательности символов (сообщений) ).

c_i

a_i

Кодировщик выполняет две основные операции: 1) построение кодового слова c_i для очередного символа a_i по текущему дереву Хаффмана ДХ(i  1); 2) перестройку текущего ДХ(i  1) в новое ДХ(i) с учетом поступившего символа a_i. Декодировщик также выполняет две операции:

Смотрите также:


«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
Значение, сущность и содержание социально — педагогической деятельности в организации для детей-сирот и детей, оставшихся без попечения родителей
Проактивные методы PR-деятельности российских авиационных компаний «Россия», «Азимут»
__RGR2
__RGR2
_10_Эмиль Золя для эл версии
_11_А. Франс для эл версии
_3 тема - Диффузия