Статья: Эффективное сжатие изображений на базе дифференциального анализа

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Предлагаемый способ нахождения предварительного решения базируется не на последовательных итерационных приближениях, а на аппроксимации промежуточного решения в области по имеющимся данным о граничных условиях , с учетом правой части (8). При этом вычислительная сложность может быть оценена как:

, (22)

где, как правило, , причем и имеют тот же смысл, что и в (20), что позволяет говорить о снижении вычислительной сложности предлагаемого способа по отношению к последовательному измельчению сетки.

В общем случае указанный подход повышения скорости МКР применим не только для восстановления исходного сигнала по паттерну, но и для других задач, решение которых возможно с помощью МКР. Дополнительно способ тестировался на различных задачах электротехники, описываемых уравнением Лапласа и Пуассона, в пространствах с числом измерений пространства и .

Во всех случаях полученное промежуточное решение позволяло существенно сократить число итераций МКР для получения решения с заданной точностью. Особый выигрыш в сокращении числа итераций наблюдается при гладких краевых условиях, вплоть до того, что при некоторой достаточной гладкости может быть получено решение только с применением указанного способа без итерационного процесса МКР. Такие краевые условия вполне актуальны для некоторых типов изображений.

Рис. 6. Значения логарифмов суммарных невязок по всем узлам сетки в зависимости от номера итерации в двумерном пространстве . a.) - без поиска предварительного решения; b.) - с поиском предварительного решения.

Существенное ускорение сходимости, в результате оптимизации рассмотренным способом, на примере невязок в решении двумерной (плоско-параллельной) задачи электростатики, приведено на изображении (рис. 6). Для разбиения области выбиралась прямоугольная сетка, образованная линиями, параллельными координатным осям, с равным во всех направлениях шагом . В качестве многочлена (21) было использовано уравнение прямой , коэффициенты которой () рассчитывались по двум элементам краевых условий из .

Отметим, что применение рассмотренного способа в некоторых двумерных задачах, для достижения решения с заданной по невязке точностью, позволило уменьшить число итераций в 10-100 раз, что говорит о существенном повышении эффективности МКР.

Ещё одним дополнительным способом повышения скорости вычислений МКР является распараллеливание итерационного процесса, например, по элементам сетки. Достаточно просто такое решение реализуется на базе современных графических процессоров, например, при помощи технологии CUDA, что позволяет многократно (в сотни раз) повысить скорость вычислений [16].

7. Сравнение и некоторые результаты сжатия цифровых сигналов с помощью анализа дифференциальной структуры

Рассмотрим некоторые результаты практического применения изложенного выше принципа сжатия на примере компрессии изображений. В качестве анализирующего уравнения было выбрано уравнение Лапласа (13). Изображения для тестирования выбирались из базы данных стандартных тестовых изображений [17], с учётом фактора, что сжатие на основании анализа дифференциальной структуры, наиболее эффективно может быть применено к графическим объектам, содержащим контрастные границы и значительные поля градиента или одного тона.

Одно из выбранных для тестирования изображений (рис. 7) обладает следующими свойствами: является цифровым сигналом, полученным в результате фотографирования; содержит контрастные границы объектов; содержит значительные поля одного тона. Рассмотрим зависимости от значения -критерия следующих велечин:

- число исключённых элементов из паттерна;

- коэффициент сжатия:

, (23)

где: - объём сжатых (выходных) данных (бит); - объём исходных (входных) данных (бит);

- среднеквадратичную ошибку (MSE - mean square error):

, (24)

где: - значения исходного и - восстановленного сигналов;

- пиковое отношение сигнал/шум (PSNR - peak signal to noise ratio):

; (25)

- отношение сигнал/шум (SNR - signal to noise ratio):

, (26)

где: RMSE - корень среднеквадратической ошибки т.е.: .

Как отмечалось выше, от величины -критерий зависит число исключённых из паттерна элементов, в конечном результате, сжатие. При этом, можно ожидать следующую закономерность: чем больше величина -критерия, тем больше исключено элементов из паттерна и тем менее точно можно восстановить исходный сигнал. Когда величина -критерия будет иметь значение больше или равное некоторому пороговому, паттерн, будет содержать только элементы принадлежащие границе изображения. Следовательно при пороговой величине -критерия можно получить максимальное сжатие. При этом вопрос о качестве восстановленного изображения, полученного из паттерна сформированного по -критерию большего или равного пороговому, остаётся открытым.

Рис. 7. Стандартное тестовое изображение «4.1.05.bmp». Размер исходного файла изображения 196662 байт, размеры пикселей, глубина цвета 24 бита, размер цифрового сигнала изображения байт.

В таблице (таблица 2) приведены численные результаты экспериментов. Для всех цветовых каналов величина -критерия была выбрана одинаковая, формирование паттерна производилось в цветовом пространстве RGB. После формирования паттерна производилось сжатие длин серий, а затем кодирование Хафманна. Для результирующих данных был разработан специальный формат позволяющий сохранить в файл не только сами данные но и некоторую служебную информацию: дату, размеры изображения, используемое цветовое пространство, некоторые другие данные записанные пользователем. Служебная информация несколько увеличивает размер готового файла по сравнению размером сжатого сигнала. Длина служебных данных в файлах, создаваемых сжатием с помощью анализа дифференциальной структуры, составила 52 байта, а в исходном файле «4.1.05.bmp» 54 байта. При общем размере исходного файла «4.1.05.bmp» 196662 байт.

Для восстановления изображения применялся МКР (1000 итераций) с предварительным отысканием промежуточного решения. Время формирования паттерна в одном вычислительном потоке (ОС Windows, C++) на процессоре Core2Duo E8500 (с эффективной тактовой частотой процессора 3,16 ГГц, частота процессорной шины 1.333 ГГц, кэш-память второго уровня размером 6МБ), составило 31250 мкс, время восстановления 1343750 мкс. Расспаралеливание вычислительного потока не применялось. Расчёт коэффициента сжатия и фактора сжатия производился путём соотношения размеров конечных файлов исходного изображения «4.1.05.bmp» (196662) и файла полученного в результате сжатия с помощью анализа дифференциальной структуры.

Таблица 2. Некоторые оценки сжатия изображения «4.1.05.bmp».

-критерий	Число исключённых элементов	Коэффициент сжатия	Фактор сжатия
	байт	%
0	60	0,030518	0,889	1,125	0,001302	76,98	72,37041
5	23535	11,97052	0,840	1,191	0,121638	57,28	52,66611
10	57828	29,41284	0,699	1,431	0,800832	49,10	44,48139
15

84129

42,79022

0,582

1,719

2,204839

44,70

40,08303

107364

54,60815

0,481

2,080

5,200922

40,97

36,356

127779

64,99176

0,388

2,578

11,78631

37,42

32,80302

144492

73,49243

0,304

3,290

22,84199

34,54

29,92946

157290

80,00183

0,234

4,275

36,16757

32,55

27,93361

166086

84,47571

0,184

5,436

56,36549

30,62

26,00667

171954

87,46033

0,148

6,759

85,77358

28,80

24,18327

176058

89,54773

0,123

8,132

127,981

27,06

22,44535

179193

91,14227

0,104

9,618

192,4735

25,29

20,67309

181608

92,37061

0,089

11,239

268,6562

23,84

19,22483

183483

93,32428

0,077

12,991

384,8277

22,28

17,66414

184998

94,09485

0,068

14,710

503,2751

21,11

16,49875

На (рис. 8) приведены некоторые изображения, позволяющие получить визуальное представление о качестве восстановленного изображения и соответствующем паттерне.

Рис. 8. Исходное изображение (a.), далее восстановленные (b., d., e., g., h., j., k.) 1000 итераций МКР с использованием промежуточного решения. Колонка справа (c., f., i., l.) соответствует паттернам. Значения -критерия следующие: b., c. - 0; d. - 10; e., f. - 20; g. - 30; h., i. - 40; j. - 50; k., l. - 60.

Обычное значение коэффициента для изображений приемлемого качества составляет величину порядка единиц [8]. Сопоставляя результаты (таблица 2) и (рис. 8) можно заметить, что в области значений -критерия порядка наблюдается существенное, для визуального восприятия, ухудшение качества изображения, возникают области размытия вблизи границ объектов, при этом значения (для ) и (для ), что соответствует ожидаемой области ограничения приемлемого качества. Коэффициент сжатия (для ) и (для ). При дальнейшем росте величины -критерия наблюдается дальнейшее ухудшение качества, особенно проявляемое на границах графических объектов, изучение структуры паттерна показывает, что снижается и качество отображения текстуро-подобной однотонной области кирпичных стен, при сравнении паттерна (рис. 8, h.) с (рис. 8, j.) заметно, что пропадают граничные элементы, разделяющие отдельные малоконтрастные элементы изображения. При дальнейшем увеличение величины -критерия до единиц содержимое изображения, несмотря на значительные искажения, оставалось узнаваемым. Далее рассмотрим сопоставление полученных результатов с некоторыми другими, наиболее распространёнными графическими форматами (таблицы 3, 4, 5).

Таблица 3. Некоторые оценки JPEG-сжатия изображения «4.1.05.bmp».

Качество	Коэффициент сжатия	Фактор сжатия
12	0,494	2,023	1,56	46,17	41,56
11	0,359	2,778	5,63	40,62	36,01
10	0,282	3,538	9,35	38,41	33,80
9	0,245	4,069	12,97	37,00	32,39
8	0,222	4,497	17,13	35,79	31,18
7	0,201	4,970	23,31	34,45	29,84
6	0,199	5,006	40,10	32,10	27,49
5	0,187	5,333	46,79	31,43	26,82
4	0,179	5,556	51,48	31,01	26,40
3	0,174	5,746	58,72	30,44	25,83
2	0,164	6,064	75,88	29,33	24,72
1	0,160	6,243	96,81	28,27	23,66
0	0,158	6,316	105,61	27,89	23,28

Таблица 4. Некоторые оценки PNG-сжатия изображения «4.1.05.bmp».

Число разрядов	Число цветов	Коэффициент сжатия	Фактор сжатия
24	16777216	0,609136	1,641668	0	inf	inf
8	256	0,191079	5,233434	10,80395	37,79498	33,18098
8	128	0,15489	6,45619	16,1552	36,04768	31,43368
8	64	0,111638	8,957504	24,60652	34,22031	29,6063
8	32	0,091278	10,95549	34,69823	32,72773	28,11373
8	16	0,040465	24,71249	50,41061	31,10559	26,49158
8	8	0,026284	38,04643	140,4574	26,65536	22,04136
8	4	0,01436	69,63952	252,7536	24,10383	19,48983
8	2	0,007144	139,973	569,2647	20,57766	15,96366

Таблица 5. Некоторые оценки GIF-сжатия изображения «4.1.05.bmp».

Число цветов	Коэффициент сжатия	Фактор сжатия
128	0,171243	5,839653	16,91316	35,84856	31,23455
64	0,123583	8,091754	26,3118	33,9293	29,3153
32	0,100335	9,966653	37,71211	32,36599	27,75199

Среди изображений полученных различными способами сжатия выберем по одному, имеющему допустимое для визуального восприятия качество при минимальном значении коэффициента сжатия. Несмотря на то, что данный выбор носит субъективный характер, он вполне допустим среди прочих сравнений, т.к. позволяет учесть фактор специфики восприятия изображения человеком. Изображения (рис. 9) и численная оценка сжатия различными методами (таблица 6) позволяют произвести сопоставление результатов.

Рис. 9. Изображения, полученные различными способами сжатия (таблица 6):

a.) - сжатие на основе анализа дифференциальной структуры ( таблица 2);

Смотрите также:


«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
Значение, сущность и содержание социально — педагогической деятельности в организации для детей-сирот и детей, оставшихся без попечения родителей
Проактивные методы PR-деятельности российских авиационных компаний «Россия», «Азимут»
__RGR2
__RGR2
_10_Эмиль Золя для эл версии
_11_А. Франс для эл версии
_3 тема - Диффузия