Статья: Метод адаптивной регуляризации статистических данных в геофизике и выделение дополнительной информации из шумовых компонент сигналов

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Метод адаптивной регуляризации статистических данных в геофизике и выделение дополнительной информации из шумовых компонент сигналов

Информационная модель данных акустического каротажа скважин в толще осадочных пород по существу представляет собой аддитивную смесь основной сигнальной функции отклика породного массива C_p(z) и функции помех различной природы C_d(z). Особенностью функции C_p(z) является близость к ступенчатым кривым с точностью до шага дискретизации (границы первого рода с разрывом непрерывности физических свойств на стыках слоев). Функция помех C_d(z) в модели с дискретной (трещинной) структурой пород представляет собой функцию отклика на скачкообразные изменения в стенках скважины в точках ее пересечений с плоскостями разрыва сплошности среды (микрокавернозность) и на аномалии свойств среды, создаваемые этими разрывами. В зависимости от угла наклона плоскости трещины к оси скважины, упругих модулей породного массива, генезиса трещины и технологических параметров процесса бурения значения C_d(z) могут колебаться в широком диапазоне: от самых незначительных до сопоставимых или существенно превышающих значения основной сигнальной функции. Характерной особенностью функции C_d(z) является ее импульсный характер, в общем случае соответствующий пространственному положению трещин с точностью до геометрических параметров приемного устройства. В то же время форма индивидуальных импульсов в этой функции зависит от множества неизвестных и неопределяемых параметров и не может быть использована для оценки параметров трещинных плоскостей. Проблема разделения основной функции стандартного каротажа на две частотные составляющие лежит в основе решения двух принципиально существенных задач:

оценка дискретной структуры осадочной толщи по импульсной функции C_d(z),

исключение импульсных помех и уточнение основной сигнальной функции C_p(z) для целей определения физических свойств породной матрицы слоистой толщи.

При достаточно корректной дискретизации данных исходной информационной модели в методах разделения функций C_p(z) и C_d(z) необходимо учитывать следующие основные особенности:

1. Функция C_p(z) представляет собой произвольную комбинацию смыкающихся прямоугольных импульсов различной амплитуды, свернутых с оператором каротажного зонда. Основная мощность сигналов сосредоточена в низкочастотной части спектра, но затухающие пульсации спектров прямоугольных импульсов заходят в среднечастотный и даже, в зависимости от спектра импульсного отклика зонда, в высокочастотный диапазон спектра.

2. Спектр функции C_d(z) близок к спектру белого шума и практически равномерен в главном частотном диапазоне.

Применение тривиальных частотных фильтров с постоянными параметрами в условиях перекрытия спектров и изменения взаимного частотного расположения информационных составляющих на разных интервалах ствола скважины не может дать устойчивого решения по разделению информационных составляющих сигнала. Наиболее подходящую идею для решения подобных задач можно найти в теории прогностических фильтров и предложить метод адаптивного разделения данных (МАРД). За основу алгоритма разделения данных принят метод, примененный в работе /1/ для регуляризации статистически распределенных данных с адаптацией под динамику полезного (основного) сигнала на основе решения уравнения Байеса. Решение уравнения Байеса /2/ для текущих i - точек обработки массива данных (условно - массива n) при выделении основного информационного сигнала получено в следующем виде:

C_i = _iN_i+ (1-_i) M_i _i, (1)

где: C - значения основного сигнала, N - исходные значения массива n, M - значения дополнительного массива (условно - массива m), которые принимаются в качестве априорно прогнозных значений C, и (1-) - весовые коэффициенты доверия отсчетам N и M, - среднее значение отношения M/N в определенном окне, включающем К_c отсчетов в массивах m и n с центром по текущей i-точке. Значение определяется по выражению:

акустический каротаж скважина сигнальный

_i = D_m (D_N²+ D_m), (2)

где: D_N = N_i²_n² - дисперсия отсчетов N за счет шумовой составляющей, _n- априорное значение шумовой вариации отсчетов в массиве n, D_m = D_M+D_xm- полная дисперсия отсчетов М в К_с - окне, D_M= M²_m² - шумовая дисперсия отсчетов М, _m² - шумовая вариация отсчетов в массиве m, D_xm = M²_x² - дисперсия отсчетов М за счет флюктуаций величины х, которая в общем случае также является величиной флюктуирующей с относительным среднеквадратическим значением флюктуаций _x.

Для использования выражения (1) требуется дополнительный информационный массив m. При наличии корреляции между значениями основной компоненты сигнала в массивах n и m дополнительный массив m используется в решении уравнения Байеса для прогнозирования значений С_iс определенной априорной вероятностью распределения значений С в массиве n. Можно применить, как минимум, два метода формирования дополнительного массива m:

1. По массивам данных параллельных измерений каких-либо других геофизических параметров, значения которых коррелированны с основным массивом данных n либо в целом по пространству измерений, либо в определенном скользящем интервале К_с сравнения данных. К таким массивам относятся, например, предварительные каротажные измерения в процессе бурения скважин, измерения другим типом приемного устройства, другим методом каротажа и т.п.

2. При единичной каротажной диаграмме дополнительный массив m может быть сформирован усреднением (низкочастотной фильтрацией) основного массива n в определенном скользящем окне усреднения данных К_s, что эквивалентно прогнозированию значений С_i по окрестностям i - точки.

Анализ выражений (1,2) позволяет дать оценку эффекта регуляризации данных основного массива n при использовании дополнительной информации из статистически независимого от n массива m в следующем виде:

1. При const имеет место _х² 0, D_xm 0 и дисперсия отсчетов в массиве m определяется только статистикой отсчетов:

D_m D_M = M²_m², N²² М², _m²(_n²+_m²), (3)

что соответствует определению С по двум независимым измерениям и эффект использования дополнительной информации максимален. Так, при = 1 и _n _mимеет место D_c D_N+ (1-)²D_M при 0.5 и эффект регуляризации = D_N/D_c 2, при этом шумовые вариации массива n уменьшаются в ~ 1.4 раза.

2. В общем случае D_xm 0, при этом D_m > D_М и положительный эффект снижается. В пределе: _x , D_xm , D_m , 1, С N, _c_nи эффект регуляризации полностью вырождается. Во всех остальных случаях > 1 и _c< _n. Отсюда следует, что при наличии коррелированной информации в массиве М положительный эффект, в той или иной мере, всегда имеет место.

Аналогичный эффект будет иметь место и при формировании отсчетов M_i по окрестностям текущих точек обработки данных путем определения их среднего значения (низкочастотное сглаживание массива n). Предварительное низкочастотное сглаживание может применяться и для статистически независимого дополнительного массива m, что будет повышать достоверность прогнозных отсчетов и увеличивать глубину регуляризации, если это сглаживание при регуляризации по формулам (1,2) не сказывается на изменении формы основного сигнала. Последнее определяется соотношением частотных спектров основного сигнала и оператора сглаживания.

Для практического использования информации из дополнительных массивов m необходимо задать априорное значение шумовой вариации _nотсчетов в массиве n, установить значение и дисперсию D_m, при этом должно быть известно значение _х- относительной средней квадратической флюктуации величины х.

Определение значений и _х по зарегистрированным массивам данных не представляет затруднений как в целом по пространству измерений, так и в виде распределений в скользящем окне усреднения данных. Последнее эквивалентно приведению D_xm 0 для текущей точки обработки данных по информации ее ближайших окрестностей и допустимо, если спектр величины х по пространству измерений более низкочастотный, чем спектр полезных сигналов.

Таблица 1. Статистика МАРД постоянного поля.

(Массив = 9.5, D_N= 3.03. Массив = 16, D_M= 8.06.)

K_c	K_s	D_c		K_c	K_s	D_c
3	1	1,87	1,62	11	3	1,17	2,59
5	1	1,75	1,73	11	5	1,08	2,81
11	1	1,69	1,79	11	11	1,00	3,03
21	1	1,61	1,88	11	21	0,94	3,22
3	3	1,31	2,31	3	11	1,37	2,21
5	5	1,11	2,73	5	11	1,08	2,81
21	21	0,86	3,52	21	11	0,93	3,26

В таблице 1 приведены результаты обработки по формулам (1,2) двух статистически независимых и постоянных по средним значениям массивов n и m (модель постоянного поля) при различных установках алгоритма МАРД по скользящему окну К_с расчета текущих значений и D_m по массиву m. Количество отсчетов в каждом массиве - 1000. Наложенный на средние значения шум имеет равномерное распределение по амплитудам. Определение прогнозных отсчетов М_i по массиву m проводилось со сглаживанием отсчетов в окне K_s низкочастотного цифрового фильтра (вариант без сглаживания при K_s = 1). В качестве низкочастотного фильтра используется (здесь и в дальнейшем) весовая функция Лапласа-Гаусса.

Как видно из данных таблицы, практические результаты МАРД достаточно хорошо совпадают с ожидаемыми. В спокойных по динамике полях вариант счета значений и D_m по сглаженному массиву m можно считать предпочтительным. Такой же эффект, в принципе, может достигаться и непосредственным введением дополнительного коэффициента веса в выражение (2) в качестве множителя для значения D_m, что позволит осуществлять внешнее управление глубиной регуляризации.

Оценка МАРД по сохранению формы основного сигнала проводилась на фильтрации сигналов n предельной частотной формы - в виде прямоугольных импульсов. При установке МАРД без усреднения данных по массиву m (окно К_s = 1) при любых значениях окна К_с выходной массив с без искажений повторяет массив n, т.е. полностью сохраняет его частотные характеристики. Сглаживание прогнозных значений М_i при K_s> 1 приводит к появлению некоторого сглаживания формы прямоугольных импульсов на угловых переходах сигнала, которое зависит от соотношения текущих значений D_N и D_m на переходах. При регуляризации реальных данных это сглаживание основного сигнала, в первых, мало существенно, так как много меньше величины шумовых флюктуаций сигнала, и во вторых, практически не имеет места (как и форма реальных сигналов в виде прямоугольных импульсов).

Смотрите также:


«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
Значение, сущность и содержание социально — педагогической деятельности в организации для детей-сирот и детей, оставшихся без попечения родителей
Проактивные методы PR-деятельности российских авиационных компаний «Россия», «Азимут»
__RGR2
__RGR2
_11_А. Франс для эл версии
_3 тема - Диффузия
_индив анализ данных