Статья: Метод адаптивной регуляризации статистических данных в геофизике и выделение дополнительной информации из шумовых компонент сигналов

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Метод адаптивной регуляризации статистических данных в геофизике и выделение дополнительной информации из шумовых компонент сигналов

Информационная модель данных акустического каротажа скважин в толще осадочных пород по существу представляет собой аддитивную смесь основной сигнальной функции отклика породного массива Cp(z) и функции помех различной природы Cd(z). Особенностью функции Cp(z) является близость к ступенчатым кривым с точностью до шага дискретизации (границы первого рода с разрывом непрерывности физических свойств на стыках слоев). Функция помех Cd(z) в модели с дискретной (трещинной) структурой пород представляет собой функцию отклика на скачкообразные изменения в стенках скважины в точках ее пересечений с плоскостями разрыва сплошности среды (микрокавернозность) и на аномалии свойств среды, создаваемые этими разрывами. В зависимости от угла наклона плоскости трещины к оси скважины, упругих модулей породного массива, генезиса трещины и технологических параметров процесса бурения значения Cd(z) могут колебаться в широком диапазоне: от самых незначительных до сопоставимых или существенно превышающих значения основной сигнальной функции. Характерной особенностью функции Cd(z) является ее импульсный характер, в общем случае соответствующий пространственному положению трещин с точностью до геометрических параметров приемного устройства. В то же время форма индивидуальных импульсов в этой функции зависит от множества неизвестных и неопределяемых параметров и не может быть использована для оценки параметров трещинных плоскостей. Проблема разделения основной функции стандартного каротажа на две частотные составляющие лежит в основе решения двух принципиально существенных задач:

оценка дискретной структуры осадочной толщи по импульсной функции Cd (z),

исключение импульсных помех и уточнение основной сигнальной функции Cp(z) для целей определения физических свойств породной матрицы слоистой толщи.

При достаточно корректной дискретизации данных исходной информационной модели в методах разделения функций Cp(z) и Cd(z) необходимо учитывать следующие основные особенности:

1. Функция Cp(z) представляет собой произвольную комбинацию смыкающихся прямоугольных импульсов различной амплитуды, свернутых с оператором каротажного зонда. Основная мощность сигналов сосредоточена в низкочастотной части спектра, но затухающие пульсации спектров прямоугольных импульсов заходят в среднечастотный и даже, в зависимости от спектра импульсного отклика зонда, в высокочастотный диапазон спектра.

2. Спектр функции Cd(z) близок к спектру белого шума и практически равномерен в главном частотном диапазоне.

Применение тривиальных частотных фильтров с постоянными параметрами в условиях перекрытия спектров и изменения взаимного частотного расположения информационных составляющих на разных интервалах ствола скважины не может дать устойчивого решения по разделению информационных составляющих сигнала. Наиболее подходящую идею для решения подобных задач можно найти в теории прогностических фильтров и предложить метод адаптивного разделения данных (МАРД). За основу алгоритма разделения данных принят метод, примененный в работе /1/ для регуляризации статистически распределенных данных с адаптацией под динамику полезного (основного) сигнала на основе решения уравнения Байеса. Решение уравнения Байеса /2/ для текущих i - точек обработки массива данных (условно - массива n) при выделении основного информационного сигнала получено в следующем виде:

Ci = i Ni + (1-i) Mi i, (1)

где: C - значения основного сигнала, N - исходные значения массива n, M - значения дополнительного массива (условно - массива m), которые принимаются в качестве априорно прогнозных значений C, и (1-) - весовые коэффициенты доверия отсчетам N и M, - среднее значение отношения M/N в определенном окне, включающем Кc отсчетов в массивах m и n с центром по текущей i-точке. Значение определяется по выражению:

акустический каротаж скважина сигнальный

i = Dm (DN 2 + Dm), (2)

где: DN = Ni2n2 - дисперсия отсчетов N за счет шумовой составляющей, n - априорное значение шумовой вариации отсчетов в массиве n, Dm = DM+Dxm - полная дисперсия отсчетов М в Кс - окне, DM = M2m2 - шумовая дисперсия отсчетов М, m2 - шумовая вариация отсчетов в массиве m, Dxm = M2x2 - дисперсия отсчетов М за счет флюктуаций величины х, которая в общем случае также является величиной флюктуирующей с относительным среднеквадратическим значением флюктуаций x.

Для использования выражения (1) требуется дополнительный информационный массив m. При наличии корреляции между значениями основной компоненты сигнала в массивах n и m дополнительный массив m используется в решении уравнения Байеса для прогнозирования значений Сi с определенной априорной вероятностью распределения значений С в массиве n. Можно применить, как минимум, два метода формирования дополнительного массива m:

1. По массивам данных параллельных измерений каких-либо других геофизических параметров, значения которых коррелированны с основным массивом данных n либо в целом по пространству измерений, либо в определенном скользящем интервале Кс сравнения данных. К таким массивам относятся, например, предварительные каротажные измерения в процессе бурения скважин, измерения другим типом приемного устройства, другим методом каротажа и т.п.

2. При единичной каротажной диаграмме дополнительный массив m может быть сформирован усреднением (низкочастотной фильтрацией) основного массива n в определенном скользящем окне усреднения данных Кs, что эквивалентно прогнозированию значений Сi по окрестностям i - точки.

Анализ выражений (1,2) позволяет дать оценку эффекта регуляризации данных основного массива n при использовании дополнительной информации из статистически независимого от n массива m в следующем виде:

1. При const имеет место х2 0, Dxm 0 и дисперсия отсчетов в массиве m определяется только статистикой отсчетов:

Dm DM = M2m2, N22 М2, m2 (n2+m2), (3)

что соответствует определению С по двум независимым измерениям и эффект использования дополнительной информации максимален. Так, при = 1 и n m имеет место Dc DN + (1-)2DM при 0.5 и эффект регуляризации = DN/Dc 2, при этом шумовые вариации массива n уменьшаются в ~ 1.4 раза.

2. В общем случае Dxm 0, при этом Dm > DМ и положительный эффект снижается. В пределе: x , Dxm , Dm , 1, С N, c n и эффект регуляризации полностью вырождается. Во всех остальных случаях > 1 и c < n. Отсюда следует, что при наличии коррелированной информации в массиве М положительный эффект, в той или иной мере, всегда имеет место.

Аналогичный эффект будет иметь место и при формировании отсчетов Mi по окрестностям текущих точек обработки данных путем определения их среднего значения (низкочастотное сглаживание массива n). Предварительное низкочастотное сглаживание может применяться и для статистически независимого дополнительного массива m, что будет повышать достоверность прогнозных отсчетов и увеличивать глубину регуляризации, если это сглаживание при регуляризации по формулам (1,2) не сказывается на изменении формы основного сигнала. Последнее определяется соотношением частотных спектров основного сигнала и оператора сглаживания.

Для практического использования информации из дополнительных массивов m необходимо задать априорное значение шумовой вариации n отсчетов в массиве n, установить значение и дисперсию Dm, при этом должно быть известно значение х - относительной средней квадратической флюктуации величины х.

Определение значений и х по зарегистрированным массивам данных не представляет затруднений как в целом по пространству измерений, так и в виде распределений в скользящем окне усреднения данных. Последнее эквивалентно приведению Dxm 0 для текущей точки обработки данных по информации ее ближайших окрестностей и допустимо, если спектр величины х по пространству измерений более низкочастотный, чем спектр полезных сигналов.

Таблица 1. Статистика МАРД постоянного поля.

(Массив = 9.5, DN = 3.03. Массив = 16, DM = 8.06.)

Kc

Ks

Dc

Kc

Ks

Dc

3

1

1,87

1,62

11

3

1,17

2,59

5

1

1,75

1,73

11

5

1,08

2,81

11

1

1,69

1,79

11

11

1,00

3,03

21

1

1,61

1,88

11

21

0,94

3,22

3

3

1,31

2,31

3

11

1,37

2,21

5

5

1,11

2,73

5

11

1,08

2,81

21

21

0,86

3,52

21

11

0,93

3,26

В таблице 1 приведены результаты обработки по формулам (1,2) двух статистически независимых и постоянных по средним значениям массивов n и m (модель постоянного поля) при различных установках алгоритма МАРД по скользящему окну Кс расчета текущих значений и Dm по массиву m. Количество отсчетов в каждом массиве - 1000. Наложенный на средние значения шум имеет равномерное распределение по амплитудам. Определение прогнозных отсчетов Мi по массиву m проводилось со сглаживанием отсчетов в окне Ks низкочастотного цифрового фильтра (вариант без сглаживания при Ks = 1). В качестве низкочастотного фильтра используется (здесь и в дальнейшем) весовая функция Лапласа-Гаусса.

Как видно из данных таблицы, практические результаты МАРД достаточно хорошо совпадают с ожидаемыми. В спокойных по динамике полях вариант счета значений и Dm по сглаженному массиву m можно считать предпочтительным. Такой же эффект, в принципе, может достигаться и непосредственным введением дополнительного коэффициента веса в выражение (2) в качестве множителя для значения Dm, что позволит осуществлять внешнее управление глубиной регуляризации.

Оценка МАРД по сохранению формы основного сигнала проводилась на фильтрации сигналов n предельной частотной формы - в виде прямоугольных импульсов. При установке МАРД без усреднения данных по массиву m (окно Кs = 1) при любых значениях окна Кс выходной массив с без искажений повторяет массив n, т.е. полностью сохраняет его частотные характеристики. Сглаживание прогнозных значений Мi при Ks > 1 приводит к появлению некоторого сглаживания формы прямоугольных импульсов на угловых переходах сигнала, которое зависит от соотношения текущих значений DN и Dm на переходах. При регуляризации реальных данных это сглаживание основного сигнала, в первых, мало существенно, так как много меньше величины шумовых флюктуаций сигнала, и во вторых, практически не имеет места (как и форма реальных сигналов в виде прямоугольных импульсов).