Метод адаптивной регуляризации статистических данных в геофизике и выделение дополнительной информации из шумовых компонент сигналов
Информационная модель данных акустического каротажа скважин в толще осадочных пород по существу представляет собой аддитивную смесь основной сигнальной функции отклика породного массива Cp(z) и функции помех различной природы Cd(z). Особенностью функции Cp(z) является близость к ступенчатым кривым с точностью до шага дискретизации (границы первого рода с разрывом непрерывности физических свойств на стыках слоев). Функция помех Cd(z) в модели с дискретной (трещинной) структурой пород представляет собой функцию отклика на скачкообразные изменения в стенках скважины в точках ее пересечений с плоскостями разрыва сплошности среды (микрокавернозность) и на аномалии свойств среды, создаваемые этими разрывами. В зависимости от угла наклона плоскости трещины к оси скважины, упругих модулей породного массива, генезиса трещины и технологических параметров процесса бурения значения Cd(z) могут колебаться в широком диапазоне: от самых незначительных до сопоставимых или существенно превышающих значения основной сигнальной функции. Характерной особенностью функции Cd(z) является ее импульсный характер, в общем случае соответствующий пространственному положению трещин с точностью до геометрических параметров приемного устройства. В то же время форма индивидуальных импульсов в этой функции зависит от множества неизвестных и неопределяемых параметров и не может быть использована для оценки параметров трещинных плоскостей. Проблема разделения основной функции стандартного каротажа на две частотные составляющие лежит в основе решения двух принципиально существенных задач:
оценка дискретной структуры осадочной толщи по импульсной функции Cd (z),
исключение импульсных помех и уточнение основной сигнальной функции Cp(z) для целей определения физических свойств породной матрицы слоистой толщи.
При достаточно корректной дискретизации данных исходной информационной модели в методах разделения функций Cp(z) и Cd(z) необходимо учитывать следующие основные особенности:
1. Функция Cp(z) представляет собой произвольную комбинацию смыкающихся прямоугольных импульсов различной амплитуды, свернутых с оператором каротажного зонда. Основная мощность сигналов сосредоточена в низкочастотной части спектра, но затухающие пульсации спектров прямоугольных импульсов заходят в среднечастотный и даже, в зависимости от спектра импульсного отклика зонда, в высокочастотный диапазон спектра.
2. Спектр функции Cd(z) близок к спектру белого шума и практически равномерен в главном частотном диапазоне.
Применение тривиальных частотных фильтров с постоянными параметрами в условиях перекрытия спектров и изменения взаимного частотного расположения информационных составляющих на разных интервалах ствола скважины не может дать устойчивого решения по разделению информационных составляющих сигнала. Наиболее подходящую идею для решения подобных задач можно найти в теории прогностических фильтров и предложить метод адаптивного разделения данных (МАРД). За основу алгоритма разделения данных принят метод, примененный в работе /1/ для регуляризации статистически распределенных данных с адаптацией под динамику полезного (основного) сигнала на основе решения уравнения Байеса. Решение уравнения Байеса /2/ для текущих i - точек обработки массива данных (условно - массива n) при выделении основного информационного сигнала получено в следующем виде:
Ci = i Ni + (1-i) Mi i, (1)
где: C - значения основного сигнала, N - исходные значения массива n, M - значения дополнительного массива (условно - массива m), которые принимаются в качестве априорно прогнозных значений C, и (1-) - весовые коэффициенты доверия отсчетам N и M, - среднее значение отношения M/N в определенном окне, включающем Кc отсчетов в массивах m и n с центром по текущей i-точке. Значение определяется по выражению:
акустический каротаж скважина сигнальный
i = Dm (DN 2 + Dm), (2)
где: DN = Ni2n2 - дисперсия отсчетов N за счет шумовой составляющей, n - априорное значение шумовой вариации отсчетов в массиве n, Dm = DM+Dxm - полная дисперсия отсчетов М в Кс - окне, DM = M2m2 - шумовая дисперсия отсчетов М, m2 - шумовая вариация отсчетов в массиве m, Dxm = M2x2 - дисперсия отсчетов М за счет флюктуаций величины х, которая в общем случае также является величиной флюктуирующей с относительным среднеквадратическим значением флюктуаций x.
Для использования выражения (1) требуется дополнительный информационный массив m. При наличии корреляции между значениями основной компоненты сигнала в массивах n и m дополнительный массив m используется в решении уравнения Байеса для прогнозирования значений Сi с определенной априорной вероятностью распределения значений С в массиве n. Можно применить, как минимум, два метода формирования дополнительного массива m:
1. По массивам данных параллельных измерений каких-либо других геофизических параметров, значения которых коррелированны с основным массивом данных n либо в целом по пространству измерений, либо в определенном скользящем интервале Кс сравнения данных. К таким массивам относятся, например, предварительные каротажные измерения в процессе бурения скважин, измерения другим типом приемного устройства, другим методом каротажа и т.п.
2. При единичной каротажной диаграмме дополнительный массив m может быть сформирован усреднением (низкочастотной фильтрацией) основного массива n в определенном скользящем окне усреднения данных Кs, что эквивалентно прогнозированию значений Сi по окрестностям i - точки.
Анализ выражений (1,2) позволяет дать оценку эффекта регуляризации данных основного массива n при использовании дополнительной информации из статистически независимого от n массива m в следующем виде:
1. При const имеет место х2 0, Dxm 0 и дисперсия отсчетов в массиве m определяется только статистикой отсчетов:
Dm DM = M2m2, N22 М2, m2 (n2+m2), (3)
что соответствует определению С по двум независимым измерениям и эффект использования дополнительной информации максимален. Так, при = 1 и n m имеет место Dc DN + (1-)2DM при 0.5 и эффект регуляризации = DN/Dc 2, при этом шумовые вариации массива n уменьшаются в ~ 1.4 раза.
2. В общем случае Dxm 0, при этом Dm > DМ и положительный эффект снижается. В пределе: x , Dxm , Dm , 1, С N, c n и эффект регуляризации полностью вырождается. Во всех остальных случаях > 1 и c < n. Отсюда следует, что при наличии коррелированной информации в массиве М положительный эффект, в той или иной мере, всегда имеет место.
Аналогичный эффект будет иметь место и при формировании отсчетов Mi по окрестностям текущих точек обработки данных путем определения их среднего значения (низкочастотное сглаживание массива n). Предварительное низкочастотное сглаживание может применяться и для статистически независимого дополнительного массива m, что будет повышать достоверность прогнозных отсчетов и увеличивать глубину регуляризации, если это сглаживание при регуляризации по формулам (1,2) не сказывается на изменении формы основного сигнала. Последнее определяется соотношением частотных спектров основного сигнала и оператора сглаживания.
Для практического использования информации из дополнительных массивов m необходимо задать априорное значение шумовой вариации n отсчетов в массиве n, установить значение и дисперсию Dm, при этом должно быть известно значение х - относительной средней квадратической флюктуации величины х.
Определение значений и х по зарегистрированным массивам данных не представляет затруднений как в целом по пространству измерений, так и в виде распределений в скользящем окне усреднения данных. Последнее эквивалентно приведению Dxm 0 для текущей точки обработки данных по информации ее ближайших окрестностей и допустимо, если спектр величины х по пространству измерений более низкочастотный, чем спектр полезных сигналов.
Таблица 1. Статистика МАРД постоянного поля.
(Массив = 9.5, DN = 3.03. Массив = 16, DM = 8.06.)
|
Kc |
Ks |
Dc |
Kc |
Ks |
Dc |
|||
|
3 |
1 |
1,87 |
1,62 |
11 |
3 |
1,17 |
2,59 |
|
|
5 |
1 |
1,75 |
1,73 |
11 |
5 |
1,08 |
2,81 |
|
|
11 |
1 |
1,69 |
1,79 |
11 |
11 |
1,00 |
3,03 |
|
|
21 |
1 |
1,61 |
1,88 |
11 |
21 |
0,94 |
3,22 |
|
|
3 |
3 |
1,31 |
2,31 |
3 |
11 |
1,37 |
2,21 |
|
|
5 |
5 |
1,11 |
2,73 |
5 |
11 |
1,08 |
2,81 |
|
|
21 |
21 |
0,86 |
3,52 |
21 |
11 |
0,93 |
3,26 |
В таблице 1 приведены результаты обработки по формулам (1,2) двух статистически независимых и постоянных по средним значениям массивов n и m (модель постоянного поля) при различных установках алгоритма МАРД по скользящему окну Кс расчета текущих значений и Dm по массиву m. Количество отсчетов в каждом массиве - 1000. Наложенный на средние значения шум имеет равномерное распределение по амплитудам. Определение прогнозных отсчетов Мi по массиву m проводилось со сглаживанием отсчетов в окне Ks низкочастотного цифрового фильтра (вариант без сглаживания при Ks = 1). В качестве низкочастотного фильтра используется (здесь и в дальнейшем) весовая функция Лапласа-Гаусса.
Как видно из данных таблицы, практические результаты МАРД достаточно хорошо совпадают с ожидаемыми. В спокойных по динамике полях вариант счета значений и Dm по сглаженному массиву m можно считать предпочтительным. Такой же эффект, в принципе, может достигаться и непосредственным введением дополнительного коэффициента веса в выражение (2) в качестве множителя для значения Dm, что позволит осуществлять внешнее управление глубиной регуляризации.
Оценка МАРД по сохранению формы основного сигнала проводилась на фильтрации сигналов n предельной частотной формы - в виде прямоугольных импульсов. При установке МАРД без усреднения данных по массиву m (окно Кs = 1) при любых значениях окна Кс выходной массив с без искажений повторяет массив n, т.е. полностью сохраняет его частотные характеристики. Сглаживание прогнозных значений Мi при Ks > 1 приводит к появлению некоторого сглаживания формы прямоугольных импульсов на угловых переходах сигнала, которое зависит от соотношения текущих значений DN и Dm на переходах. При регуляризации реальных данных это сглаживание основного сигнала, в первых, мало существенно, так как много меньше величины шумовых флюктуаций сигнала, и во вторых, практически не имеет места (как и форма реальных сигналов в виде прямоугольных импульсов).