Материал: Исследование статистической зависимости изменения свойств коллектора и пластовых флюидов в результате разработки нефтяных месторождений

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Рис. 3 Гистограмма нормированных относительных частот по X

Полигоны для признаков X и Y


Рис. 6 Полигон нормированных относительных частот по X

Рис. 7 Полигон нормированных относительных частот по Y

Эмпирические функции для признаков X и Y


Рис. 8 Эмпирическая функция по X

Рис. 9 Эмпирическая функция по Y

Линейная регрессия


Уравнение линейной регрессии представляет собой уравнение прямой, аппроксимирующей (приблизительно описывающей) зависимость между случайными величинами X и Y.

Рассмотрим случайную двумерную величину (X, Y), где  - зависимые случайные величины. Представим одну из величин как функцию другой. Ограничимся приближенным представлением величины  в виде линейной функции величины X:


где  - параметры, подлежащие определению. Это можно сделать различными способами: наиболее употребительный из них - метод наименьших квадратов. Функцию g(x) называют среднеквадратической регрессией Y на X. Функцию g(x) называют среднеквадратической регрессией Y на X.


где F - суммарное квадратичное отклонение.

Подберем a и b так, чтобы сумма квадратов отклонений была минимальной. Для того, чтобы найти коэффициенты a и b, при которых F достигает минимального значения, приравняем частные производные к нулю:


Находим a и b. Выполнив элементарные преобразования, получим систему двух линейных уравнений относительно a и b:

,

где - объём выборки.

В нашем случае A = 3888; B =549; C =8224; D = 1182;N = 100.

Найдём a и b из этой линейной. Получим стационарную точку  для  где 1,9884; 0,8981.

Следовательно, уравнение примет вид:

y = 1,9884x + 0,8981

Рис. 10 Линейная регрессия y=f(x)

Параболическая регрессия


Найдем по данным наблюдений выборочное уравнение кривой линии среднеквадратичной (параболической в нашем случае) регрессии. Воспользуемся методом наименьших квадратов для определения p, q, r.

Ограничимся представлением величины Y в виде параболической функции величины X:


где p, q, и r - параметры, подлежащие определению. Это можно сделать с помощью метода наименьших квадратов.

Подберем параметры p, q и r так, чтобы сумма квадратов отклонений была минимальной. Так как каждое отклонение зависит от отыскиваемых параметров, то и сумма квадратов отклонений есть функция F этих параметров:


Для отыскания минимума приравняем к нулю соответствующие частные производные:



Находим p, q и r. Выполнив элементарные преобразования, получим систему трех линейных уравнений относительно p, q и r:


Решая эту систему методом обратной матрицы, получим: p = -0,0085; q = 2,0761;=0,7462.

Следовательно, уравнение параболической регрессии примет вид:

y = -0,0085x2 + 2,0761x + 0,7462

Построим график параболической регрессии. Для удобства наблюдения график регрессии будет на фоне диаграммы рассеивания (см. рисунок 13).

Рис. 13 Параболическая регрессия y=f(x)

Теперь изобразим линии линейной регрессии  и параболической регрессии на одной диаграмме, для наглядного сравнения (см. рисунок 14).

Рис. 14 Параболическая и линейная регрессии

Линейная регрессия изображена красным цветом, а параболическая - синим. По диаграмме видно, что отличие в данном случае больше, чем при сравнении двух линий линейных регрессий. Требуется дальнейшее исследование, какая же регрессия лучше выражает зависимость между x и y, т. е. какой тип зависимости между x и y.

Проверка гипотезы о нормальном распределении признака Х


Для проверки гипотезы о нормальном распределении признака Х, нам потребуется вычислить  - теоретические частоты нормального распределения. Как найти теоретические частоты, если предполагается, что генеральная совокупность распределена нормально? Ниже приведён один из способов решения этой задачи.

1.       Весь интервал наблюдаемых значений Х(выборки объема n) делаят на s частичных интервалов) (табл. 2). Находят середины частичных интервалов ; в качестве частоты  варианты  принимают число вариант, которые попали в i-й интервал. В итоге получают последовательность равноотстоящих вариант и соответствующих им частот:

В частности для исходной выборки(табл. 1) , где s=7:

2.       Вычисляют выборочную среднюю  и выборочное среднее квадратическое отклонение .

, 2,874938;

3.       Нормируют случайную величину X, т.е. переходят к величине Z= и вычисляют концы интервалов ():

,

Причем наименьшее значение , пологают равным -∞, а наибольшее, , полагают равным ∞.

.        Вычисляют теоретические вероятность  попадания X в интервалы ) по равенству (Ф(z) - функция Лапласа)


и, наконец, находят искомые теоретические частоты

Для проверки гипотезы о предполагаемом законе неизвестного распределения, проверим нулевую гипотезу, при помощи специально подобранной случайной величины - критерий согласия.

Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения. Для нашего случая, ограничимся описанием применения критерия Пирсона к проверке гипотезы о нормальном распределении генеральной совокупности. Поэтому будем сравнивать эмпирические и теоретические частоты.

Для проверки нулевой гипотезы , вычислим наблюдаемое значение критерия:

,;

и по таблице критических точек распределения , по уровню значимости α=0,01; α=0,025; α=0,05; и числу степеней свободы k=s-3=4 (s- число частичных интервалов) найти критическую точку .

Если < - нет оснований отвергнуть нулевую гипотезу.

=13,3;=11,1;=9,5;

Так как  - нет оснований отвергнуть нулевую гипотезу. Т.е., расхождение эмпирических и теоретических частот незначимое. Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.

Метод доверительных интервалов


Оценка  как и , , , , , ,  являются точечными оценками, но наряду с ними при изучении выборки используются интервальные оценки, так как полезно не только построить оценку, но и охарактеризовать величину возможной при её использовании ошибки. Интервальной называют оценку, которая определяется двумя числами - концами интервала. Интервальные оценки позволяют установить точность и надежность оценок. Величина  характеризует точность оценки, если выполняется неравенство , где  - оценка некоторого параметра  генеральной совокупности. Надежностью (доверительной вероятностью) оценки по  называют вероятность , c которой осуществляется неравенство . Наиболее часто задают надежность, равную 0,95; 0,9; 0,999. Доверительным называют интервал , , который покрывает известный параметр с заданной надежностью .

Рассмотрим доверительный интервал для математического ожидания генеральной совокупности. Известен объем выборки n = 100;  исправленное выборочное среднеквадратичное отклонение 2,88942.

Найдем доверительный интервал для оценки неизвестного математического ожидания по X с надежностями  = 0,95; 0,99; 0,999.

Если наблюдаемая случайная величина имеет нормальное распределение, но ее среднеквадратичное отклонение нам неизвестно, то мы можем построить доверительный интервал по распределению Стьюдента с  степенями свободы, то есть должно быть справедливо неравенство:

;

где  определим по заданным  и . Это соотношение выражает доверительный интервал для , определяемый с помощью распределения Стьюдента. Найдем доверительные интервалы для математического ожидания X. При ; : 4,907439 <  < 6,053961.

При ;  4,721649 <  < 6,239751.

При ;  4,5 <  < 6,46.

Заключение


Отмечено, что изменение фильтрационно-емкостных свойств пористой среды при воздействии различными термодинамическими полями (в частности, в результате заводнения с добавкой различных химических агентов) приводит к практически важным последствиям. Наиболее ярко проявляемым процессом является снижение (повышение) начального пластового давления в результате работы добывающих и нагнетательных скважин. К изменению ФЕС могут привести нарушение равновесия минерального состава вод (отложение солей в пористой среде, набухание глинистых включений, размыв и перенос цемента и зерен коллектора и др.), изменение температуры пласта (при закачке холодной воды, разгазировании нефти, химических реакциях, при тепловом воздействии на коллектор).

Исследование и оценка данных фактов особенно важны для разработки неоднородных многопластовых месторождений нефти и газа, находящихся в поздней стадии. Для большинства таких месторождений разработка начиналась с весьма высокими темпами разбуривания и добычи нефти. При этом система поддержания пластового давления (ППД) вводилась через несколько лет, а иногда и десятилетий с момента массового разбуривания месторождения. В результате происходило существенное снижение начального пластового давления. После ввода системы ППД снижение пластового давления в малопроницаемых слоях (пластах) многопластовых объектов продолжалось и далее, поскольку при совместной с высокопроницаемыми пластами закачке воды они под нагнетание не осваивались. При разукрупнении объектов и выделении низкопроницаемых пластов в отдельные объекты удавалось активизировать добычу нефти из них, однако при этом возникали новые проблемы, в частности, при освоении их под закачку и эксплуатации. Изменение пластового давления приводило к изменению внутрипорового давления и, как результат этого, к изменению эффективного давления на породу. Это в свою очередь изменяло ФЕС коллектора, причем восстановление начального пластового давления не сопровождалось полным восстановлением первоначальных параметров ФЕС. Таким образом, налицо необратимые упругие и неупругие (пластичные) деформации коллектора .