К оглавлению

УДК 553.982:519.2(479.24)

Классификация и распознавание образов нефтей месторождений Нижнекуринской впадины и Бакинского архипелага

В.З. СИМХАЕВ, В.О. БОГОПОЛЬСКИЙ (Азинефтехим)

В работе [2] отмечалось, что в распознавании образов нефтей наиболее информативными признаками являются групповой состав и структурные особенности высокомолекулярных соединений. Эти данные о нефтях Нижнекуринской впадины и Бакинского архипелага мы использовали в расчетах при решении поставленной задачи.

Ввиду того, что расчеты осуществлялись на ЭВМ “Наири-2” и для вычисления программа предусматривала не более девяти главных компонент, информативность признаков нами определялась по С. Кульбаку [4]. В последующем расчеты велись по наиболее информативным девяти признакам (табл. 1), величины которых учитывались при анализе результатов распознавания образов нефтей в качестве дополнительной информации для окончательного принятия решения. Таким образом, в расчетах использовались признаки: 1) асфальтены; 2) парафино-нафтеновые УВ; 3) спиртобензольные смолы; 4) молекулярная масса парафино-нафтеновых УВ; 5) число колец, приходящихся на нафтеновые УВ; 6) молекулярная масса ароматических УВ; 7) показатель преломления ароматических УВ; 8) число атомов углерода, приходящихся на кольца ароматических УВ; 9) число колец, приходящихся на ароматические УВ.

В статье ставится задача классификации и распознавания принадлежности изучаемых нефтей в зависимости от приведенных параметров к тому или иному классу месторождений.

В качестве классов рассматривались нефти, взятые из скважин Нижнекуринской впадины и Бакинского архипелага.

Задачу классификации можно рассматривать как поиск решения, позволяющего наилучшим образом разделить множество объектов, характеризующихся многомерными наблюдениями, на более мелкие однородные группы [1].

В такой постановке задача классификации коренным образом отличается от задачи распознавания, заключающейся в классификационном отнесении рассматриваемого объекта к одной из заданных групп, число которых заранее определено. Поэтому разобьем задачу на две: 1) при помощи дендрограммы произведем классификацию месторождений; 2) методом главных компонент проверим правильность классификации и найдем функции, позволяющие распознавать вновь предъявленные объекты.

В работе [3] отмечено, что коэффициенту корреляции можно придать геометрический смысл, интерпретируя его как косинус угла между двумя векторами в n-мерном евклидовом пространстве. Проведя преобразование arccos получим новую величину, которую можно рассматривать как меру расстояния между векторами. При этом становится возможным представить результаты группировки в иерархической форме. В иерархических схемах группировки наиболее распространенной формой графического представления является дендрограмма, где объекты располагаются по иерархическим уровням так, чтобы подчеркнуть их взаимное сходство на основе измеряемых свойств.

Известно, что многомерные объекты обычно характеризуются параметрами, измеряемыми различными единицами. Поэтому для сопоставимости измерений проводим нормировку. В качестве нормировочного коэффициента принимаем среднеквадратичное отклонение.

Исходные данные представлены в табл. 1 . Каждое значение таблицы xij рассматриваем как величину j-го параметра i-й скважины.

Коэффициент корреляции между m-м и n-м объектами будет равен

где i=l,2,..., m; n - номер скважины; j=1,2,..., k, k - число параметров; sm, sn - среднеквадратическое отклонение параметров m-й и n-й скважин.

Исходные предположения рассматриваемого метода состоят в том, что каждый объект в начале процедуры представляет собой самостоятельную группу. На первой стадии группировки находятся два наиболее сходных объекта, которые затем объединяются в единую группу, после чего остается (k - 1) групп. Значение вычисленной меры сходства для двух наиболее близких объектов рассматривается в дальнейшем как величина, характеризующая иерархический уровень первой стадии группировки. На каждой последующей стадии число групп сокращается на одну за счет объединения двух наиболее близких. Этот процесс продолжается до тех пор, пока все объекты будут объединены в одну группу. По результатам вычислений ( табл. 2 ) строим дендрограмму ( рис. 1 ). На дендрограмме все объекты (42 скважины) разделились на два класса. Классификация произошла следующим образом: из 26 скважин класса А неверно классифицировались пять объектов (№ 40, 41, 35, 28, 39); из 16 скважин класса В - четыре объекта (№ 1, 2, 3, 23). Ошибки составляют 21 %. Проверим правильность классификации и найдем функции, позволяющие распознавать принадлежность скважин к классу А или В методом главных компонент [1, 4]. Выявление главных компонент позволяет использовать их при классификации наблюдений и при дальнейшем распознавании образов. В результате вычислений по данным табл. 1 получена корреляционная матрица ( табл. 3 ).

По известной методике [1, 4] вычислим главные компоненты для девяти рассматриваемых признаков (см. табл. 1 ).

Результаты вычислений для первых трех компонент представлены ниже:

где В - собственные векторы; l - дисперсии главных компонент.

Графическая интерпретация в системе координат z1 - z2 приведена на рис. 2 . Значения z1 и z2 вычисляются по уравнениям

Значения xi (i=1,2,…, 9) нормируются по формуле

где - нормированное значение i-ro параметра, - среднее значение i-ro параметра, - среднеквадратическое отклонение i-го параметра, - исходные значения i-гo параметра.

Результаты расчетов приведены в табл. 4 .

На рис. 2 видно, что в новой системе координат скважины достаточно хорошо разделились на два класса А и В линией О - О1. Четыре объекта ошибочно попали из класса А в класс В (№1, 3, 23, 18) и один из класса В в класс А (№ 40). Ошибка - 12%. Отметим, что в системе координат z1 - z3 и z2 - z3 разделение произошло хуже. Теперь, имея новую скважину с параметрами х1, x2,..., x9, вычислив z1 и z2 по формуле (2) и нанеся полученную точку на рис. 2 , можно определить ее принадлежность к соответствующему классу.

Выше отмечалось, что принадлежность к соответствующему классу не распознавалась в пяти случаях. После совместного анализа результатов прогноза по методу главных компонент и по непараметрическим критериям такое отклонение от классификационной схемы становится ясным.

Согласно расчетам, осуществленным методом непараметрических критериев, наиболее информативны такие признаки, как содержание спиртобензольных смол и молекулярная масса парафино-нафтеновых УВ, количество которых во фракции 200- 500 °С явно не соответствует граничным значениям признаков классов. Например, точка 40 площади Гара-Су по табл. 1 относится к классу В. При графической интерпретации главных компонент в системе z1 - z2 она попала в зону класса А. Рассматривая наиболее информативные признаки анализа нефти точки 40, видим, что они по абсолютным величинам отличаются от таковых в своем классе. То же можно сказать относительно анализов нефтей точек 1, 3, 18, 23, относящихся по табл. 1 к классу А, но попавших согласно рис. 2 в класс В. Известно, что нефти классов А и В расположены в различных нефтегазоносных областях - Прикуринской впадине и Бакинском архипелаге. Отклонение отдельных точек от соответствующего класса обусловливается неоднородными гидрогеологическими, литолого-фациальными, геотектоническими условиями залегания УВ, а также процессами миграции и аккумуляции последних. В целом же классификация проведена верно.

Таким образом, совместный анализ результатов классификации и распознавания образов нефтей несколькими методами позволит не только установить особенности влияния геолого-геохимических условий на свойства и состав нефтей, но и выявить условия формирования нефтегазовых скоплений.

СПИСОК ЛИТЕРАТУРЫ

  1. Андерсон Т. Введение в многомерный статистический анализ. М., Физматгиз, 1963.
  2. Гаджи-Касумов А.С., Симхаев В.3., Каракашев В.К. Геохимические особенности нефтей Апшеронской области. - Уч. зап. АзИНЕФТЕХИМ,1976, № 4, с. 3-5.
  3. Крамбейн У., Кауфмен М., Мак-Кеммон Р. Модели геологических процессов. М., Мир, 1973.
  4. Кульбак С. Теория информации и статистика. М., Наука, 1967.

Поступила 24/VI 1980 г.

Таблица 1

Групповой и структурно-групповой состав нефтей (фракция 200-500 °С) Нижнекуринской впадины и Бакинского архипелага

№ п/п

Месторождение

Горизонт

Групповой состав УВ

Структурно-групповой состав УВ

Отбензиненная нефть

Парафино-нефтеновые

Ароматические

Асфальтены

Парафино-нафтеновые

Спиртобензольные смолы

Молярная масса

Кн

Молярная масса

Ка

Са, %

Класс А (Нижнекуринская впадина)

0

Кюровдаг

Пс Ар

1,70

66,81

6,57

355,0

1,2

352,0

1,5318

2,1

43,0

1

 

I

9,34

63,78

3,34

310,0

1,7

290,0

1,5405

2,0

50,0

2

 

III

5,51

66,70

4,04

303,0

1,7

395,0

1,5528

2,3

52,0

3

 

VI

4,84

62,94

5,93

283,0

1,2

290,0

1,5416

2,0

52,0

4

 

X

1,73

50,37

8,26

354,0

1,2

335,0

1,5266

1,9

42,0

5

Карабаглы

Ар

3,29

64,20

6,40

380,0

1,2

317,0

1,5378

2,0

47,0

6

 

Ар

3,08

64,14

8,19

378,0

1,1

331,0

1,5402

2,2

47,0

7

 

I

4,37

63,85

7,40

370,0

0,8

323,0

1,5310

2,0

45,0

8

 

VI

7,18

60,29

8,98

375,0

0,9

329,0

1,5331

2,0

45,0

9

Хиллы

I

6,19

57,03

11,96

367,0

1,8

330,0

1,5328

2,0

45,0

10

Нефтечала

Ар

3,47

51,68

10,32

366,0

1,9

331,0

1,5282

1,9

44,0

11

 

I

7,62

39,33

13,03

351,0

2,0

369,0

1,5251

2,0

40,0

12

 

II

1,0

67,60

10,00

346,0

2,1

355,0

1,5548

2,5

51,0

13

 

II

0,9

57,70

12,40

347,0

1,9

329,0

1,5408

2,1

48,0

14

 

V

0,6

68,44

8,10

427,0

2,2

467,0

1,5364

2,5

40,0

15

 

V

0,5

69,80

11,07

367,0

2,0

429,0

1,5430

2,6

43,0

16

 

V

0,4

67,60

9,00

349,0

1,9

283,0

1,5330

1,9

49,0

17

 

V

6,23

49,85

9,77

344,0

1,7

350,0

1,5384

2,2

46,0

18

 

VI

5,98

68,00

4,27

328,0

1,2

337,0

1,5346

2,0

46,0

19

Кюрсангя

I

6,89

56,27

9,72

380,0

1,3

338,0

1,5265

1,9

42,0

20

 

VI

7,08

57,89

10,90

376,0

1,3

340,0

1,5229

1,8

41,0

21

 

VI

5,64

62,31

7,75

359,0

1,1

305,0

1,5313

1,9

46,0

22

Кюрсангя

XIII

16,44

44,0

15,48

380,0

1,2

285,0

1,5269

1,8

47,0

23

Мишовдаг

Ар

2,97

72,73

5,95

306,0

0,6

285,0

1,5545

2,3

58,0

24

 

I

3,11

69,81

5,91

339,0

1,0

357,0

1,5350

2,2

44,0

25

 

III

8,62

56,35

7,70

336,0

1,0

335,0

1,5325

2,0

45,0

Класс В (Бакинский архипелаг)

26

Сангачалы-море

VII

4,25

58,71

5,49

309,0

1,27

300,0

1,5610

2,4

57,0

27

 

VII

4,65

59,96

5,75

313,0

1,15

279,0

1,5379

1,95

52,0

28

 

VII

3,82

68,00

5,76

257,0

0,76

262,0

1,5165

1,55

45,0

29

 

VII

2,32

65,04

4,68

342,0

1,50

294,0

1,5438

2,10

52,0

30

 

VII

1,28

78,94

2,90

203,07

1,50

186,54

1,5744

2,00

77,0

31

 

VII

1,28

74,53

3,75

357,013

1,80

143,54

1,5811

1,80

90,0

32

 

VII

0,36

79,06

2,99

258,62

1,70

272,19

1,5710

2,40

63,0

33

Дуванный-море

VII

2,01

73,66

4,76

285,82

1,80

192,89

1,5760

2,10

76,0

34

 

VII

1,40

73,31

3,34

217,35

1,70

248,49

1,5680

2,30

65,0

35

 

VII

0,32

62,31

3,10

301,00

1,50

278,00

1,5418

2,00

52,0

36

 

VIII

0,43

71,24

3,85

254,00

1,41

301,0

1,5318

1,92

47,0

37

 

VIII

0,29

66,25

4,41

293,00

1,44

260,0

1,5550

2,05

57,0

38

 

VII

0,50

71,50

2,67

201,00

0,65

173,0

1,5344

1,5

65,0

39

 

VII

1,30

65,26

5,33

303,00

1,1

292,0

1,5196

1,7

43,0

40

Гара-Су

VII

17,0

43,63

11,36

333,00

0,56

340,0

1,5575

2,5

52,0

41

Дуванный-море

V

4,91

54,15

4,03

360,00

1,40

295,0

1,5291

1,8

47,0

Таблица 2

Дендрограмма месторождений Нижнекуринской впадины и Бакинского архипелага

m

n

8

19

0,9776

23

32

0,9698

8

20

0,9654

4

10

0,9543

30

33

0,9530

23

34

0,9493

8

21

0,9377

11

17

0,9341

30

37

0,9269

0

14

0,9262

8

9

0,9068

23

30

0,8904

0

24

0,8836

7

8

0,8859

12

15

0,8581

4

11

0,8511

23

31

0,8370

7

25

0,8209

0

6

0,8141

28

39

0,8098

23

38

0,7951

7

22

0,7950

4

13

0,7708

2

26

0,7425

0

5

0,7404

7

41

0,7389

3

23

0,7380

1

27

0,6935

3

36

0,6823

4

7

0,6599

0

12

0,6567

3

29

0,6298

4

40

0,6203

2

3

0,5745

0

16

0,5601

18

28

0,5527

4

35

0,5175

1

2

0,4837

4

18

0,3793

0

4

0,2763

0

1

0,0083

Таблица 3

Корреляционная матрица

1

-0,689

0,494

0,290

-0,333

0,176

-0,227

-0,266

-0,041

 

1

-0,702

-0,496

0,068

-0,399

0,502

0,544

0,117

   

1

0,650

0,150

0,557

-0,412

-0,530

0,116

     

1

0,175

0,659

-0,407

-0,555

0,152

       

1

0,191

0,252

0,090

0,330

         

1

-0,485

-0,828

0,489

           

1

0,859

0,492

             

1

0,002

               

1

Таблица 4

Значения трех главных компонент, вычисленных по исходным данным, для различных месторождений

z1

z2

z3

0

-0,627

-0,255

-1,186

1

0,343

0,318

0,473

2

0,824

-1,150

0,324

3

0,595

0,676

0,163

4

-1,576

0,658

-0,709

5

-0,484

0,098

-0,483

6

-0,729

-0,464

-0,181

7

-0,915

0,782

-0,437

8

-1,487

0,734

0,295

9

-1,847

-0,458

0,339

10

-1,818

-0,260

-0,293

11

-3,349

-0,356

0,745

12

-0,059

-3,008

0,039

13

-0,040

-1,258

-0,105

14

-1,953

-3,654

-1,556

15

-1,302

-3,471

-0,837

16

-0,002

-0,430

-0,995

17

-1,694

-0,775

0,734

18

-0,105

0,433

-0,561

19

-2,079

0,580

-0,011

20

-2,269

0,854

-0,172

21

-0,552

0,883

-0,162

22

-3,437

1,804

2,772

23

1,508

0,064

0,425

24

-0,329

-0,229

-0,904

25

-1,360

0,937

0,518

26

0,878

-0,924

1,185

27

0,290

0,902

0,164

28

0,432

2,995

-1,340

29

0,609

-0,390

-0,341

30

4,953

0,101

0,896

31

4,496

-0,277

1,727

32

3,381

-1,797

0,127

33

3,795

-0,848

1,374

34

3,495

-1,061

0,535

35

1,197

0,129

-0,762

36

1,250

0,554

-1,614

37

1,884

-0,178

-0,146

38

3,414

3,411

-0,729

39

0,002

1,697

-1,710

40

-2,150

0,281

4,040

41

-0,628

1,066

-0,386

Рис. 1. Графическое изображение дендрограммы.

Рис. 2. Графическая интерпретация главных компонент в системе z1-z2