Агроэкологическое моделирование

электронный учебно-методический комплекс

МОДУЛЬ 2. Математическое моделирование

Практическое занятие 11-14

Моделирование агрометеопараметров, продукционного процесса.Корреляционный анализ. Регрессионный анализ

Для поддержки сельскохозяйственных производителей и управления це-новыми рисками с сентября 2006 г. в России реализуется проект по организации рынка биржевых торгов зерном с использованием механизма форвардных и фьючерсных кон-трактов, которые заключаются, начиная с марта каждого года. В связи с этим субъек-там аграрной сферы необходимо обладать аналитической информацией о складывающихся погодных условиях, их возможном воздействии на объекты сельскохо-зяйственного производства и ожидаемую продуктивность зерновых культур.

Сдерживающим моментом в решении этих задач является погодный фактор, компоненты которого (среднесуточная температура воздуха, суточная сумма осадков и т.д.) могут изменяться в широком диапазоне от года к году и в течение самого периода вегетации растений. При обосновании стратегии ведения сельского хозяйства экономический эффект должен быть получен на всем множестве возможных погодных реализаций в многолетнем разрезе. Однако на стадии планирования отсутствует любая информация о метеорологической ситуации последующего периода, и необходимо принимать решения, исходя из возможного спектра реализаций агрометеорологических факторов для данной климатической зоны.

Для решения практических задач оценки урожайности в службах Росгидромета используются достаточно простые по структуре эмпирические и физико-статические мо-дели, с помощью которых невозможно учесть реальную изменчивость погодных условий и варьирующих в больших пределах других факторов формирования урожая. В настоящее время разработаны эффективные моделирующие комплексы продукци-онного процесса, такие как AGROTOOL (Агрофизический институт, г. Санкт-Петербург, Россия), EPIC (Soil & Water Research Laboratory, USDA-ARS), AGROSIM (Centre for Agricultural Landscape Research, Muncheberg, Germany) и другие, которые еще до практи-ческой реализации того или иного агротехнологического мероприятия, способны спрогнозировать его последствия, встраиваясь непосредственно в технологию приня-тия решений. Однако их использование сдерживается отсутствием необходимой аг-рометеорологической информации будущего периода. В данной работе приведен алгоритм моделирования агрометеорологических факторов для информационного обес-печения моделей продуктивности зерновых культур.

Задача исследования корреляционной связи – определить характер и измерить тесноту сопряженности между признаками, из которых один является факториальным, другой результативным. Например, существует определенная корреляция между числом листьев у кукурузы (факториальный признак) и длиной вегетационного периода (результативный признак): чем больше листьев образует растение, тем позднее оно созревает.

Прежде чем приступать к рассмотрению сущности корреляционно - регрессионного анализа, необходимо выделить условия его применения и ограничения:

1) Корреляционную связь не следует вычислять при значении коэффициента корреляции более 30% в каждом из рядов наблюдений.

2) Число наблюдений должно быть не менее чем в 5-6 раз больше числа факторов.

3) Необходимо, чтобы совокупности по результативному и факториальному признакам подчинялись нормальному закону распределения вероятностей.

Исследование корреляции сводится к следующему:

1. Устанавливают факт зависимости изменений одного признака от изменения другого и определяют форму связи между ними (тип корреляции). Корреляцию называют простой, если исследуется связь между двумя признаками, или множественной, когда на величину одного результативного признака влияют несколько факториальных.

2. В зависимости от характера изменений результативного признака под влиянием факториального различают следующие формы корреляции:

а) линейную корреляцию, когда с увеличением среднего значения одного признак также увеличивается среднее значение другого, или с увеличением среднего значения одного признака уменьшается среднее значение другого. В первом случае корреляцию называют прямой, во втором – обратной;

б) криволинейную корреляцию: при возрастании значения одного признака другой принимает значения, возрастающие до определенной величины, а затем убывающие, или наоборот.

3.Находят тесноту связи, т.е. степень сопряженности между значениями одного и другого признака. Основной показатель степени сопряженности между значениями одного и другого признака и формы связи - коэффициент корреляции (r). Коэффициент корреляции – безразмерная величина, изменяемая в пределах -1≥ r ≤ +1. При r = 0 линейная связь отсутствует, при r = ± 1 корреляционная связь превращается в функциональную.

Определение тесноты связи по величине коэффициента корреляции следующее:

при r = ≤ 0,2 – 0,3 – свидетельствует о наличии слабой связи;

r = 0,3 – 0,7 – средней;

r ≥ 0,7 – сильной связи.

Направление корреляционной зависимости определяется знаком: положительное значение свидетельствует о том, что изменения одной величины соответствуют изменениям другой, т.е с увеличением значения одной увеличивается другая, а связь - прямая. При отрицательной корреляции (обратная зависимость), наоборот, с увеличением значения одной величины другая уменьшается, а с уменьшением – увеличивается.

Коэффициент корреляции определяется по формуле:

r = √ (x – x)* (y –y) / √ Σ (x –x) 2* Σ (y – y) 2.

Следует иметь в виду, что коэффициент корреляции выборочного наблюдения подвержен случайным колебаниям, зависящим как от особенностей образования выборки, так и от точности наблюдений. Вследствие этого по величине коэффициента корреляции не всегда можно с достаточной уверенностью судить о наличии или сопряженности между признаками в данной выборке. Поэтому вычисленный для выборки коэффициент корреляции необходимо оценить с точки зрения его значимости и убедиться, что его знак не изменится на обратный. Для оценки существенности коэффициента корреляции вычисляют его ошибку (Sr) и критерий существенности (tr)по формулам:

Sr = v 1 – r2 / n -2

tr = r / Sr, где

r – коэффициент корреляции;

n – число парных значений показателей по которым вычислен коэффициент корреляции.

Если tr ≥ tтеор, то корреляционная связь существенна. Теоретическое значение критерия Стьюдента берут из таблицы при уровнях вероятности 95 и 99% и числе степеней свободы Y = n – 2.

Величина коэффициента корреляции позволяет выяснить тесноту (силу) и направление связи, однако этим не исчерпываются возможности изучения сопряженности между признаками. Более того, во многих исследованиях возникает необходимость изучить не столько меру корреляции, сколько ее форму и характер изменения одного признака в зависимости от изменения другого, т.е. количественное изменение связанных друг с другом показателей или признаков. Последнее особенно важно в тех случаях, когда фактические наблюдения не охватывают всего разнообразия признака и цель исследования заключается в том, чтобы выяснить взаимозависимости между недостающими данными. Эти задачи решаются методами регрессионного анализа.

Термин регрессия был введен Гальтоном в связи с изучением им наследования признаков родителей потомством.

2. Схема корреляционно-регрессионного анализа

Третьим основным показателем корреляционной связи является коэффициент регрессии – byx, показывающий, в каком направлении и на какую величину в среднем изменяется функция (y) при изменении аргумента (x) на единицу измерения. Кроме того коэффициент регрессии необходим для вычисления теоретических значений результативного признака для любых значений факториального. Коэффициент регрессии измеряется в тех же единицах, что и функция, и имеет тот же знак, что и его коэффициент корреляции. Вычисляется коэффициент регрессии по формуле:

byx = Σ (x – x)* (y – y) / Σ (x – x) 2.

Числитель этой формулы представляет собой сумму произведений отклонений значений x и y от своих средних значений, а знаменатель – сумму квадратов отклонений от средних значений.

При регрессионном анализе производят обычно две оценки выборочных коэффициентов регрессии:

а) оценку существенности коэффициента регрессии;

б) критерий существенности регрессии.

Оценка существенности коэффициента регрессии позволяет убедиться в том, что зависимость между сопоставляемыми признаками не случайна, а статистически значима. Для этого рассчитывают ошибку коэффициента регрессии:

Sbyx= Sr v Σ (x –x) 2 / Σ (y – y) 2

Критерий существенности для коэффициента регрессии:

tb= b/ Sb.

При этом следует помнить, что tb = tr и byx*byx = r2. Это может служить для проверки правильности расчетов.

Регрессионный анализ заключается в том, чтобы отыскать линию (прямую – в случае линейной корреляции, параболу первого, второго и т.д. порядка при криволинейной зависимости), наиболее точно выражающую зависимость одного признака от другого. Кроме того, при помощи регрессионного анализа можно выяснить ошибку опытных данных, влияющих на конечные результаты исследования.

Наглядным способом выражения корреляционной зависимости служит построение специальных графиков. Поэтому после установления существенности коэффициента регрессии составляют уравнение регрессии, т.е. математическую формулу для данной корреляционной связи. В простой линейной корреляции уравнение имеет вид:

y0 = y + byx (x –xср), где

y0 – теоретическое значение признака;

y– средняя арифметическая признака;

x – средняя арифметическая признака;

byx - коэффициент регрессии.

С помощью уравнения регрессии корреляционная связь изображается графически в системе координат в виде линии регрессии.

Для построения теоретической линии регрессии в формулу уравнения подставляют значения y, x, byx. После этого берут два экстремальных значения x (xmin; xmax) и вычисляют соответствующие им значения y. Строят систему координат в масштабе значений, соответствующих изменениям значений y и x. В этой системе находят две экстремальные точки (xmin ; ymin) (xmax ; ymax), по которым и строят линию регрессии.

После построения линии регрессии в этой же системе координат наносят в виде точек фактические экспериментальные значения y и x. Если разброс точек осуществляется вокруг теоретической линии, значит, расчет сделан, верно, и построенный график может быть использован для научных и практических целей.

МЕТОДИЧЕСКИЕ УКАЗАНИЯ К ВЫПОЛНЕНИЮ ИНДИВИДУАЛЬНОГО ПРАКТИЧЕСКОГО ЗАДАНИЯ ПО ТЕМЕ «КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ»

1. Образец задачи. Например, необходимо установить зависимость между содержанием гумуса (%) и общего азота (%) в черноземе обыкновенном.

По представленным в варианте данным построить таблицу корреляционно-регрессионного анализа по следующему образцу (табл. 1):

Таблица 1 - Вычисление коэффициента корреляции между содержанием гумуса (x) и азота (y) в почве (n = 10)

2. Вычислить коэффициент корреляции r:

r = Σ (x – xср)×(y – yср) / √ Σ (x – xср)2× Σ (y – yср) 2

3. Вычислить ошибку коэффициента корреляции Sr:

Sr= √ 1 – r2 / n – 2

4. Определить существенность коэффициента корреляции:

tr = r / Sr

5. Сделать выводы о характере и тесноте связи.

6. Вычислить коэффициент регрессии byx :

byx = Σ (x – xср) × (y – yср) /Σ (x – xср)2

7. Вычислить ошибку коэффициента регрессии Sbyx:

Sbyx= Sr √ Σ (x –xср)2 / Σ (y – yср)2

8. Вычислить ошибку отклонения от регрессии:

Syx = Sr √ Σ (y – yср)2

9. Определить критерий существенности коэффициента регрессии: tb= b/ Sb.

10. Составить уравнение регрессии y0 = y + byx (x –xср).

11. Построить кривую регрессии по уравнению (рис.1).

Рис. 1. Точечный график и теоретическая линия регрессии при прямолинейной корреляции

12. Сделать выводы по содержанию эксперимента.

Задания по теме «Корреляционно-регрессионный анализ»

1. Оцените зависимость между урожайностью овса (х, ц/га) и влажностью почвы (у, %):


x11,311,78,09,69,512,011,511,412,313,4
y24,426,721,324,721,825,527,723,424,928,3

2. Определите влияние семенной инфекции (х, %) яровой пшеницы на всхожесть семян (у, %):


x69,266,263,645,538,537,523,017,616,78,0
y32,433,342,439,880,962,966,785,790,581,9

3. Определите зависимость между содержанием гумуса в агрегатах почвы (х, %) и их водопрочностью (у, %):


x7,87,36,46,38,37,47,59,89,97,3
y67,166,358,754,368,473,371,076,377,069,9

4. Определите зависимость между урожайностью огурца в пересчете на 1м2 (х, кг) и содержанием водорастворимого органического вещества (у, мг/100г):


x50,055,055,060,063,065,044,053,070,066,0
y17,016,917,619,019,124,015,026,328,019,9

5. Определите зависимость изменения массы кочана капусты (х, кг) от пораженности растения капустной тлей (у, баллы):


x2,05,04,53,03,52,52,31,02,84,0
y3,41,62,33,13,04,34,12,73,02,1

6. Определите зависимость между содержанием нитратного азота (х, мг/кг) и урожайностью яровой пшеницы (у, ц/га):


x18,717,117,517,019,719,418,117,317,917,4
y17,416,817,517,421,620,021,119,317,415,2

7. Определите зависимость между высотой мульчирующего слоя (х, см) и влажностью почвы (у, %):


x3,05,07,09,010,011,012,013,014,015,0
y8,99,49,09,59,612,313,017,118,419,3

8. Определите зависимость между температурой почвы (х, 0С) и скоростью выделения углекислого газы из почвы (у, г/м2*сут):


x13,410,011,411,819,319,624,317,69,38,7
y3,02,72,93,08,68,513,711,45,62,1

9. Определите зависимость между содержанием подвижных фосфатов (х, мг/100г) и урожайностью картофеля (у, ц/га):


x14,115,212,125,636,715,214,311,736,828,7
y184191180233240170165160341270

10. Определите зависимость между содержанием подвижного гумуса (х, мг/100г) и урожайностью яровой пшеницы (у, ц/га):


x213274258290170301280314317211
y14,715,013,814,711,421,320,018,719,015,3

11. Определите зависимость между урожайностью ячменя (у, ц/га) и мощностью гумусового горизонта (х, см):


x11,014,025,017,034,065,028,038,054,045,0
y9,79,819,817,319,624,412,914,222,021,6

12. Определите зависимость урожайности малины в пересчете на 1м2 (х, кг) от пораженности ее антракнозом (у, %):


x5,16,48,010,212,814,116,120,223,836,6
y0,980,950,900,900,920,900,890,750,810,63

13. Определите зависимость урожайности кукурузы (у, т/га) от засоренности посевов (х, количество сорняков на м2):


x12,018,125,230,032,540,045,450,651,061,6
y6,66,46,36,36,25,86,05,94,84,1

14. Определите зависимость между содержанием агрономически ценных агрегатов (у, %) и влажностью почвы (х, %):


x7,78,49,617,325,654,317,833,667,870,0
y63,458,860,454,461,343,758,849,632,130,7

15. Определите зависимость между сроком разложения донникового сидерата (х, дни) и количеством аммонийного азота (у, мг/100г) в весеннее время следующего года:


x25,61,075,0710,0720,071,0810,0820,081,0910,09
y2,32,22,53,13,45,84,95,14,34,8

16. Определите зависимость между урожайностью яровой пшеницы (у, ц/га) и площадью листовой поверхности (х, м2 на 1м2 площади посева):


x7,37,06,68,17,57,57,97,87,78,3
y14,814,712,915,615,014,715,215,014,316,1

17. Определите зависимость между урожайностью кукурузы (у, ц/га) и содержанием обменного калия в почве (х, мг/100г):


x7,88,411,312,027,325,14,34,810,810,4
y120,0123,0144,0142,0218,0215,0114,0108,0136,0140,0

18. Определите зависимость между урожайностью столовой свеклы (у, ц/га) и реакцией почвенного раствора - х:


x4,95,15,56,36,87,07,17,37,47,5
y91,493,394,5113,6158,1173,4200,4197,4213,6180,3

19. Определите зависимость между реакцией почвенного раствора (х, pHсол) и водопрочностью почвенных агрегатов (у, %):


x4,14,75,25,45,86,26,77,07,37,6
y48,651,750,348,457,454,361,864,758,350,1

20. Определите зависимость между шириной межкулисного пространства (х, см) и высотой снежного покрова (у, см):


x80100120140180200220240260280
y93909286848873756051

21. Оцените зависимость между содержанием гумуса (х, %) и содержанием влаги в почве (у, см):


x3,73,94,04,16,77,38,18,89,412,1
y14,114,314,517,118,720,120,822,430,540,6

22. Оцените зависимость между влажностью почвы (у, %) и содержанием нитратного азота в почве (х, мг/кг):


x17,38,923,419,727,335,540,431,620,411,3
y15,410,314,116,78,38,75,38,413,67,9

23. Определите зависимость между температурой почвы (у, 0С) и скоростью выделения углекислого газа из почвы (х, г/м2):


x7,88,112,311,413,417,115,219,325,420,4
y2,12,39,93,84,74,94,59,811,49,6

24. Определите зависимость между урожайностью овса (у, ц/га) и запасами влаги в почве (х, мм) весной в слое 1-100см:


x75,096,098,054,0120,0135,0140,0174,0175,045,0
y11,413,812,112,814,112,715,617,816,78,9

25. Определите зависимость между содержанием гумуса (х, %) и урожайностью картофеля (у, ц/га):


x2,92,53,73,94,65,77,28,69,412,8
y86,484,487,391,1100,4125,6174,3196,0215,5111,0


© ФГОУ ВПО Красноярский государственный аграрный университет

© Центр дистанционного обучения