Korelacja, autokorelacja, kowariancja, trendy Korelacja określa stopień asocjacji między zmiennymi
Kowariancja Wady - ograniczenia 1. Wartość kowariancji zależy od rozmiarów zmienności zmiennej. 2. W konsekwencji trudno jest oszacować „wielkość kowariancji”. Jeżeli zmienność X i Y jest mała to również maksymalna możliwa COV jest niewielka, jeżeli zmienność X i Y jest duża, to największa możliwa kowariancja jest również duża. Celem jest oszacowanie wielkości COV względem poziomu zmienności X i Y.
Standaryzowana kowariancja Kowariancja pomiędzy X i Y nie przewyższa iloczynu odchyleń standardowych powyższych zmiennych. Standaryzowana kowariancja zawiera się w przedziale [+1, -1] Im wyższa wartość r tym silniejsza asocjacja pomiędzy zmiennymi Standaryzowana kowariancja jest nazywana współczynnikiem korelacji Wartości współczynnika korelacji r = +1, -1 świadczą o dodatniej oraz ujemnej zależności funkcyjnej między zmiennymi, r = 0 oznacza brak asocjacji. Średnia iloczynów wartości standaryzowanych X i Y
r = +1 r = -1 r = 0 r = -0.44 17 000 obserwacji Tendencja ciśnienia Górna dywergencja
łańcuch przyczynowy, gdy i=2, mamy: W analizie korelacji nie zakłada się zależności przyczynowej, a jedynie asocjację. Istotna asocjacja między dwoma zmiennymi może być wyrazem działania co najmniej czterech mechanizmów: 1. X i Y są zmiennymi, których zmienność kształtuje czynnik A A X Y clo odzieży & spożycie lodów 2. X i Y są powiązane za pośrednictwem jednej lub więcej zmiennych Ai i tworzą łańcuch przyczynowy, gdy i=2, mamy: X A1 A2 Y UV Ozon cyrkulacja temperatura
3. X powoduje zmianę Y, ale również Y powoduje zmianę X; mamy więc dwustronne powiązanie: X Y Śnieg temperatura „The question is: if winter with higher snow is colder than normal, is it colder because of the snow cover or is the more snow cover because it is colder?”
Testowanie istotności współczynnika korelacji 4. Występuje jednokierunkowa zależność przyczynowa, taka jak zakładana w analizie regresji. X Y Z powyższych przykładów wynika, że na podstawie prostej analizy korelacji nie powinno się wyciągać wniosków przyczynowych, gdyż asocjacja dwóch zmiennych może wystąpić z różnych powodów. Testowanie istotności współczynnika korelacji df = N - 2 N - liczba korelowanych par Wzór stosowany do obliczeń numerycznych
ALWAYS LOOK AT THE SCATTERPLOTS! 1. „outlier” podwyższający korelację. 2. „outlier” obniżający korelację, zależność funkcyjna 5. Połączenie dwóch różnych próbek o r=0 6. Spełniony warunek normalności rozkładu 7. Związek nieliniowy 8. Połączenie dwóch różnych próbek o ujemnej korelacji Jeżeli w obu korelowanych szeregach wykryto istotny trend o tym samym znaku to należy go odjąć od jednego szeregu. Dodanie do szeregu stałej wartości nie zmienia wartości współczynnika korelacji.
Autokorelacja gdzie: k - przesunięcie (lag)
Współczynnik autokorelacji jako miara bezwładności w szeregu Temperatura powierzchni oceanu Prędkość wiatru SST Autokorelogramy r = 0.15 r = 0.8 krok krok
Współczynnik autokorelacji jako miara cykliczności w szeregu Średnia miesięczna temperatura w Łodzi cykl roczny Promieniowanie radiowe słońca 10.7 cm cykl 27-dniowy
Trendy w szeregach czasowych
Metoda najmniejszych kwadratów [least square method] x (czas)
Równanie linii trendu y = bx + a b - współczynnik kierunkowy, informuje o tym o ile zmienia się wartość funkcji przy wzroście x o jednostkę czasu. a - wyraz wolny, informuje o wartości funkcji gdy x = 0.
Testowanie istotności trendu - statystyka Mann-Kendalla ki - liczba elementów poprzedzających i-ty wyraz, mniejszych od niego. n - długość szeregu Dla n>10 statystyka a ma rozkład normalny o średniej μ i odchyleniu standardowym σ Testujemy statystykę znormalizowaną z