ORGANIZACJA PROCESU PROGNOSTYCZNEGO dr inż. Arkadiusz Borowiec Instytut Inżynierii Zarządzania Politechnika Poznańska
Dane wykorzystywane w prognozowaniu W każdym procesie prognozowania wykorzystuje się pewne dane związane z otoczeniem oraz z obiektem, dla którego sporządzana jest prognoza. Wyróżniamy dwa rodzaje danych wchodzących w skład prognozowania, są to dane wewnętrzne oraz dane zewnętrzne. Dane wewnętrzne sporządzane są na potrzeby zarządzania, bądź tylko w celu prognozowania, gromadzone są przez kierownictwo.
Najważniejsze dane wewnętrzne zbiory zasad funkcjonowania obiektu, czyli, przepisy, regulaminy wewnętrzne przedsiębiorstwa, receptury dotyczące procesów technologicznych; rejestracja zdarzeń bieżących, czyli rejestry kosztów przedsiębiorstwa, liczba urodzeń, zgonów w USC; różnego rodzaju sprawozdania, np. ze sprzedaży, zatrudnienia; spisy; zapisy np. jakości wyrobów, opinii społeczeństwa;
Dane zewnętrzne Dane zewnętrzne dotyczą otoczenia bliższego i dalszego, otoczenie bliższe to otoczenie stworzone przez obiekty powiązane, dalsze tworzone przez ogólne warunki funkcjonowania obiektu. Im otoczenie jest bliższe, a informacje szczegółowe tym dane są trudniejsze do zdobycia. Otoczeniem bliższym dla przedsiębiorstwa są dostawcy, klienci i kontrahenci, do otoczenia dalszego należą instytucje krajowe i międzynarodowe, oraz gospodarka. Dane z otoczenia dalszego czerpane są również od sejmu, rządu, banków, giełdy, instytucji naukowych i organizacji międzynarodowych. Informacje rozpowszechniane są przez mass media i literaturę specjalistyczną, dzienniki i czasopisma.
Kryteria selekcji danych w prognozowaniu Prognosta musi dysponować bogatym zbiorem wiadomości i danych ważnych, wnoszących coś nowego do oceny zjawiska. Aby dane te miały jakąś wartość dla prognosty ustalono kryteria, jakie są używane do analizy danych. Wyróżnione kryteria to: rzetelność; jednoznaczność; identyfikowalność zjawiska przez zmienną; kompletność; aktualność danych dla przyszłości; koszt zbierania i opracowania danych; porównywalność danych;
Rzetelność danych Rzetelność polega na zgodności danych z przedmiotem, którego dotyczą. Niestety trzeba się liczyć z występowaniem dwojakich błędów. Jeden wynika z błędów losowych, czyli z pomyłek przy zbieraniu i przetwarzaniu informacji, drugi to błędy systematyczne wynikające z celowego fałszowania danych. Ważna jest weryfikacja merytoryczna i formalna rzetelności danych, wiąże się to z ich wyrywkowym sprawdzaniem, porównywaniem zgodności powiązanych ze sobą danych, sporządzaniu wykresów szeregów czasowych lub przekrojowych. Weryfikacje to muszą zostać skorygowane, bądź wyeliminowanie, oraz zapisane, aby mogły być źródłem korekt prognoz otrzymanych z modeli.
Jednoznaczność danych Jednoznaczność danych opiera się na takim samym ich odbiorze, na takim ich sformułowaniu, aby ich interpretacja była zawsze taka sama. Np. zdanie „dochód narodowy w Polsce w 2009r. wyniesie 800 bln złotych” nie jest jednoznaczne, gdyż pojęcie dochodu narodowego może być różnie rozumiane oraz nie wiadomo czy dochód jest wyrażony w cenach bieżących czy stałych.
Identyfikowalność zjawiska przez zmienną Istnieje wiele możliwości identyfikacji zjawisk, czyli możliwości opisania ich za pomocą więcej niż jednej zmiennej, nawet, jeśli są to zjawiska proste. W zależności od celu, dla którego robione jest to badanie musimy wybrać jeden z mierników określających. Bardziej skomplikowane jest to w przypadku zjawisk złożonych. Należy wtedy odwołać się do teorii i zrozumienia przyjętego w dotychczasowych badaniach, w przypadku zastosowania pewnych odstępstw, należy je uzasadnić.
Kompletność danych Kompletność danych obejmuje takie dane, które zawierają wszystkie ważne informacje, wiadomości umożliwiające rozpoznanie problemu. Wiadomości marginesowe, powtarzające się bądź niekompletne należy pomijać.
Aktualność danych dla przyszłości Aktualność danych dla przyszłości związana jest z określeniem czynnika istnienia dotąd oddziałującego podczas sporządzaniem diagnoz prognozowanego zjawiska. Nie każdy z tych czynników w przyszłości będzie miał taką samą siłę oddziaływania, dlatego też prognosta powinien określić, który z tych czynników będzie oddziaływał z taką samą siłą, który z mniejszą siłą, a który będzie nabierał mocy, oraz czy jest szansa pojawienia się nowego czynnika.
Koszt zbierania i opracowywania danych Koszty zbierania i opracowywania danych są bardzo wysokie, więc należy dążyć do minimalizacji liczby danych, oraz zwiększenia korzystania z danych już zgromadzonych. Nowe dane należy pozyskiwać w sytuacji, gdy są one niezbędne do polepszenia jakości prognozy.
Porównywalność danych Porównywalność danych rozpatrywana jest z różnych punktów widzenia, dlatego możemy wyróżnić porównywalność: czasową, charakteryzującą się jednakowym odstępem czasu między obserwacjami zasobów i jednakowym przedziałem czasu dla strumieni; terytorialną wykorzystującą jednakowe terytorium w całym okresie objętym badaniem; pojęć i kategorii polegające na wykorzystaniu tych samych definicji i klasyfikacji; metody obliczeń (np. obliczania dochodu narodowego, indeksu inflacji, itd.)
Podstawowe rodzaje szeregów Stany zmiennych są zapisywane w postaci szeregów. Mamy następujące rodzaje szeregów: Jednowymiarowy szereg czasowy Wielowymiarowy szereg czasowy Jednowymiarowy szereg przekrojowy Wielowymiarowy szereg przekrojowy Szereg przekrojowo – czasowy
Jednowymiarowy szereg czasowy Ciąg zaobserwowanych stanów zmiennej Y uporządkowanych według wartości zmiennej czasowej t, gdzie t = 1, 2, ..., n. Szereg będziemy zapisywać jako wektor (1 x n): y = [y1, y2, ..., yn], gdzie yt to stan zmiennej Y w momencie lub okresie t. np. Ceny gruntu w kolejnych dniach, czy miesiącach; zachmurzenie w Poznaniu w 2008 r. o godz. 21.
Wielowymiarowy szereg czasowy Jest utworzony przez szeregi czasowe zmiennych Y1, Y2, ..., YG opisujących określony obiekt. Szereg wielowymiarowy jest macierzą (G x n) gdzie ygt to stan g-tej zmiennej w momencie lub okresie t Np. długość linii kolejowych i dróg publicznych w kolejnych latach
Jednowymiarowy szereg przekrojowy Ciąg zaobserwowanych stanów zmiennej Y, z których każdy odnosi się do tego samego momentu lub okresu t i do k-tego obiektu przestrzennego: y = [y1, y2, ..., yK], gdzie yk – stan zmiennej Y w obiekcie k-tym w momencie lub okresie t. np. Liczba samochodów osobowych na 1000 mieszkańców w 1999 r.
Wielowymiarowy szereg przekrojowy Jest utworzony przez szeregi przekrojowe zmiennych Y1, Y2, ..., YG rozpatrywane w jednym momencie lub okresie t. gdzie ygk to stan g-tej zmiennej w k-tym obiekcie w momencie lub okresie t np. personel służby zdrowia w niektórych woj. wg stanu na 31.12.2007 na 10 tys. ludności.
Szereg przekrojowo – czasowy Utworzony przez szeregi czasowe G zmiennych opisujących K obiektów. Macierz informacji można zapisać w skrócie jako macierz blokową, przy czym każdy blok zawiera wielowymiarowy szereg czasowy charakteryzującej k-ty obiekt. np. Liczba samochodów i telefonów w Polsce i Francji na 1000 mieszkańców w latach 1995-2000. W praktyce w prognozowaniu najczęściej wykorzystuje się jedno i wielowymiarowe szeregi czasowe i szeregi przekrojowo-czasowe.