Quantitative Methods for Historians

Slides:



Advertisements
Podobne prezentacje
Jak można nauczyć korzystania z prawdopodobieństwa.
Advertisements

Proces doboru próby. Badana populacja – (zbiorowość generalna, populacja generalna) ogół rzeczywistych jednostek, o których chcemy uzyskać informacje.
Ekonometria WYKŁAD 10 Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
Tworzenie odwołania zewnętrznego (łącza) do zakresu komórek w innym skoroszycie Możliwości efektywnego stosowania odwołań zewnętrznych Odwołania zewnętrzne.
MATLOS „JAK TEORIA MA SIĘ DO PRAKTYKI?”. Cel projektu: Sprawdzamy, jaka jest zależność między prawdopodobieństwem a częstością zdarzenia.
EWALUACJA PROJEKTU WSPÓŁFINANSOWANEGO ZE ŚRODKÓW UNII EUROPEJSKIE J „Wyrównywanie dysproporcji w dostępie do przedszkoli dzieci z terenów wiejskich, w.
Wypadkowa sił.. Bardzo często się zdarza, że na ciało działa kilka sił. Okazuje się, że można działanie tych sił zastąpić jedną, o odpowiedniej wartości.
Marcin Gliński Instytut Języków Romańskich i Translatoryki UŚ Regionalny Ośrodek Doskonalenia Nauczycieli WOM w Katowicach NOCNE POWTÓRKI MATURALNE 2016.
Zmienne losowe Zmienne losowe oznacza się dużymi literami alfabetu łacińskiego, na przykład X, Y, Z. Natomiast wartości jakie one przyjmują odpowiednio.
BYĆ PRZEDSIĘBIORCZYM - nauka przez praktykę Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
© Prof. Antoni Kozioł, Wydział Chemiczny Politechniki Wrocławskiej MATEMATYCZNE MODELOWANIE PROCESÓW BIOTECHNOLOGICZNYCH Prezentacja – 4 Matematyczne opracowywanie.
W KRAINIE TRAPEZÓW. W "Szkole Myślenia" stawiamy na umiejętność rozumowania, zadawania pytań badawczych, rozwiązywania problemów oraz wykorzystania wiedzy.
Metody Analizy Danych Doświadczalnych Wykład 9 ”Estymacja parametryczna”
Skuteczności i koszty windykacji polubownej Wyniki badań zrealizowanych w ramach grantu Narodowego Centrum Nauki „Ocena poziomu rzeczywistej.
WYKŁAD 6 Regionalizacja 1. Regionalizm a regionalizacja 2 Proces wyodrębniania regionów nazywany jest regionalizacją, w odróżnieniu od regionalizmu, który.
Teoria masowej obsługi Michał Suchanek Katedra Ekonomiki i Funkcjonowania Przedsiębiorstw Transportowych.
Definiowanie i planowanie zadań typu P 1.  Planowanie zadań typu P  Zadania typu P to zadania unikalne służące zwykle dokonaniu jednorazowej, konkretnej.
 Przedziałem otwartym ( a;b ) nazywamy zbiór liczb rzeczywistych x spełniających układ nierówności x a, co krócej zapisujemy a
O PARADOKSIE BRAESSA Zbigniew Świtalski Paweł Skałecki Wydział Matematyki, Informatyki i Ekonometrii Uniwersytet Zielonogórski Zakopane 2016.
Statystyka Wykłady dla II rok Geoinformacji rok akademicki 2012/2013
Test analizy wariancji dla wielu średnich – klasyfikacja pojedyncza
RODZAJE PODATKÓW Przygotowała: Magdalena Zawilińska.
Kluczowe elementy skutecznej strategii analizy danych internetowych
Logika dla prawników Podział logiczny.
Minimalizacja automatu
Okrąg i koło Rafał Świdziński.
Wykład 4. Dr Krzysztof Jonas
Schematy blokowe.
Informacja o maturze w 2018 roku
SYSTEM KWALIFIKACJI, AWANSÓW I SPADKÓW
System wspomagania decyzji DSS do wyznaczania matematycznego modelu zmiennej nieobserwowalnej dr inż. Tomasz Janiczek.
On-the-Fly Garbage Collection
WAE Jarosław Arabas Algorytm ewolucyjny
Oczekiwana przez inwestora stopa dochodu
Liczby pierwsze.
FIGURY.
Moje szczęście.
Funkcja – definicja i przykłady
Wstęp do Informatyki - Wykład 3
Opracowała: Monika Grudzińska - Czerniecka
Graficzne metody analizy danych
Materiały pochodzą z Platformy Edukacyjnej Portalu
Zajęcia przygotowujące do matury rozszerzonej z matematyki
Elementy fizyki kwantowej i budowy materii
Przygotowanie i wstępna obróbka danych
Produkt i dochód narodowy
Zmienne losowe wielowymiarowe
Własności statystyczne regresji liniowej
Dobrobyt.
ALGORYTMY I STRUKTURY DANYCH
Porównywanie średnich prób o rozkładach normalnych (testy t-studenta)
Statystyka i Demografia
MATEMATYKAAKYTAMETAM
FORMUŁOWANIE HIPOTEZ STATYSTYCZNYCH
Implementacja rekurencji w języku Haskell
Znajdowanie liczb pierwszych w zbiorze
Doskonalenie rachunku pamięciowego u uczniów
REGRESJA WIELORAKA.
metody współczesnej statystyki
MATEMATYKA Opracowała: Martyna Białas
…rozkłady, kowariancja, korelacja, estymacja i weryfikacja hipotez…
Probabilistyczne modele danych
WYBRANE ZAGADNIENIA PROBABILISTYKI
Elipsy błędów.
Podstawowe definicje i twierdzenia Rachunku Prawdopodobieństwa
Grazyna Mirkowska Matematyka Dyskretna PJWSTK 2001
Zapis prezentacji:

Quantitative Methods for Historians Quantitative history badania empiryczne w naukach humanistycznych historia w liczbach

KISIM, WIMiIP, AGH

New social history (Cliometrics, Econometric history) Cliodynamics Quantitative history Economic history Political history New social history (Cliometrics, Econometric history) Cliodynamics Demographic history Historiometry KISIM, WIMiIP, AGH

Demographic history Historical demography Historical demographers must make do with estimates. models and extrapolations. KISIM, WIMiIP, AGH

Historiometry historical study of human progress or individual personal characteristics, using statistics to analyze references to geniuses, their statements, behavior and discoveries in relatively neutral texts KISIM, WIMiIP, AGH

Cliodynamics scientific approach to the study of history and combines insights from cultural evolution, macrosociology, and economic history/cliometrics identify general principles about the evolutionary dynamics and functioning of historical societies explain (with mathematical modeling) such dynamical processes as the rise and fall of empires, population booms and busts, spread and disappearance of religions KISIM, WIMiIP, AGH

Cliometrics new social history, econometric history application of economic theory, econometric techniques, and other formal or mathematical methods to the study of history (especially social and economic history) KISIM, WIMiIP, AGH

Economic history study of economies or economic phenomena of the past combination of historical methods, statistical methods and the application of economic theory to historical situations and institutions A supply and demand diagram, illustrating  the effects of an increase in demand KISIM, WIMiIP, AGH

KISIM, WIMiIP, AGH

totals/rates KISIM, WIMiIP, AGH

niewolnictwo i polityka KISIM, WIMiIP, AGH

metody współczesnej statystyki graficzne metody prezentacji danych statistical graphics, graphical perception

Show data variation, not design variation why graphical data? visual perception more immediate than sequential scan of numbers and letters takes us from the specific and literal to the general and abstract - patterns visual arrangement of data can tell a story - universally understood Show data variation, not design variation KISIM, WIMiIP, AGH

stem and leaf plots the largest value is 2.4 and the smallest –2.3 … grouped frequency table ? KISIM, WIMiIP, AGH

frequency table KISIM, WIMiIP, AGH

histogram KISIM, WIMiIP, AGH

relative frequancy polygons wielobok częstości (skategoryzowany) KISIM, WIMiIP, AGH

cumulative frequency polygons (ogive) skumulowany skategoryzowany wielobok częstości dystrybuanta: prawdopodobieństwo, że zmienna przyjmie wartość < xi zarobki w WestRoad są wyższe KISIM, WIMiIP, AGH

pie chart multiple bar charts KISIM, WIMiIP, AGH

scatter plots time series plot KISIM, WIMiIP, AGH

klasyfikacja KISIM, WIMiIP, AGH

KISIM, WIMiIP, AGH

ramka-wąsy boxplot candlestick chart KISIM, WIMiIP, AGH

średnie w grupach KISIM, WIMiIP, AGH

fatal motorcycle accidents (Moss) KISIM, WIMiIP, AGH

which charts to use line charts bar charts scatter plots to analyze trends, patterns, and exceptions bar charts to investigate specific comparisons in time to compare categorical data scatter plots to visualize how two attributes vary together box plots, histograms to view and compare distributions KISIM, WIMiIP, AGH

KISIM, WIMiIP, AGH

Edward Tufte’s Graphical Efficiency Measures KISIM, WIMiIP, AGH

Big Data: Data Visualisation Through data visualisations we are able to draw conclusions from data that are sometimes not immediately obvious. It enables decision makers to see analytics presented visually, so they can grasp difficult concepts or identify new patterns. Data visualization can also: Identify areas that need attention or improvement. Clarify which factors influence customer behavior. Help you understand which products to place where. Predict sales volumes. KISIM, WIMiIP, AGH

Google Chart KISIM, WIMiIP, AGH

VEPAC variability plot KISIM, WIMiIP, AGH

Processing.js is a JavaScript library KISIM, WIMiIP, AGH

Browser market share (Jan 2002 to Aug 2009) -An interactive visual representation of browser market share from Jan 2002 to August 2009 http://www.axiis.org/examples/browsermarketshare.html KISIM, WIMiIP, AGH

Disease correlation When you catch sore throat do you also end up getting an ear infection? KISIM, WIMiIP, AGH

sentiment analysis of the customers’ social media posts Word clouds sentiment analysis of the customers’ social media posts KISIM, WIMiIP, AGH

Carrot2 clustering web search results

symbol maps KISIM, WIMiIP, AGH

Connectivity charts KISIM, WIMiIP, AGH

NewsMapping

Heat maps KISIM, WIMiIP, AGH

Podstawowe definicje i twierdzenia Rachunku Prawdopodobieństwa

Doświadczenie - zdarzenia – definiowanie przestrzeni zdarzeń– tworzenie modelu Przykład formalizacji opisu doświadczenia i zdarzenia: doświadczenie : egzamin zdarzenie: ocena z egzaminu Opis zbioru zdarzeń elementarnych (wszystkich możliwych wyników pojedynczego doświadczenia)  = {2, 3, 3.5, 4, 4.5, 5} ; #  = 6 Opis dowolnego „zdarzenia losowego”, jakie może mieć miejsce w danym doświadczeniu : A : oblany egzamin : A={2} B: zdany egzamin = uzyskanie oceny co najmniej 3: B={3, 3,5, 4, 4,5, 5} C: wynik egzaminu satysfakcjonujący np. uzyskanie oceny co najmniej dobry: C={4, 4,5, 5} Każde zdarzenie losowe jest podzbiorem zbioru zdarzeń 

Zdarzenia, przestrzeń zdarzeń – formalizacja opisu Niech i oznacza jeden z możliwych wyników prowadzonego doświadczenia (eksperymentu) i   , i jest elementem zbioru  = { 1 , 2 ...... n }, # = n Zbiór zdarzeń elementarnych, zawiera wszystkie możliwe wyniki danego doświadczenia (eksperymentu)  może być zbiorem skończonym albo zbiorem nieskończonym, to zależy od doświadczenia i liczby możliwych wyników

Zdarzenia losowe, Przestrzeń zdarzeń losowych Przestrzeń zdarzeń losowych stanowi zbiór wszystkich możliwych podzbiorów zbioru zdarzeń elementarnych Każde zdarzenie losowe A jest dowolnym podzbiorem zbioru  A   A’ jest zdarzeniem przeciwnym do zdarzenia A, i jest zdarzeniem losowym, bo zawiera te elementy przestrzeni  , które nie należą do zbioru A A’=  -A   Każde zdarzenie elementarne jest zdarzeniem losowym {1}   Zdarzenie pewne to cała przestrzeń, jest zdarzeniem losowym, bo zawiera się w sobie,    Zdarzenie niemożliwe  jest zdarzeniem losowym, bo jest przeciwne do zdarzenia pewnego  =  - 

Działania w przestrzeni zdarzeń losowych A  B – iloczyn zdarzeń, zawiera te zdarzenia elementarne, które sprzyjają zajściu obu zdarzeń A i B A   =  A   =A A  A’ =  Jeśli A  B , to A  B =A Jeśli A  B = , wtedy zdarzenia A i B są rozłączne Jeśli A  B  , wtedy zdarzenia A i B nie są rozłączne A  B suma zdarzeń, zawiera te zdarzenia elementarne, które są elementami zdarzenia losowego A lub są elementami zdarzenia B A  =A A =  A A’ =  Jeśli A  B to A  B = B

Działania w przestrzeni zdarzeń losowych A\ B różnica zdarzeń A i B, zawiera te zdarzenia elementarne, które należą do zbioru A i nie należą do zbioru B Zdarzenie A  B, nazywane różnicą symetryczną zdarzeń A i B, zachodzi wtedy i tylko wtedy gdy zachodzi jedno i tylko jedno ze zdarzeń A lub B Zadania: Udowodnić, że: (A  B)’ = A’  B’ (A  B)’= A’  B’

Wizualizacja relacji i wyników działań na zbiorach - Diagramy Venna

Przykład definiowania zdarzeń Wybieramy jednego studenta spośród przybyłych na wykład. Niech A oznacza zdarzenie, że wylosowano mężczyznę B nie pali papierosów C mieszka w akademiku Opisać zdarzenia: A  B  C’ Przy jakich warunkach zachodzi równość A  B  C =A Przy jakich warunkach zachodzi C’  B Czy równość A’= B jest spełniona gdy wszyscy mężczyźni palą

Przykład określania przestrzeni  dla różnych zadań np Przykład określania przestrzeni  dla różnych zadań np. w kontroli jakości wyrobów Losuję jeden egzemplarz i oceniam według wybranego kryterium i stwierdzam, że kontrolowany wyrób np. Jest dobry albo jest wadliwy Jest I klasy, jest II klasy, jest wybrakiem Jest czerwony, zielony, żółty, czarny...... Jest duży, średni, mały..... Jak określić przestrzeń , gdy kontrolujemy wymiary, ciężar, temperaturę, czas Losuję dwa/ trzy/ pięć egzemplarzy i otrzymuję......

W zaciekłej walce co najmniej Zadanie W zaciekłej walce co najmniej 70 % walczących straciło jedno oko 75 % straciło jedno ucho 80 % straciło jedną rękę 85 % straciło jedną nogę Jaka jest, co najmniej, ilość tych, którzy stracili jednocześnie ucho, oko, rękę i nogę ( Lewis Carol, A Tangled Tale, 1881r)

Aksjomatyczna definicja prawdopodobieństwa Zakładamy, że: A jest zdarzeniem losowym: tzn. A   Prawdopodobieństwo P jest funkcją : P: A  P (A) spełniającą następujące aksjomaty: P(A)  [0,1] P() = 1 P()=0 P(AB)= P(A)+P(B) jeśli AB=  albo 3’ P(AB)= P(A) +P(B) –P(AB)

Definicje prawdopodobieństwa (rachunkowe) Definicja klasyczna  jest zbiorem wszystkich zdarzeń elementarnych, (rozłącznych i jednakowo możliwych) A  , A jest zdarzeniem losowym Klasyczna definicja - wzór Laplace’a Sprawdzić, czy wzór Laplace’a spełnia wszystkie aksjomaty prawdopodobieństwa

Definicja geometryczna Przykład Obliczyć prawdopodobieństwo tego, że wybrany w sposób losowy punkt kwadratu: x <1, y<1 jest punktem wewnętrznym okręgu x2 +y2=1.

Definicja statystyczna Przykład. W ciągu 1000 dni prowadzono obserwacje meteorologiczne dotyczące siły wiatru i ciśnienia atmosferycznego. Założono, ze A oznacza zdarzenie : siła wiatru < 5 m/s , A’ =? B oznacza zdarzenie : ciśnienie < 1020 milibarów, B’ = ? Otrzymano następujące wyniki: Prawdopodobieństwa jakich zdarzeń można obliczać z tabelki   A A' Razem B 400 100 500 B' 200 300 600 1000

Podstawowe twierdzenia o prawdopodobieństwie P(A’) = 1- P(A), gdy A’ = -A P(AB) = P(A)+P(B)-P(AB) P(A/B) = P(AB)/P(B) P(AB) = P(A)*P(B)  A i B są niezależne

Zdarzenia wzajemnie wykluczające się Definicja: Zdarzenia A1, A2, A3,…. wzajemnie się wykluczają, jeśli żadne dwa z nich nie mają wspólnych elementów, czyli Ai  Aj =  i j : i,j =1,2,3,… Uwaga. Sumę dowolnych dwóch zdarzeń można przedstawić jako sumę zdarzeń wzajemnie wykluczających się A  B = I  II  III

Twierdzenie o prawdopodobieństwie całkowitym Z: A1 A2 ….  An=  , Ai  Aj =  i j : i,j =1,2,…,n Teza: P(B) = P(B/A1)*P(A1)+…..+ P(B/An)*P(An) Twierdzenie Bayesa: Teza: P(Ai/B) = [P(B/Ai)*P(Ai)]/P(B)

Zadania Obliczyć prawdopodobieństwo tego, że przypadkowo wzięta liczba naturalna jest podzielna przez 6 podzielna przez 2 lub 3 W pewnym przedsiębiorstwie 96% wyrobów jest dobrych. Na 100 dobrych wyrobów 75 jest pierwszego gatunku. Jakie jest prawdopodobieństwo zdarzenia, że losowo wybrany wyrób okaże się wyrobem I gatunku?

Zadanie Na egzaminie jest 10 zestawów pytań, kartka z numerem k zawiera najtrudniejszy zestaw pytań. Jakie jest prawdopodobieństwo, że żaden z pięciu zdających studentów nie wylosuje kartki z numerem k jeśli Losowanie jest bez zwracania (wylosowane kartki są odkładane) Losowanie jest ze zwracaniem – (kartka wylosowana przez jednego studenta wraca do puli i może być wylosowana przez innego zdającego) Który sposób losowania jest bardziej korzystny dla studentów?

Praktyczne zastosowanie twierdzeń W magazynie znajdują się pewne elementy do komputera pochodzące z dwóch fabryk, przy czym 40% z nich pochodzi z fabryki I, a 60% z fabryki II. Niezawodność (w czasie T) elementów z fabryki I wynosi 0,95 a z fabryki II 0,7. obliczyć prawdopodobieństwo, że losowo wzięty z magazynu element był wyprodukowany w fabryce I będzie poprawnie pracował przez czas T pochodzi z fabryki I jeśli stwierdzono, że poprawnie pracował przez czas T pochodzi z fabryki II jeśli stwierdzono, że poprawnie pracował przez czas T.