Język R zagadnienia wstępne

Slides:



Advertisements
Podobne prezentacje
Programowanie Komputerów Studia I stopnia Rok I semestr 1
Advertisements

Graficzny klient SVN graficzny klient SVN integrujący się z powłoką systemu dostępny tylko dla systemu Windows - do pobrania z
20041 Projektowanie dynamicznych witryn internetowych Paweł Górczyński ASP 3.0.
Jarosław Kurek WZIM SGGW
Wykorzystanie konta uczelnianego dla potrzeb stron WWW
Zarządzanie operacjami
Prezentacja na temat Dos`a. Wykonał: Tomasz Kucharczyk
Konwersja klucza z formatu PEM (certyfikaty Gridowe) do PKCS12 Warsztaty promocyjne dla użytkowników usługi Michał Jankowski, PCSS.
Dodawanie i usuwanie oprogramowania
British Council Poland
Modelowanie symulacyjne
Wycena instrumentów pochodnych Wycena opcji. Jednoetapowa wycena europejskiego instrumentu pochodnego.
R.
Zaawansowane technologie Javy
PODSTAWY JĘZYKA PHP 1. czym jest 2. składnia 3. wersje 4. bazy danych
ASP.NET i platforma.NET Technologie internetowe ( ) Tomasz Popów
Nanosystemy informatyki zagadnienia i literatura
Wykład 2 struktura programu elementy języka typy zmienne
Projekt i implementacja narzędzia wspierającego zarządzanie siecią komputerową Dyplomant: Piotr Kodzis Promotor: mgr inż. Krzysztof Nierodka.
REPOZYTORIA 1. Co to są repozytoria?
Cytowania krok po kroku na podstawie Web of Science Opracowanie: Oddział Informacji Naukowej BG UO 2010.
Kurs CMKP Podstawy zdrowia publicznego
Pakiety w Javie Łukasz Smyczyński (132834). Czym są pakiety? Klasy w Javie są grupowane w pewne zbiory zwane pakietami. Pakiety są więc pewnym podzbiorem.
eFaktura w DHL Express Poland
„Ukryte” zasoby Internetu
Konfiguracja kont w programie Adobe Dreamweaver
Barbara Chmielewska, BUW GROMADZENIE ZBIORÓW W ERZE HUMANISTYKI CYFROWEJ Wrocław, czerwca 2013.
Warsztaty programowania w języku Python
Praca napisana pod kierownictwem dra Jacka Kobusa
Linux - polecenia.
Otwieranie elementów w różnych ramkach
Użytkowanie komputerów
instrukcja do projektu RSO
Przygotował: Paweł Ziaja
Przeglądanie zasobów komputera - uruchamianie programów
Sieciowe systemy operacyjne - UNIX
Internetowe surfowanie
Chyba najczęściej używaną przeglądarką internetową jest INTERNET EXPLORER, bo jest ona domyślnie instalowana w wiodącym na rynku polskim oprogramowaniu.
Platforma analizy wizualnej - VisNow Szkolenie Platforma analizy wizualnej - VisNow Szkolenie 15 maja 2013, Sesja sprawozdawcza KDM Krzysztof S. Nowiński.
Linux w sieci Konfigurowanie interfejsu sieciowego.
Systemy zarządzania treścią Wykład 5
Iwona Moczydłowska 4 listopada 2011r. Blogi w nauczaniu języka obcego.
Programowanie w języku C++
Analiza matematyczna i algebra liniowa
Aplikacje internetowe
XML Publisher Przedmiot i zakres szkolenia Przedmiot i zakres szkolenia Przeznaczenie XML Publisher Przeznaczenie XML Publisher Definiowanie Definiowanie.
Gramatyki Lindenmayera
Wprowadzenie do Sztucznej Inteligencji w zastosowaniach biznesowych
XML i nowoczesne technologie zarządzania treścią Wykład monograficzny Semestr zimowy 2008/09 Szymon ZiołoPatryk Czarnik
Temat 2: Instalacja Apache, PHP i bazy danych MySQL.
Projektowanie Aplikacji Internetowych Artur Niewiarowski Wydział Fizyki, Matematyki i Informatyki Politechnika Krakowska.
System operacyjny Windows
Zajęcia organizacyjne
System operacyjny „DOS”, „MS-DOS” oraz wybrane komendy.
Ukryty Internet (Web).
Literatura podstawowa
D l a B i b l i o t e k A k a d e m i c k i ch Piotr Antczak ABE Marketing Łódź, czerwiec 2010.
Twój pierwszy web projekt w Pythonie !
Skorzystaj z zasobów Polskiej Bibliografii Lekarskiej! Jeżeli chcesz korzystać z PBN w domu zapytaj się o hasło w Bibliotece PMWSZ Skorzystaj z zasobów.
Wizualizacja danych 0. Informacje wstępne Leszek J Chmielewski Wydział Zastosowań Informatyki i Matematyki SGGW lchmiel.pl.
Standard Template Library Czyli Es Te El. Co to jest? Po polskiemu STL to standardowa biblioteka szablonów, czyli biblioteka C++ zawierająca algorytmy,
I LICZBY ZESPOLONE ZBIORY FRAKTALNE. LICZBY ZESPOLONE.
Inż. Marcin Marcinkowski. W tym menu wybieramy co chcemy zweryfikować.
1 Komputerowe wspomaganie medycznej diagnostyki obrazowej dr inż.. Grażyna Gilewska materiały na stronie:
Strumienie, Wczytywanie, Zapisywanie, Operacje na plikach
Hipertekst HTML WWW.
Poradnik: Polska Bibliografia Lekarska - Jak szukać literatury na wybrany temat w Bibliotece i Centrum Informacji Naukowej PMWSZ w Opolu.
Linux ssh.
System operacyjny „DOS”, „MS-DOS” oraz wybrane komendy.
EconBiz – wirtualna biblioteka ekonomiczna
Zapis prezentacji:

Język R zagadnienia wstępne dr Jarosław Olejniczak Jaroslaw.Olejniczak@wat.edu.pl

Literatura M. Walesiak, Statystyczna analiza danych z wykorzystaniem programu R, Warszawa: Wydawnictwo Naukowe PWN, 2009. Kopczewska K., Kopczewski T., i Wojcik P., Metody Ilościowe w R. Aplikacje ekonomiczne i finansowe, CEDEWU.PL Wydawnictwa Fachowe, 2009. P. Biecek, Przewodnik po pakiecie R, Wrocław: Oficyna Wydawnicza GIS, 2008. B. Everitt, A handbook of statistical analyses using R, Boca Raton: Chapman & Hall/CRC, 2006. R. Baayen, Analyzing linguistic data : a practical introduction to statistics using R, Cambridge UK ;;New York: Cambridge University Press, 2008. P. Spector, Data manipulation With R, New York: Springer Verlag, 2008.

Strona języka R http://www.r-project.org/

Biblioteki http://cran.r-project.org/web/views/

Nakładki graficzne R- Commander (pakiet Rcmdr) Pakiet PMG Tinn-R http://sourceforge.net/projects/tinn-r/ RKward (linuks)

Należy uważać na : Kształt cudzysłowów Wielkie i małe litery Spacje Nazwy obiektów jak nazwy komend - R Polskie znaki

Pakiety w R Instalacja Instalowanie z intemetu : Packages -> Install package (s) Z zasobów lokalnych : Packages -> Install package (s) from local zip files… Bezpośrednio komendą : install.packages(„nazwa") # instalacja pakietu

Pakiety w R Używanie zainstalowanych pakietów Pakiety wprowadza się do pamięci komendą: library(nazwa pakietu) Aby sprawdzić jakie pakiety są załadowane do pamięci należy wykonać komendę: search() Aby odszukać ścieżkę dostępu do zainstalowanego pakietu należy wykonać komendę: .find.package(„pakiet”) Zawartość pakietu można wyświetlić komendą : library(help=„nazwa pakietu”) Listę komend pakietu można uzyskać za pomocą: ls(„package:nazwa pakietu”)

Wczytywanie danych wejściowych z pliku tekstowego dane1<-read.table("X:/daneR/dane.txt", header=TRUE, sep="\t") Opcje: separator danych: średnik (sep=";"), tabulacja (sep=„/t"); spacja (sep=" ") oznaczenie znaku dziesiętnego: kropka (dec=". "), przecinek (dec=" , " ) nagłówki: przyjęcie, że pierwszy wiersz jest nagłówkiem (header=T; T dla domyślnie TRUE / lub F dla domyślnie od FALSE); opcje mogą być wpisywane w dowolnej kolejności.

Wczytywanie danych wejściowych z formatu SPSS dane2<-read.spss("X:/daneR/dane.sav", use.value.labels=FALSE, to.data.frame=TRUE) Opcje: separator danych: średnik (sep=";"), tabulacja (sep=„/t"); spacja (sep=" ") oznaczenie znaku dziesiętnego: kropka (dec=". "), przecinek (dec=" , " ) nagłówki: przyjęcie, że pierwszy wiersz jest nagłówkiem (header=T; T dla domyślnie TRUE / lub F dla domyślnie od FALSE); opcje mogą być wpisywane w dowolnej kolejności.

Wczytywanie danych wejściowych z pliku dbf dane3<-read.dbf("X:/daneR/dane.dbf") Opcje: separator danych: średnik (sep=";"), tabulacja (sep=„/t"); spacja (sep=" ") oznaczenie znaku dziesiętnego: kropka (dec=". "), przecinek (dec=" , " ) nagłówki: przyjęcie, że pierwszy wiersz jest nagłówkiem (header=T; T dla domyślnie TRUE / lub F dla domyślnie od FALSE); opcje mogą być wpisywane w dowolnej kolejności.

Wczytywanie danych wejściowych z pliku rozdzielanego tabulacją dane4<-read.delim("X:/daneR/dane.dat", header=FALSE, sep="\t") Opcje: separator danych: średnik (sep=";"), tabulacja (sep=„/t"); spacja (sep=" ") oznaczenie znaku dziesiętnego: kropka (dec=". "), przecinek (dec=" , " ) nagłówki: przyjęcie, że pierwszy wiersz jest nagłówkiem (header=T; T dla domyślnie TRUE / lub F dla domyślnie od FALSE); opcje mogą być wpisywane w dowolnej kolejności.

Wczytywanie danych wejściowych z pliku csv dane5<-read.csv("X:/daneR/dane.csv", header=TRUE, sep=";",dec=".") Opcje: separator danych: średnik (sep=";"), tabulacja (sep=„/t"); spacja (sep=" ") oznaczenie znaku dziesiętnego: kropka (dec=". "), przecinek (dec=" , " ) nagłówki: przyjęcie, że pierwszy wiersz jest nagłówkiem (header=T; T dla domyślnie TRUE / lub F dla domyślnie od FALSE); opcje mogą być wpisywane w dowolnej kolejności.

Wczytywanie danych wejściowych z pliku Excelowego Należy zainstalować pakiet RODBC Przykład library(RODBC) setwd("d:/Jarek/Jezyk R/SSN") dane <- odbcConnectExcel("WE.xls") WE <- sqlQuery(dane, "select * from [Arkusz1$]") UWAGA : Można też zainstalować pakiet xlsReadWrite

Wczytywanie danych wejściowych za pomocą programu R Commander (pakiet Rcmdr)

Typy danych Typ liczbowy

Typy danych Wektor Wektor to ciąg liczb, łańcuchów tekstowych lub wartości logicznych prawda / fałsz. Najpopularniejszym konstruktorem (funkcją tworzącą obiekt danego typu) wektora jest funkcja: c(wartości ciągu , oddzielone przecinkami)

Typy danych Wektor – inne konstruktory (2) <początek> : <koniec>

Typy danych Wektor – inne konstruktory (2) Funkcja seq również zwraca sekwencję liczb z przedziału (a bardziej precyzyjnie ciąg arytmetyczny)

Typy danych Wektor – inne konstruktory (3) Wektor losowych liczb z określonego przedziału i o zadanej długości:

Typy danych Wektor – inne konstruktory (4) Replikacja

Typy danych Typ czynnikowy (wyliczeniowy) Ten typ jest przydatny do przechowywania wektorów wartości występujących na kilku poziomach (w kilku kategoriach). Przykładowo płeć występuje na dwóch poziomach, tzn. może przyjmować tylko dwie wartości

Typy danych lista Podobnie jak wektor, lista to również uporządkowany zbiór elementów. W przeciwieństwie do wektora, elementy Listy mogą mieć różne typy.

Typy danych lista Podobnie jak wektor, lista to również uporządkowany zbiór elementów. W przeciwieństwie do wektora, elementy Listy mogą mieć różne typy.

Typy danych Tablica Tablica to obiekt zawierający grupę elementów tego samego typu. Tym co odróżnia tablicę od wektorów jest fakt, iż elementy tablicy mogą być indeksowane w jednym lub więcej wymiarach. Do stworzenia tablicy służy funkcja array (dane_początkowe, wymiary).

Typy danych Tablica Do określenia wymiarów tablicy służą komendy: dim, nrow, ncol

Typy danych Macierz Macierz to tablica dwuwymiarowa. Do stworzenia tablicy służy funkcja : matrix (dane_początkowe, wymiary)

Typy danych Macierz Użycie parametru byrow umożliwia zmianę sposobu wpisywania danych na „wiersz po wierszu".

Typy danych Macierz - operatory %*% — operator mnożenia macierzy.

Typy danych Macierz - operatory det ( ) — obliczenie wyznacznika macierzy kwadratowej.

Typy danych Macierz - operatory solve (A) — macierz odwrotna do nieosobliwej macierzy kwadratowej A.

Typy danych Macierz - operatory t (A) — macierz transponowana.

Typy danych Tabela danych (ramka danych) Szczególnym typem obiektu jest ramka danych, którą można traktować jak listę wektorów o tej samej długości. Ramka danych może być wyświetlana jako macierz, w której elementy w kolumnie są tego samego typu, ale mogą różnić się typem pomiędzy kolumnami. Konstruktorem ramki danych jest funkcja: data.frame ().

Typy danych Funkcje sprawdzające typ danych W pakiecie gdata funkcje: class() oraz is.what()

Typy danych Konwersja typu zmiennej as.numeric(base) Konwersja na wartość liczbową. as.integer(base) Konwersja na wartość całkowitoliczbową. as.double(base) Konwersja na wartość rzeczywistą. as.logical(base) Konwersja na wartość logiczną. as.character(base) Konwersja na typ znakowy. as.factor(base) Konwersja na typ wyliczeniowy. as.list(base) Konwersja do listy. unlist(base) Konwersja z listy do wektora. as.matrix(base) Konwersja na macierz. as.data.frame(base) Konwersja na ramkę danych.

Operatory Rodzaje operatorów w R +,-,*, /, ^ Standardowe operatory arytmetyczne. Oba argumenty powinny mieć taki sam wymiar (macierze lub wektory). %x% Iloczyn Kroneckera dwóch macierzy. %% Reszta modulo z dzielenia. %/% Dzielenie całkowite %*% Iloczyn dwóch macierzy. <,==,>,<=,>=,!= Standardowe operatory porównywania wartości liczbowych. ! operator negacji. &,&&, I, II Logiczny iloczyn oraz logiczna suma. any(), all() Logiczna suma(iloczyn) wszystkich elementów wektora.

Operatory Operatory & i I a && i I I Operatory & i | służą do wykonywania operacji na listach lub wektorach, podczas gdy && i || na pojedynczych wartościach,

Operatory Instrukcje warunkowe Instrukcja if ….. else …….

Operatory Instrukcje warunkowe Funkcja ifelse() pozwala na wykonanie ciągu działań w zależności od wektora warunków logicznych. ifelse(war, instrl, instr2)

Operatory Instrukcje warunkowe W pewnych sytuacjach zbiór możliwych akcji, które chcemy wykonać jest większy niż 2. Wtedy sprawdza się instrukcja warunkowa switch() o następującej składni: switch(klucz, wartosc1 = akcjal, wartosc2 = akcja2, ...) Pierwszy argument powinien być typu znakowego lub typu czynnikowego (factor).