LIWC2001 Linguistic Inquiry and Word Count () LIWC2001 Linguistic Inquiry and Word Count (James W. Pennebaker Martha E. Francis & Roger J Booth; www.liwc.net)

Slides:



Advertisements
Podobne prezentacje
Copyright © The OWASP Foundation Permission is granted to copy, distribute and/or modify this document under the terms of the OWASP License. The OWASP.
Advertisements

dr A Kwiatkowska Instytut Informatyki
Wprowadzenie do języka skryptowego PHP
Bazy danych II Instrukcja SELECT Piotr Górczyński 25/08/2001.
CZASOWNIK „BE”- „BYĆ” odmiana przez osoby
Wprowadzenie do eksploracji tekstu i technik płytkiej analizy tekstu
Wyszukiwanie i zapisywanie informacji
Opracował: Nowak Paweł
Przecinki.
wyzwaniem dla interpunkcji
wyzwaniem dla interpunkcji
OPERATORY WYSZUKIWAWCZE
(c) 1999, Instytut Informatyki Politechniki Poznańskiej Rozdział 2: Język bazy danych - SQL Proste zapytania.
Pakiety statystyczne Maciej Szydłowski (dr)
Wykład 2: Systemy klasy C.A.T. (Computer-Aided Translation)
Funkcje agregujące Funkcja Opis Minimum Maksimum Średnia arytmetyczna
SO – LAB3 Wojciech Pieprzyca
BD-LAB6 Wojciech Pieprzyca
Tworzenie stron w języku WML jest zbliżone do tworzenia stron w HTML. W obydwu przypadkach używa się do tego celu znaczników (tagów). Zadaniem znaczników.
Edytor tekstu.
Google – sposoby wyszukiwania
Budowa i układ strony dokumentu
Temat: Porządkowanie i ochrona dokumentów komputerowych.
Strategia skutecznego szukania informacji w Internecie
Podstawy programowania
Pakiety w Javie Łukasz Smyczyński (132834). Czym są pakiety? Klasy w Javie są grupowane w pewne zbiory zwane pakietami. Pakiety są więc pewnym podzbiorem.
Język angielski czasy PRESENT SIMPLE NACIŚNIJ SPACJĘ Zdiełał piotrp 
Opracował Wiesław Rychlicki na podstawie:
Opracował Wiesław Rychlicki na podstawie:
Strona formalna tekstu
Turbo Pascal Turbo Pascal - jedna z popularniejszych implementacji kompilatorów języka PASCAL, zintegrowane srodowisko programistyczne, produkt firmy Borland.
Opracowanie Anna Madeksza nauczyciel bibliotekarz
Wprowadzenie do edytorów tekstu.
Poznaj bliżej program Microsoft Office Word 2007
Wskazówki dotyczące pisania tekstów
Ułamki dziesiętne Ułamki dziesiętne o mianowniku 10, 100, 1000, ...
Objawy DYSLEKSJI.
Efektywne wyszukiwanie informacji w Internecie by Katarzyna Wilk is licensed under a Creative Commons Uznanie autorstwa-Użycie niekomercyjne-Bez utworów.
Poznajemy edytor tekstu Word
JAVA c.d.. Instrukcji wyboru SWITCH używamy, jeśli chcemy w zależności od wartości pewnego wyrażenia wykonać jeden z kilku fragmentów kodu. Jest to w.
Poznajemy edytor tekstu Microsoft Word
XML – eXtensible Markup Language
Edytor tekstu Word.
SZKOŁA Z KLASĄ 2.0 English SOS.
CZAS PRESENT CONTINUOUS.
Projektowanie stron WWW
Podstawy języka Instrukcje - wprowadzenie
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Znaki specjalne Co i jak + brak przykładów.  Aby wstawić symbol lub znak specjalny należy na karcie Wstawianie w grupie Symbole kliknąć na przycisk Symbol.
Aplikacje internetowe CSS - style fontów, tekstu Ciąg dalszy.
Zmienne i typy danych w C#
Modelowanie Kognitywne
ZASADY WPROWADZANIA TEKSTU DO KOMPUTERA Magdalena Szorc Mirosław Brozio
Najczęściej popełniane błędy formalne w pracy dyplomowej
Typy danych, klucz podstawowy, klucz obcy
Zwrot going to – określa nasze plany na przyszłość lub przewidywania:
PHP. PHP obiektowy, skryptowy język programowania zaprojektowany do generowania stron internetowych w czasie rzeczywistym.
TEMAT: ACCESS - KWERENDY.
K ODY ZMIENNEJ DŁUGOŚCI Alfabet Morsa Kody Huffmana.
 Praktyczne sposoby wpisywania adresu:  pomijanie autouzupełnianie  próba samodzielnego tworzenia poprzez sprawdzanie podstawowych kombinacji.
Wyszukiwanie informacji w Internecie Marcin Wojnowski.
BAZY DANYCH Microsoft Access Akademia Górniczo-Hutnicza Wydział Elektrotechniki, Automatyki, Informatyki i Inżynierii Biomedycznej Katedra Automatyki i.
Tajemnicze pismo Potrzebne: Działanie
 Formuła to wyrażenie algebraiczne (wzór) określające jakie operacje ma wykonać program na danych. Może ona zawierać liczby, łańcuchy znaków, funkcje,
Dariusz Nikiel. Klawisza ENTER używamy w celu zakończenia akapitu, a nie na końcu każdej linijki tekstu lub zdania. Klawisza ENTER używamy w celu zakończenia.
Egzamin gimnazjalny z języka angielskiego - poziom podstawowy.
Wyrażanie przyszłości w języku angielskim
Jak zwiększyć oglądalność materiałów wideo?
Wprowadzenie do edytorów tekstu.
Poznajemy edytor tekstu Word
Zapis prezentacji:

LIWC2001 Linguistic Inquiry and Word Count () LIWC2001 Linguistic Inquiry and Word Count (James W. Pennebaker Martha E. Francis & Roger J Booth; Anna Gabińska SWPS

LIWC – zasady działania: Liwc został zaprojektowany do analizowania pisanego tekstu na zasadzie słowo po słowie. Przystosowany do pracy na PC i Macintosh Forma zapisywania wyników analiz umożliwia łatwe transportowanie ich do SPPS-a lub Excela Analiza tekstu oparta jest o wyszukiwanie w tekście słów i rdzeni wyrazowych. mate mate hungr* - hungry, hungrier, hungriest hungr* - hungry, hungrier, hungriest * gwiazdka oznacza, że brane będą pod uwagę wszyskie litery, cyfry oraz łączniki. * gwiazdka oznacza, że brane będą pod uwagę wszyskie litery, cyfry oraz łączniki. Każde słowo lub rdzeń wyrazowy przypisany jest do jednej lub więcej kategorii.

LIWC2001 – zasady działania: Umożliwia pracę z wieloma plikami tekstowymi jednocześnie. Analizuje jeden plik po drugim. Proces analizy jednej strony z pojedynczymi odstępami zajmuje ułamek sekundy. Słowa w tekście analizowane są jedno po drugim przeszukiwanie słownika zgodność słowa tekstowego ze słownikowym powoduje wzrost na skali danej kategorii. Analiza tekstu obejmuje również strukturalne elementy: ilość słów, średnia ilość słów przypadająca na zdanie.

LIWC2001 – zasady działania: Oblicza procent słów występujących w tekście dla każdego z 74 wymiarów lingwistycznych. Wszystkie zmienne (oprócz [WC] – ilość słów, [WPS] średnia ilość słów w zdaniu, [Qmarks] procent zdań kończących się znakiem zapytania) odzwierciedlają procent wszystkich użytych słów. wynik 1,59 dla zaimka I oznacza, że 1,6% tekstu składa się z I. wynik 1,59 dla zaimka I oznacza, że 1,6% tekstu składa się z I.

LIWC2001 – słownik: 2,300 słów i rdzeni wyrazowych. Rozpoznaje około 80% słów używanych w mowie i piśmie. 74 kategorie: - (17) język standardowy - ilość słów, przyimki, zaimki, negacje - (25) konstrukty psychologiczne - emocje, procesy poznawcze - (10) relatywność - czas, ruch, przestrzeń - (19) sprawy osobiste – praca, dom, stany fizyczne, pieniądze - (3) eksperymentalne – przekleństwa, nonfluencies, fillers - Kategorie zorganizowane są w sposób hierarchiczny. Przykładowo wszystkie słowa związane z kategorią wściekłość są także włączone do kategorii emocji negatywnych i słów afektywnych.

LIWC2001 – słownik: Jeśli użytkownik chce może dodatkowo analizować numery, skróty i emotikony. Możliwość tworzenia własnych kategorii i słowników Ignoruje znaki większość znaków interpunkcyjnych (przecinki, dwukropki, &, + itp.. o ile nie są emotikonami)

Funkcje dodatkowe słownika: Kategorie warunkowe – możliwość podstawowej analizy kontekstowej Like (01 23)12/69 Like (01 23)12/69 - jeśli słowo poprzedzające like należy do kategorii 01 (zaimek) lub 23 (niezgodność – discrepancy) to like należy zaklasyfikować do kategorii 12 (afekt). W innym przypadku like należy przypisać do kategorii 69 (podobieństwo). - jeśli słowo poprzedzające like należy do kategorii 01 (zaimek) lub 23 (niezgodność – discrepancy) to like należy zaklasyfikować do kategorii 12 (afekt). W innym przypadku like należy przypisać do kategorii 69 (podobieństwo). Like (01 23)00/ oznacza, że jeśli słowo poprzedzające like należy do kategorii 01 lub 23, to like nie powinno być przypisane do żadnej kategorii. W innym przypadku like należy zaklasyfikować do kategorii 69 (podobieństwo) oznacza, że jeśli słowo poprzedzające like należy do kategorii 01 lub 23, to like nie powinno być przypisane do żadnej kategorii. W innym przypadku like należy zaklasyfikować do kategorii 69 (podobieństwo). Like (01 23)13 - jeśli słowo poprzedzające like należy do kategorii 01 (zaimek) lub 23 (niezgodność) to like należy zaklasyfikować do kategorii 13 (afekt). W innym przypadku like należy pominąć w analizie.

Funkcje dodatkowe słownika: Kind 20/12 25/13 - jeśli of następuje po słowie kind, to kind należy przypisać do kategorii 20 (możliwy - tentative). W innym przypadku kind należy przypisać do kategorii 12 (afekt). - jeśli of następuje po słowie kind, to kind należy przypisać do kategorii 20 (możliwy - tentative). W innym przypadku kind należy przypisać do kategorii 12 (afekt). Kind 00/ oznacza, że jeśli of następuje po słowie kind, to kind nie powinno być przypisane do żadnej kategorii. W innym przypadku kind należy przypisać do kategorii 12 (afekt) oznacza, że jeśli of następuje po słowie kind, to kind nie powinno być przypisane do żadnej kategorii. W innym przypadku kind należy przypisać do kategorii 12 (afekt). Kind 20 - jeśli of następuje po słowie kind, to kind powinno być zaklasyfikowane do kategorii 20. W innym przypadku like należy pominąć w analizie. - jeśli of następuje po słowie kind, to kind powinno być zaklasyfikowane do kategorii 20. W innym przypadku like należy pominąć w analizie.

Powstawanie słownika

Przygotowanie tekstu do analizy Plik w formacie text lub ASCII czyszczenie tekstu – poprawianie literówek i nieprawidłowego użycia słów (its a its). Błędy gramatyczne, struktura zdań oraz pisownia dużymi i małymi literami nie wymaga poprawek. Błędy gramatyczne, struktura zdań oraz pisownia dużymi i małymi literami nie wymaga poprawek. skróty skróty - Jan – January - dont, wont, isnt, shouldnt, cant, couldnt, Im, Ill, Id, were, wed, youre, hes, its etc. Sallys shoes & Sallys going out Sallys shoes & Sallys going out ( Sally is going out) ( Sally is going out)

Przygotowanie tekstu do analizy kropki i łączniki - Jeśli nie chcemy zliczać skrótów należy je zamienić na pojedyncze słowa: U.S. nie US (zaimek 1os. l.mn) tylko USA - 7:30 a.m. 7:30am - Self-esteem – wyrazy połączone łącznikiem tworzą jedno słowo fraza this-or-that this – or – that fraza this-or-that this – or – that

Przygotowanie tekstu do analizy Transkrypacje tekstów mówionych - nonfluencies: hmm, uhh, uhm, um, mm, er The, the bo-, the boat is there Uh, Uh, the boat is there The, the bo-, the boat is there Uh, Uh, the boat is there Huh? what? Huh? what? - fillers: you know, I mean, like youknow, Imean, rrlike - Tekst nie zrozumiały xxx

Wersja polska LIWCA