Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

LIWC2001 Linguistic Inquiry and Word Count () LIWC2001 Linguistic Inquiry and Word Count (James W. Pennebaker Martha E. Francis & Roger J Booth; www.liwc.net)

Podobne prezentacje


Prezentacja na temat: "LIWC2001 Linguistic Inquiry and Word Count () LIWC2001 Linguistic Inquiry and Word Count (James W. Pennebaker Martha E. Francis & Roger J Booth; www.liwc.net)"— Zapis prezentacji:

1 LIWC2001 Linguistic Inquiry and Word Count () LIWC2001 Linguistic Inquiry and Word Count (James W. Pennebaker Martha E. Francis & Roger J Booth; www.liwc.net) Anna Gabińska SWPS

2 LIWC – zasady działania: Liwc został zaprojektowany do analizowania pisanego tekstu na zasadzie słowo po słowie. Przystosowany do pracy na PC i Macintosh Forma zapisywania wyników analiz umożliwia łatwe transportowanie ich do SPPS-a lub Excela Analiza tekstu oparta jest o wyszukiwanie w tekście słów i rdzeni wyrazowych. mate mate hungr* - hungry, hungrier, hungriest hungr* - hungry, hungrier, hungriest * gwiazdka oznacza, że brane będą pod uwagę wszyskie litery, cyfry oraz łączniki. * gwiazdka oznacza, że brane będą pod uwagę wszyskie litery, cyfry oraz łączniki. Każde słowo lub rdzeń wyrazowy przypisany jest do jednej lub więcej kategorii.

3 LIWC2001 – zasady działania: Umożliwia pracę z wieloma plikami tekstowymi jednocześnie. Analizuje jeden plik po drugim. Proces analizy jednej strony z pojedynczymi odstępami zajmuje ułamek sekundy. Słowa w tekście analizowane są jedno po drugim przeszukiwanie słownika zgodność słowa tekstowego ze słownikowym powoduje wzrost na skali danej kategorii. Analiza tekstu obejmuje również strukturalne elementy: ilość słów, średnia ilość słów przypadająca na zdanie.

4 LIWC2001 – zasady działania: Oblicza procent słów występujących w tekście dla każdego z 74 wymiarów lingwistycznych. Wszystkie zmienne (oprócz [WC] – ilość słów, [WPS] średnia ilość słów w zdaniu, [Qmarks] procent zdań kończących się znakiem zapytania) odzwierciedlają procent wszystkich użytych słów. wynik 1,59 dla zaimka I oznacza, że 1,6% tekstu składa się z I. wynik 1,59 dla zaimka I oznacza, że 1,6% tekstu składa się z I.

5 LIWC2001 – słownik: 2,300 słów i rdzeni wyrazowych. Rozpoznaje około 80% słów używanych w mowie i piśmie. 74 kategorie: - (17) język standardowy - ilość słów, przyimki, zaimki, negacje - (25) konstrukty psychologiczne - emocje, procesy poznawcze - (10) relatywność - czas, ruch, przestrzeń - (19) sprawy osobiste – praca, dom, stany fizyczne, pieniądze - (3) eksperymentalne – przekleństwa, nonfluencies, fillers - Kategorie zorganizowane są w sposób hierarchiczny. Przykładowo wszystkie słowa związane z kategorią wściekłość są także włączone do kategorii emocji negatywnych i słów afektywnych.

6 LIWC2001 – słownik: Jeśli użytkownik chce może dodatkowo analizować numery, skróty i emotikony. Możliwość tworzenia własnych kategorii i słowników Ignoruje znaki większość znaków interpunkcyjnych (przecinki, dwukropki, też: @, &, + itp.. o ile nie są emotikonami)

7 Funkcje dodatkowe słownika: Kategorie warunkowe – możliwość podstawowej analizy kontekstowej Like (01 23)12/69 Like (01 23)12/69 - jeśli słowo poprzedzające like należy do kategorii 01 (zaimek) lub 23 (niezgodność – discrepancy) to like należy zaklasyfikować do kategorii 12 (afekt). W innym przypadku like należy przypisać do kategorii 69 (podobieństwo). - jeśli słowo poprzedzające like należy do kategorii 01 (zaimek) lub 23 (niezgodność – discrepancy) to like należy zaklasyfikować do kategorii 12 (afekt). W innym przypadku like należy przypisać do kategorii 69 (podobieństwo). Like (01 23)00/69 - 00 oznacza, że jeśli słowo poprzedzające like należy do kategorii 01 lub 23, to like nie powinno być przypisane do żadnej kategorii. W innym przypadku like należy zaklasyfikować do kategorii 69 (podobieństwo). - 00 oznacza, że jeśli słowo poprzedzające like należy do kategorii 01 lub 23, to like nie powinno być przypisane do żadnej kategorii. W innym przypadku like należy zaklasyfikować do kategorii 69 (podobieństwo). Like (01 23)13 - jeśli słowo poprzedzające like należy do kategorii 01 (zaimek) lub 23 (niezgodność) to like należy zaklasyfikować do kategorii 13 (afekt). W innym przypadku like należy pominąć w analizie.

8 Funkcje dodatkowe słownika: Kind 20/12 25/13 - jeśli of następuje po słowie kind, to kind należy przypisać do kategorii 20 (możliwy - tentative). W innym przypadku kind należy przypisać do kategorii 12 (afekt). - jeśli of następuje po słowie kind, to kind należy przypisać do kategorii 20 (możliwy - tentative). W innym przypadku kind należy przypisać do kategorii 12 (afekt). Kind 00/12 - 00 oznacza, że jeśli of następuje po słowie kind, to kind nie powinno być przypisane do żadnej kategorii. W innym przypadku kind należy przypisać do kategorii 12 (afekt). - 00 oznacza, że jeśli of następuje po słowie kind, to kind nie powinno być przypisane do żadnej kategorii. W innym przypadku kind należy przypisać do kategorii 12 (afekt). Kind 20 - jeśli of następuje po słowie kind, to kind powinno być zaklasyfikowane do kategorii 20. W innym przypadku like należy pominąć w analizie. - jeśli of następuje po słowie kind, to kind powinno być zaklasyfikowane do kategorii 20. W innym przypadku like należy pominąć w analizie.

9 Powstawanie słownika

10 Przygotowanie tekstu do analizy Plik w formacie text lub ASCII czyszczenie tekstu – poprawianie literówek i nieprawidłowego użycia słów (its a its). Błędy gramatyczne, struktura zdań oraz pisownia dużymi i małymi literami nie wymaga poprawek. Błędy gramatyczne, struktura zdań oraz pisownia dużymi i małymi literami nie wymaga poprawek. skróty skróty - Jan – January - dont, wont, isnt, shouldnt, cant, couldnt, Im, Ill, Id, were, wed, youre, hes, its etc. Sallys shoes & Sallys going out Sallys shoes & Sallys going out ( Sally is going out) ( Sally is going out)

11 Przygotowanie tekstu do analizy kropki i łączniki - Jeśli nie chcemy zliczać skrótów należy je zamienić na pojedyncze słowa: U.S. nie US (zaimek 1os. l.mn) tylko USA - 7:30 a.m. 7:30am - Self-esteem – wyrazy połączone łącznikiem tworzą jedno słowo fraza this-or-that this – or – that fraza this-or-that this – or – that

12 Przygotowanie tekstu do analizy Transkrypacje tekstów mówionych - nonfluencies: hmm, uhh, uhm, um, mm, er The, the bo-, the boat is there Uh, Uh, the boat is there The, the bo-, the boat is there Uh, Uh, the boat is there Huh? what? Huh? what? - fillers: you know, I mean, like youknow, Imean, rrlike - Tekst nie zrozumiały xxx

13 Wersja polska LIWCA


Pobierz ppt "LIWC2001 Linguistic Inquiry and Word Count () LIWC2001 Linguistic Inquiry and Word Count (James W. Pennebaker Martha E. Francis & Roger J Booth; www.liwc.net)"

Podobne prezentacje


Reklamy Google