Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Inteligentne konkordancje - narzędzia językowe nie tylko dla badaczy

Podobne prezentacje


Prezentacja na temat: "Inteligentne konkordancje - narzędzia językowe nie tylko dla badaczy"— Zapis prezentacji:

1 Inteligentne konkordancje - narzędzia językowe nie tylko dla badaczy
Korpus to zbiór celowo skompilowanych tekstów. Konkordancja to zestawienie cytatów z tekstów. Culler to narzędzie komputerowe dające dostęp do korpusów tekstowych, również w formie różnorodnych konkordancji.

2 Słowo - nasz ślad na ziemi
Słowo obnażające lub trawestujące rzeczywistość zachwyca nie inaczej jak nieuchwytne gesty magika, który z pustego kapelusza wypuszcza gołębia. Umysł ludzki doznaje wielkiej rozkoszy, gdy rzeczy, na które się patrzy co dzień, ukazują się w nowym, nieznanym kształcie. Parandowski "Alchemia słowa"

3 The limits of my language indicate the limits of my world
Każdy język jest inną mapą rzeczywistości. Mapę można rysować prosto z terenu lub z opisu. Stu Jay Raj zaczął od dwóch map, ma ich już 15. O wartości mapy decyduje obecność kontekstu i aktualność, których to brakuje słownikowi i dlatego potrzebne są korpusy i konkordancje! : Praga, Włochy

4 Kontekst Sytuacyjny Podniesieniem ręki w klasie zgłaszamy się do odpowiedzi. Ten sam gest na aukcji może dużo kosztować. Kulturowy You have extremely honoured me by coming into my abode. I am not worthy of it. This house is yours; you can burn it if you wish. My children are also at your disposal; I would sacrifice them all for your pleasure. What a blessed day this is, now that the light of your countenance has shone upon us. Tekstowy opieka Dziadek ma problem ze skasowaniem biletu w trzęsącym autobusie. Autobus zatrzymuje się na czerwonym świetle, a babcia woła: Wsadzaj póki stoi!

5 Konkordancja to zestawienie kontekstów wybranego wyrażenia
być umiejscowionym stoi przy prawym rogu być napisanym tak stoi w piśmie mieć przystanek obłok kiedy stoi nad tonią być w pozycji wertykalnej (o stworzeniu, o człowieku) obok stoi giermek zasadzać się na na nim też stoi nasz ród zależeć na czymś o to jeno stoi z czego ma profit Leksykograf uzywa konkordancji

6 Konkordancja ciężki w kontekscie rzeczownika

7 Culler Simplicity of culler query comes from the assumption that a search phrase is a sequence with no optional skipped words.

8 Dostęp do szerszego kontekstu wybranego cytatu
Mullein = dziewanna

9 Dostęp do szerszego kontekstu wybranego cytatu (korpus paralelny)
Cięzki los = hard luck, fate, cruel destiny

10 Korpusy dostępne na Internecie w systemie Culler
Teksty ogólne English Prose (31 mln) Polish Misc (50 mln) Swedish I-Press (28 mln) Teksty specjalistyczne StemCell (25 mln) Cancer (64 mln) Gene-Human (45 mln) Gene-Animal (38 mln) Gene-Human-Animal (23 mln) InformationFusion (4 mln) Teksty paralelne English, Swedish Acquis (9 mln) Lexware Culler

11 Korpus IPI PAN - ponad 100 000 000 słów
Fragment konkordancji otrzymanej dla zapytania „śmiechu” z największego polskiego korpusu IPI PAN (ponad słów)

12 Korpus IPI PAN dostępny jest w systemie Poliqarp
Zapytanie [pos=*(subst|adj)*&orth=a.{4}] {2,} oznacza: sekwencja przynajmniej dwóch 5-literowych form rzeczownikowych lub przymiotnikowych zaczynających się na a Oprócz narzędzi analizy istotne są możliwości precyzyjnego i łatwego formułowania zapytań.

13 Trzy części okienka Cullera: pytanie, konkordancja, tabela

14 Szukamy przykładów mowy zależnej: &verb pan Zagłoba

15 rynek &adj

16 *?marknad*

17 &noun ”market”

18 Aktualność Co wyszło z mody? … owoc twojego żywota … nazwa frędzla u pasa (użyta np. w Panu Tadeuszu) Co się nosi w mówieniu? dokładnie, debeściak, wyguglowałam tego forumowicza super-, mega-, wyślę ci sms-a nie daliśmy radę

19 &new amfetamina bajt bannery biodynamiczny bioreaktor chipsy dresiarz
dyskietka ego ekologizacja ekorozwój ekoturystyka empatyczny energooszczędny erogenny fan formatować gej globalizacja kompatybilny laptop link lobbying logo markowy monitoring ochroniarz oglądalność oszołom pizza pub ranking recykling sms sponsor wirtualny zafiksować zieloni

20 Słowotwórstwo: *encji=&new

21 tzw &new w korpusie Polish Blogs

22 (&noun &conj) &new w kontekscie +rybołówstwo w Polish Acquis

23 &new w tekście paralelnym

24 &new-word and &new-compound in Swedish

25 Nazw własnych nie ma w słowniku a wstyd nie odmieniać nazwisk (
Nazw własnych nie ma w słowniku a wstyd nie odmieniać nazwisk (* &prep) lund*=&name Lund zostało ufundowane prawdopodobnie pod koniec X wieku.

26 Nie jestem Robinem Hoodem (”nie jest”) &name &name

27 Dopełniacz czy biernik: &conj znaleźć &noun oraz nie znaleźć &noun

28 Użycie stanowi o języku - najdemokratyczniejszej instytucji ludzkości
Język jest logiczny. Angielski ma więcej słów niż szwedzki. Języki ludów prymitywnych są prymitywne. Są języki proste i trudne. Jest jedna poprawna forma językowa. Jest jeden język polski. miejsca siedzące rusdrycksförsäljningsförordning języki kreolskie, FoxP2 aliikusersuillammassuaanerartassagaluarpaalli pastylki na ból i od bólu, świszcze świszczy śwista borówka, jagoda, zwolena, sławiena zaniechuje? = however they will say that he is a great entertainer, but however they will say that he is a great entertainer, but

29 jagoda i borówka w encyklopedii
Jagoda (ang. berry, łac. bacca) – owoc mięsisty zawierający wewnątrz nasiona. Przykładem jagód są: pomidor, cytryna, pomarańcza, porzeczka, agrest, winorośl, borówka. Bywają również jagody stosunkowo duże, jak u orgórka czy dyni. Borówka czarna, jagoda, czernica, czarna jagoda, czarna borówka (Vaccinium myrtillus L. Sp.Pl ) - gatunek krzewinki z rodziny wrzosowatych (Ericaceae L.) wg innych systematyków brusznicowatych (Vacciniaceae S.Gray).

30 borówka wg korpusu paralelnego Acquis

31 jagoda wg korpusu paralelnego Acquis

32 Dostęp do słownika na życzenie
lat. resultare studsa tillbaka grek. tekhnike tekhne konst, hantverk, skicklighet' fornsv. lagh ordning, ställning lat. pes fot fra. pionnier fotsoldat fornsv. stifta lågtyska. stiften grunda

33 Możemy sami tworzyć korpusy tekstowe
Monitorujący, referencyjny, próbkowany, oportunistyczny Specjalistyczny: artykuły medyczne, językoznawcze, … Socjologiczny: blogi, teksty pisane przez kobiety, … Autorski: zebranych pism prezydenta Wałęsy, Testowy: foreign learners, … Ogólny: proza, prasa, debaty sejmowe, …


Pobierz ppt "Inteligentne konkordancje - narzędzia językowe nie tylko dla badaczy"

Podobne prezentacje


Reklamy Google