Inteligentne konkordancje - narzędzia językowe nie tylko dla badaczy Korpus to zbiór celowo skompilowanych tekstów. Konkordancja to zestawienie cytatów z tekstów. Culler to narzędzie komputerowe dające dostęp do korpusów tekstowych, również w formie różnorodnych konkordancji.
Słowo - nasz ślad na ziemi Słowo obnażające lub trawestujące rzeczywistość zachwyca nie inaczej jak nieuchwytne gesty magika, który z pustego kapelusza wypuszcza gołębia. Umysł ludzki doznaje wielkiej rozkoszy, gdy rzeczy, na które się patrzy co dzień, ukazują się w nowym, nieznanym kształcie. Parandowski "Alchemia słowa"
The limits of my language indicate the limits of my world Każdy język jest inną mapą rzeczywistości. Mapę można rysować prosto z terenu lub z opisu. Stu Jay Raj zaczął od dwóch map, ma ich już 15. O wartości mapy decyduje obecność kontekstu i aktualność, których to brakuje słownikowi i dlatego potrzebne są korpusy i konkordancje! : Praga, Włochy
Kontekst Sytuacyjny Podniesieniem ręki w klasie zgłaszamy się do odpowiedzi. Ten sam gest na aukcji może dużo kosztować. Kulturowy You have extremely honoured me by coming into my abode. I am not worthy of it. This house is yours; you can burn it if you wish. My children are also at your disposal; I would sacrifice them all for your pleasure. What a blessed day this is, now that the light of your countenance has shone upon us. Tekstowy opieka Dziadek ma problem ze skasowaniem biletu w trzęsącym autobusie. Autobus zatrzymuje się na czerwonym świetle, a babcia woła: Wsadzaj póki stoi!
Konkordancja to zestawienie kontekstów wybranego wyrażenia być umiejscowionym stoi przy prawym rogu być napisanym tak stoi w piśmie mieć przystanek obłok kiedy stoi nad tonią być w pozycji wertykalnej (o stworzeniu, o człowieku) obok stoi giermek zasadzać się na na nim też stoi nasz ród zależeć na czymś o to jeno stoi z czego ma profit Leksykograf uzywa konkordancji
Konkordancja ciężki w kontekscie rzeczownika
Culler Simplicity of culler query comes from the assumption that a search phrase is a sequence with no optional skipped words.
Dostęp do szerszego kontekstu wybranego cytatu Mullein = dziewanna
Dostęp do szerszego kontekstu wybranego cytatu (korpus paralelny) Cięzki los = hard luck, fate, cruel destiny
Korpusy dostępne na Internecie w systemie Culler Teksty ogólne English Prose (31 mln) Polish Misc (50 mln) Swedish I-Press (28 mln) Teksty specjalistyczne StemCell (25 mln) Cancer (64 mln) Gene-Human (45 mln) Gene-Animal (38 mln) Gene-Human-Animal (23 mln) InformationFusion (4 mln) Teksty paralelne English, Swedish Acquis (9 mln) Lexware Culler www.nla.se/culler http://bergelmir.iki.his.se/culler
Korpus IPI PAN - ponad 100 000 000 słów Fragment konkordancji otrzymanej dla zapytania „śmiechu” z największego polskiego korpusu IPI PAN (ponad 100 000 000 słów)
Korpus IPI PAN dostępny jest w systemie Poliqarp Zapytanie [pos=*(subst|adj)*&orth=a.{4}] {2,} oznacza: sekwencja przynajmniej dwóch 5-literowych form rzeczownikowych lub przymiotnikowych zaczynających się na a Oprócz narzędzi analizy istotne są możliwości precyzyjnego i łatwego formułowania zapytań.
Trzy części okienka Cullera: pytanie, konkordancja, tabela
Szukamy przykładów mowy zależnej: &verb pan Zagłoba
rynek &adj
*?marknad*
&noun ”market”
Aktualność Co wyszło z mody? … owoc twojego żywota … nazwa frędzla u pasa (użyta np. w Panu Tadeuszu) Co się nosi w mówieniu? dokładnie, debeściak, wyguglowałam tego forumowicza super-, mega-, wyślę ci sms-a nie daliśmy radę
&new amfetamina bajt bannery biodynamiczny bioreaktor chipsy dresiarz dyskietka ego ekologizacja ekorozwój ekoturystyka empatyczny energooszczędny erogenny fan formatować gej globalizacja kompatybilny laptop link lobbying logo markowy monitoring ochroniarz oglądalność oszołom pizza pub ranking recykling sms sponsor wirtualny zafiksować zieloni
Słowotwórstwo: *encji=&new
tzw &new w korpusie Polish Blogs
(&noun &conj) &new w kontekscie +rybołówstwo w Polish Acquis
&new w tekście paralelnym
&new-word and &new-compound in Swedish
Nazw własnych nie ma w słowniku a wstyd nie odmieniać nazwisk ( Nazw własnych nie ma w słowniku a wstyd nie odmieniać nazwisk (* &prep) lund*=&name Lund zostało ufundowane prawdopodobnie pod koniec X wieku.
Nie jestem Robinem Hoodem (”nie jest”) &name &name
Dopełniacz czy biernik: &conj znaleźć &noun oraz nie znaleźć &noun
Użycie stanowi o języku - najdemokratyczniejszej instytucji ludzkości Język jest logiczny. Angielski ma więcej słów niż szwedzki. Języki ludów prymitywnych są prymitywne. Są języki proste i trudne. Jest jedna poprawna forma językowa. Jest jeden język polski. miejsca siedzące rusdrycksförsäljningsförordning języki kreolskie, FoxP2 aliikusersuillammassuaanerartassagaluarpaalli pastylki na ból i od bólu, świszcze świszczy śwista borówka, jagoda, zwolena, sławiena zaniechuje? = however they will say that he is a great entertainer, but however they will say that he is a great entertainer, but
jagoda i borówka w encyklopedii Jagoda (ang. berry, łac. bacca) – owoc mięsisty zawierający wewnątrz nasiona. Przykładem jagód są: pomidor, cytryna, pomarańcza, porzeczka, agrest, winorośl, borówka. Bywają również jagody stosunkowo duże, jak u orgórka czy dyni. Borówka czarna, jagoda, czernica, czarna jagoda, czarna borówka (Vaccinium myrtillus L. Sp.Pl.1 1753) - gatunek krzewinki z rodziny wrzosowatych (Ericaceae L.) wg innych systematyków brusznicowatych (Vacciniaceae S.Gray).
borówka wg korpusu paralelnego Acquis
jagoda wg korpusu paralelnego Acquis
Dostęp do słownika na życzenie lat. resultare studsa tillbaka grek. tekhnike tekhne konst, hantverk, skicklighet' fornsv. lagh ordning, ställning lat. pes fot fra. pionnier fotsoldat fornsv. stifta lågtyska. stiften grunda
Możemy sami tworzyć korpusy tekstowe Monitorujący, referencyjny, próbkowany, oportunistyczny Specjalistyczny: artykuły medyczne, językoznawcze, … Socjologiczny: blogi, teksty pisane przez kobiety, … Autorski: zebranych pism prezydenta Wałęsy, Testowy: foreign learners, … Ogólny: proza, prasa, debaty sejmowe, … …