Inteligentne konkordancje - narzędzia językowe nie tylko dla badaczy

Slides:



Advertisements
Podobne prezentacje
I część 1.
Advertisements

Znaki informacyjne.
The Thousand Islands Pan kiedyś stanął na brzegu
POWIAT MYŚLENICKI Tytuł Projektu: Poprawa płynności ruchu w centrum Myślenic poprzez przebudowę skrzyżowań dróg powiatowych K 1935 i K 1967na rondo.
Ludwik Antal - Numeryczna analiza pól elektromagnetycznych –W10
Liczby pierwsze.
Budowa i funkcje elektronicznego katalogu biblioteki szkolnej
KONKURS WIEDZY O SZTUCE
Trevor Hawes kzns.pl The Power of a new Perspective: Psalm 73.
Ministerstwo Gospodarki Poland'sexperience Waldemar Pawlak Deputy Prime Minister, Minister of Economy March 2010.
Google – sposoby wyszukiwania
-Witam nazywam się Weronika Zgorzelska oraz Oliwia Kołakowska. -Witam serdecznie 1.Od kiedy pan gra w FC Barcelonie… -W FC Barcelonie gram od 13 roku.
Transformacja Z (13.6).
Strategia skutecznego szukania informacji w Internecie
Efektywność zdawania egzaminu zawodowego w ZSP w Bytowie w roku szkolnym 2008/2009.
Relaks przy śpiewie i muzyce
Język angielski czasy PRESENT Continuous NACIŚNIJ SPACJĘ
Present Simple vs. Present Continuous
COMENIUS NASZ POLSKI KALENDARZ LISTOPAD 2013.
John LENNON IMAGINE (Jeśli chcesz, by tekst odpowiadał piosence pozwól, aby prezentacja przebiegała automatycznie)
Świetlica pełna legend- The school day room full of legends
Rozwój mieszkańców województwa opolskiego poprzez wsparcie z Europejskiego Funduszu Społecznego Wojewódzki Urząd Pracy w Opolu r.
Kalendarz 2011 Real Madryt Autor: Bartosz Trzciński.
KALENDARZ 2011r. Autor: Alicja Chałupka klasa III a.
SPOTKANIE Z RODZICAMI OGÓLNE INFORMACJE O SPRAWDZIANIE Data sprawdzianu – 8 kwietnia 2008 roku Czas pracy – 60 minut Liczba punktów do uzyskania.
Słowa wyrażające czynności/action or doing words
Podstawy działania wybranych usług sieciowych
ŻYWE JĘZYKI PROGRAMOWANIA LIVING IT UP WITH A LIVE PROGRAMMING LANGUAGE Sean McDirmid Ecole Polytechnique Fédérale de Lausanne (EPFL)
Analiza wpływu regulatora na jakość regulacji (1)
XML – eXtensible Markup Language
Lekcja 13 Strona 15. Lekcja 13 Strona 16 Lekcja 13 Strona 17 Vertical primary and secondary Tesla coil Jacobs ladder.
Surowosc obyczajow w Arabii Saudyjskiej Cruelty in Saudi Arabia.
Kalendarz 2011r. styczeń pn wt śr czw pt sb nd
1.
Music: Nightengale Serenade
SZKOŁA Z KLASĄ 2.0 English SOS.
Computers Presentations
1 Jak by tu po-współpracować z innymi ? a może coś jeszcze… Word 2007.
(C) Jarosław Jabłonka, ATH, 5 kwietnia kwietnia 2017
EcoCondens Kompakt BBK 7-22 E.
6 CZERWIEC 2014 r PIECZĘĆ z 1236 r. 10.
User experience studio Użyteczna biblioteka Teraźniejszość i przyszłość informacji naukowej.
POLISH FOR BEGINNERS.
SHOPPING- ROBIENIE ZAKUPÓW.
The History St. Peter and Paul's Church.. The end of work Miner1: We are buried. Miner2: We can' t go out. bury-zasypać Koniec pracy Górnik1: Jesteśmy.
 Primary School no 17  John Paul II, Chorzow, Poland  Made by Monika Winkler`s Project Group.
Czasownik BYĆ Verb ‘to be’.
World Down Syndrome Day 2014
Kalendarz 2020.
Polish language course – lesson 3 SERVICES 1. 1 jeden 2 dwa 3 trzy 4 cztery 5 pięć6 sześć 7 siedem 8 osiem 9 dziewięć 10 dziesieć 2.
CROSSWORD: SLANG. Konkurs polega na rozwiązaniu krzyżówki. CROSSWORD: SLANG Wypełnione karty odpowiedzi prosimy składać w bibliotece CJK, lub przesyłać.
Peace Day Slogans Poland. I, you… the first step to peace. Ja, ty… pierwszy krok do pokoju.
A, an, the, - Kochamy przedimiki.
A, an, the, - .
Zwrot going to – określa nasze plany na przyszłość lub przewidywania:
Les meilleures photos de L'année 2005 D'après NBC A life for two, full of tenderness, obtains happiness as they get closer to heaven. Życie we dwoje,
You are about to see a few sentences in Polish. Try to translate them into English, but keep in mind they are: The First Conditonal The Second Conditional.
Przetłumacz podane w nawiasach fragmenty zdań na j. angielski.
Katarzyna Kowalczyk i Grzegorz Kasprzyk
czas teraźniejszy ciągły
EUROPEJSKI DZIEŃ JĘZYKÓW 26 WRZEŚNIA WOLA MOKRZESKA 28 września 2015
Zdania okolicznikowe skutku informują o skutku zdarzenia lub czynności. Odpowiadają na pytania: z jakim skutkiem? co miało miejsce w związku z tym? i.
Struktura egzaminu ustnego z języków obcych (bez określania poziomu) ZadanieCzasPunktacja Rozmowa wstępnaok. 2 minut Zadanie.
Music: Nightengale Serenade
Music: Nightengale Serenade
Tworzenie własnego tekstu: pocztówka
CZAS PRESENT CONTINUOUS
MOWA ZALEŻNA Mowę zależną stosujemy, kiedy przekazujemy czyjąś wypowiedź pośrednio, nie cytując jej wprost.
Egzamin ósmoklasisty z języka angielskiego
Polish L3 Learning Pack Saying your name
Zapis prezentacji:

Inteligentne konkordancje - narzędzia językowe nie tylko dla badaczy Korpus to zbiór celowo skompilowanych tekstów. Konkordancja to zestawienie cytatów z tekstów. Culler to narzędzie komputerowe dające dostęp do korpusów tekstowych, również w formie różnorodnych konkordancji.

Słowo - nasz ślad na ziemi Słowo obnażające lub trawestujące rzeczywistość zachwyca nie inaczej jak nieuchwytne gesty magika, który z pustego kapelusza wypuszcza gołębia. Umysł ludzki doznaje wielkiej rozkoszy, gdy rzeczy, na które się patrzy co dzień, ukazują się w nowym, nieznanym kształcie. Parandowski "Alchemia słowa"

The limits of my language indicate the limits of my world Każdy język jest inną mapą rzeczywistości. Mapę można rysować prosto z terenu lub z opisu. Stu Jay Raj zaczął od dwóch map, ma ich już 15. O wartości mapy decyduje obecność kontekstu i aktualność, których to brakuje słownikowi i dlatego potrzebne są korpusy i konkordancje! : Praga, Włochy

Kontekst Sytuacyjny Podniesieniem ręki w klasie zgłaszamy się do odpowiedzi. Ten sam gest na aukcji może dużo kosztować. Kulturowy You have extremely honoured me by coming into my abode. I am not worthy of it. This house is yours; you can burn it if you wish. My children are also at your disposal; I would sacrifice them all for your pleasure. What a blessed day this is, now that the light of your countenance has shone upon us. Tekstowy opieka Dziadek ma problem ze skasowaniem biletu w trzęsącym autobusie. Autobus zatrzymuje się na czerwonym świetle, a babcia woła: Wsadzaj póki stoi!

Konkordancja to zestawienie kontekstów wybranego wyrażenia być umiejscowionym stoi przy prawym rogu być napisanym tak stoi w piśmie mieć przystanek obłok kiedy stoi nad tonią być w pozycji wertykalnej (o stworzeniu, o człowieku) obok stoi giermek zasadzać się na na nim też stoi nasz ród zależeć na czymś o to jeno stoi z czego ma profit Leksykograf uzywa konkordancji

Konkordancja ciężki w kontekscie rzeczownika

Culler Simplicity of culler query comes from the assumption that a search phrase is a sequence with no optional skipped words.

Dostęp do szerszego kontekstu wybranego cytatu Mullein = dziewanna

Dostęp do szerszego kontekstu wybranego cytatu (korpus paralelny) Cięzki los = hard luck, fate, cruel destiny

Korpusy dostępne na Internecie w systemie Culler Teksty ogólne English Prose (31 mln) Polish Misc (50 mln) Swedish I-Press (28 mln) Teksty specjalistyczne StemCell (25 mln) Cancer (64 mln) Gene-Human (45 mln) Gene-Animal (38 mln) Gene-Human-Animal (23 mln) InformationFusion (4 mln) Teksty paralelne English, Swedish Acquis (9 mln) Lexware Culler www.nla.se/culler http://bergelmir.iki.his.se/culler

Korpus IPI PAN - ponad 100 000 000 słów Fragment konkordancji otrzymanej dla zapytania „śmiechu” z największego polskiego korpusu IPI PAN (ponad 100 000 000 słów)

Korpus IPI PAN dostępny jest w systemie Poliqarp Zapytanie [pos=*(subst|adj)*&orth=a.{4}] {2,} oznacza: sekwencja przynajmniej dwóch 5-literowych form rzeczownikowych lub przymiotnikowych zaczynających się na a Oprócz narzędzi analizy istotne są możliwości precyzyjnego i łatwego formułowania zapytań.

Trzy części okienka Cullera: pytanie, konkordancja, tabela

Szukamy przykładów mowy zależnej: &verb pan Zagłoba

rynek &adj

*?marknad*

&noun ”market”

Aktualność Co wyszło z mody? … owoc twojego żywota … nazwa frędzla u pasa (użyta np. w Panu Tadeuszu) Co się nosi w mówieniu? dokładnie, debeściak, wyguglowałam tego forumowicza super-, mega-, wyślę ci sms-a nie daliśmy radę

&new amfetamina bajt bannery biodynamiczny bioreaktor chipsy dresiarz dyskietka ego ekologizacja ekorozwój ekoturystyka empatyczny energooszczędny erogenny fan formatować gej globalizacja kompatybilny laptop link lobbying logo markowy monitoring ochroniarz oglądalność oszołom pizza pub ranking recykling sms sponsor wirtualny zafiksować zieloni

Słowotwórstwo: *encji=&new

tzw &new w korpusie Polish Blogs

(&noun &conj) &new w kontekscie +rybołówstwo w Polish Acquis

&new w tekście paralelnym

&new-word and &new-compound in Swedish

Nazw własnych nie ma w słowniku a wstyd nie odmieniać nazwisk ( Nazw własnych nie ma w słowniku a wstyd nie odmieniać nazwisk (* &prep) lund*=&name Lund zostało ufundowane prawdopodobnie pod koniec X wieku.

Nie jestem Robinem Hoodem (”nie jest”) &name &name

Dopełniacz czy biernik: &conj znaleźć &noun oraz nie znaleźć &noun

Użycie stanowi o języku - najdemokratyczniejszej instytucji ludzkości Język jest logiczny. Angielski ma więcej słów niż szwedzki. Języki ludów prymitywnych są prymitywne. Są języki proste i trudne. Jest jedna poprawna forma językowa. Jest jeden język polski. miejsca siedzące rusdrycksförsäljningsförordning języki kreolskie, FoxP2 aliikusersuillammassuaanerartassagaluarpaalli pastylki na ból i od bólu, świszcze świszczy śwista borówka, jagoda, zwolena, sławiena zaniechuje? = however they will say that he is a great entertainer, but however they will say that he is a great entertainer, but

jagoda i borówka w encyklopedii Jagoda (ang. berry, łac. bacca) – owoc mięsisty zawierający wewnątrz nasiona. Przykładem jagód są: pomidor, cytryna, pomarańcza, porzeczka, agrest, winorośl, borówka. Bywają również jagody stosunkowo duże, jak u orgórka czy dyni. Borówka czarna, jagoda, czernica, czarna jagoda, czarna borówka (Vaccinium myrtillus L. Sp.Pl.1 1753) - gatunek krzewinki z rodziny wrzosowatych (Ericaceae L.) wg innych systematyków brusznicowatych (Vacciniaceae S.Gray).

borówka wg korpusu paralelnego Acquis

jagoda wg korpusu paralelnego Acquis

Dostęp do słownika na życzenie lat. resultare studsa tillbaka grek. tekhnike tekhne konst, hantverk, skicklighet' fornsv. lagh ordning, ställning lat. pes fot fra. pionnier fotsoldat fornsv. stifta lågtyska. stiften grunda

Możemy sami tworzyć korpusy tekstowe Monitorujący, referencyjny, próbkowany, oportunistyczny Specjalistyczny: artykuły medyczne, językoznawcze, … Socjologiczny: blogi, teksty pisane przez kobiety, … Autorski: zebranych pism prezydenta Wałęsy, Testowy: foreign learners, … Ogólny: proza, prasa, debaty sejmowe, … …