Uniwersytet Jagielloński

Slides:



Advertisements
Podobne prezentacje
Jak Zrobić Skuteczną Prezentację!!
Advertisements

Negocjacje handlowe Szymon Woźniak.
Custom Curriculum Zarządzanie kontem – tworzenie własnego programu nauczania.
Ocenianie kształtujące na lekcjach języka polskiego
Zapraszamy do blogowania !
Wyszukiwanie i zapisywanie informacji
(na podstawie badań ankietowych)
ABC nauczyciela przygotowującego uczniów do konkursu polonistycznego
Materiały do zajęć z przedmiotu: Narzędzia i języki programowania Programowanie w języku PASCAL Część 7: Procedury i funkcje © Jan Kaczmarek.
Promotor: prof. dr hab. Włodzisław Duch
Indukcjonistyczna filozofia nauki
Pamięć semantyczna Część pamięci długotrwałej, w której przechowuje się podstawowe znaczenie słów i pojęć.
Logika - nazwy Patrycja Stalewska.
Zapis informacji Dr Anna Kwiatkowska.
Klasa I Opracowanie – Joanna Grządka Uwaga! Do poprawnego wyświetlania prezentacji niezbędny jest program Microsoft Office PowerPoint 2007 (lub nowszy)
Google – sposoby wyszukiwania
JAK UCZYĆ SIĘ JĘZYKÓW OBCYCH
trójwymiarowy labirynt z fizyką i przeszkodami
Autor: Adrianna Dzikielewska
Bibliotekarz – odkrywca. Agenda Proces tworzenia informacji Indeksy wyszukiwawcze Budowa rekordu w Promaxie Zapytania.
Strategia skutecznego szukania informacji w Internecie
POJĘCIE ALGORYTMU Pojęcie algorytmu Etapy rozwiązywania zadań
GOSPODARKA OPARTA NA DANYCH
Dalai Lama Test na osobowość
EDYTOR 3D OFERTA 1.Wybierz pamięć USB 2.Wybierz stronę pamięci USB na której chcesz umieścić nadruk 3.Wybierz kolor pamięci, ilość, pojemność oraz.
Algorytmy i Struktury Danych Typy algorytmów
dr Robert Szwed Katolicki Uniwersytet Lubelski Jana Pawła II
JAK POWSTAŁA MOJA STRONA INTERNETOWA…?
Tworzenie strony internetowej krok po kroku.
Ręce i Nogi Jan Brzechwa.
Dla Gimnazjum w Teresinie prezentują :. KSEON Optivum Przedstawia: Kalesanty Gwizduła Droga do szkoły ponadgimnazjalnej.
Języki i automaty część 3.
CZYLI UWOLNIJ POTENCJAŁ
XML – eXtensible Markup Language
Systemy liczbowe.
Zasady wyboru i wytyczne do opisu dobrych praktyk Dr inż. Janusz Adamczyk.
Analiza wizualna – co to jest i czym to się je
ZWIĄZKI MIĘDZY KLASAMI KLASY ABSTRAKCYJNE OGRANICZENIA INTERFEJSY SZABLONY safa Michał Telus.
Krótki ogon, długie uszy- nie ma go w przedszkolu
Zasoby internetowe Oxford University Press Niniejsza prezentacja podaje krótki opis Oxford Dictionaries online. Mówi o tym, czym są Oxford Dictionaries.
Duch klasy Jak motywować uczniów do nauki?
Magdalena Augustyn - trener zatrudnienia wspieranego,
Andrzej Majkowski 1 informatyka +. 2 Telefon komórkowy „uczy się”. Metoda słownikowa T9 Paweł Perekietka.
Instrukcja obsługi portalu Informacyjno-Edukacyjnego Miasta Oleśnicy
Automatyczna interpretacja pytań i udzielanie odpowiedzi (Question & Answering)
Znajdowanie pokoju i wchodzenie do niego Skorzystaj z funkcji wyszukiwania programu Lync w celu znalezienia pokojów, do których masz dostęp. 1.W oknie.
Edytory tekstowe stron WWW
Warstwowe sieci jednokierunkowe – perceptrony wielowarstwowe
Dynamika punktu materialnego Dotychczas ruch był opisywany za pomocą wektorów r, v, oraz a - rozważania geometryczne. Uwzględnienie przyczyn ruchu - dynamika.
POWITANIE POŻEGNANIE WAŻNE ZWROTY
EKSPERYMENTY I OBSERWACJE NA LEKCJACH BIOLOGII I PRZYRODY
 Praktyczne sposoby wpisywania adresu:  pomijanie autouzupełnianie  próba samodzielnego tworzenia poprzez sprawdzanie podstawowych kombinacji.
HYDE- ☺ na uczelni ☺ -PARK. Uniwersytet Łódzki Wykład z ekonomii: "Proszę się nie sugerować statystyką, bo statystycznie gdy człowiek wychodzi z psem.
Wstęp do programowania Wykład 10 Programowanie w logice.
Przewodnik Bazy CINAHL Wyszukiwanie podstawowe
Obliczeniowa teoria wyboru społecznego Jak wybrać komitet reprezentantów? Piotr Faliszewski Akademia Górniczo-Hutnicza im. Stanisława Staszica Kraków
Etyka Patrycja Zalewska.
Ssaki domowe. Č íslo p ř ílohy: VY_32_INOVACE_11_SSAKI DOMOWE Škola: Autor: Základní škola a mate ř ská škola s polským jazykem vyu č ovacím Bukovec Mgr.
Zdefiniować problem Jaki jest problem? Jakie są główne założenia? Jak chcesz śledzić przebieg funkcjonowania projektu ? metody ewaluacji Budżet Jakie źródła.
Przewodnik
 Zastanawiamy się nad tytułem, co on może oznaczać i na jaką tematykę wskazywać;  Analizujemy ilustracje ( Jeśli występują);  Wymieniamy propozycje.
IX kółko języka francuskiego 6 maja 2016 Cele: -psychopedagogiczne: integracja grupy; podtrzymanie zasad współpracy, motywowanie do poszerzania wiedzy.
Stosunki między zakresami nazw
KATALOG ON-LINE Biblioteka Uczelniana PPWSZ w Nowym Targu
Dalai Lama Test na osobowość
Jak Zrobić Skuteczną Prezentację!!
Dni otwarte Nazwa szkoły Data.
Wstęp do Informatyki - Wykład 14
Sterowanie procesami ciągłymi
POJĘCIE ALGORYTMU Wstęp do informatyki Pojęcie algorytmu
Zapis prezentacji:

Uniwersytet Jagielloński Automatyczne pozyskiwanie relacji semantycznych z tekstu Wiktor Dernowicz Uniwersytet Jagielloński Kraków

Motywacje PJN to w dużej mierze przetwarzanie znaczeń Obecnie nie istnieje jeszcze słownik semantyczny języka polskiego, który by to umożliwiał Stąd duża potrzeba stworzenia takie słownika Tworzenie takiego słownika jest czasochłonne i drogie Częściowa automatyzacja tego procesu jest kluczowa

Przedstawię próbę rozwiązanie tego problemu

Czym jest słownik semantyczny Słownik semantyczny definiuje znaczenia poprzez relacje semantyczne takie jak: synonimity, similarity, is a kind of itd. Poniżej jest częściowy opis pojęcia pies: SYNONIMY: Canis familiaris SIMILAR TO: wilk IS A KIND OF: ssak CONSISTS OF: ogon, pazur, sierść

Pytanie na które szukam odpowiedzi Czy możliwe jest automatyczne pozyskiwanie relacji semantycznych z korpusu tekstów Jeśli „tak”, jakiej jakości wyników powinienem oczekiwać Czy może mieć to znaczący wkład w proces tworzenia słownika semantycznego

Eksperyment Zbudowałem pewien system, dałem mu do poczytania trochę książek oraz gazet i jeszcze pozwoliłem trochę poserfować po internecie Następnie zadałem mu pytanie dotyczące relacji semantyczne część-całość: „Jakie są części ciała kota, pataka, słonia, krowy, jeża itd.?” I zobaczyłem jaki był rezultat.

Metoda podstawowa Wejście: Informacja o świecie – korpus tekstów Przykład czego ja szukam – cztery predefiniowane nazwy zwierząt: pies, koń, ryba i pająk oraz listy części ich części ciała. To jest podane jako wzór Nazwy innych zwierząt, dla któych chcę, aby system znalazł nazwych ich części ciała – kot, ptak, słoń, krowa, jeż Dwie wartości liczbowe (progi)

Metoda podstawowa Wyjście: kot oko OK. ogon ucho jeż kolec ptak gniazdo pazur słoń noga krowa róg dziób skrzydło głowa dom problem

Jak ten system działa? pies – oko ta para jest wzięta z wzorca danego na wejściu Gdzie ten pies ma oczy? – znalezione zdanie X ma Y – wyodrębniona fraza pies – ogon Pies powitał go machnięciem ogona. X powitał go machnięciem Y

Ocena fraz Mój pies ma problem. pies – problem takiej pary nie ma we wzorcu, stąd minus (-) Taki koń ma skórę różowawą. koń – skóra taka para faktycznie znajduje się we wzorcu, stąd plus (+) Ta fraza otrzymała: 30 plusów 164 minusy Czyli jest 15,4% plusów – a to jest więcej niż pierwszy próg (5%) Jest 16 różnych plusów, 16 różnych par takich jak koń-skóra, a to jest więcej niż drugi próg (2 dwie różne poprawne pary) Stąd fraza ta jest zaakceptowana

Ocena fraz X przywitał go machnięciem Y Powyższa fraza otrzymała 1 plus i 0 minusów. Jest 100% plusów, ale tylko 1 różny plus – a to jest poniżej drugiego progu (2), dlatego system „mówi”, że ta fraza nie jest dobra i pomija ją.

Cześć zaakceptowanych fraz Fraza Minusy Plusy Różne plusy X z Y 449 40 15 Y u X 104 27 18 X po Y 103 34 14 X ma Y 164 30 16 Y tych X 166 9 Y ma X 53 11 5 X bez Y 72 17 X za Y 97 7

Uzyskane rezultaty Zwierzę Odnaleziona część ciała Odnaleziona przez N różnych fraz kot oko 6 OK. ogon 5 ucho jeż kolec 4 ptak gniazdo pazur słoń noga 3 krowa róg dziób skrzydło głowa dom problem

Teraz i w przyszłości Odnalazłem system WEKA z nowej Zelandii, który implementuje wiele algorytmów „Machine Learning”, jest on dostępny, darmowy i działa. Chciałbym zastosować część z tych algorytmów. Chciałbym się dowiedzieć jakie są obecne osiągnięcia „Machine Learning” i być może zastosować dostępne rozwiązania. Mam także swoje własne pomysły na to by usprawnić ten podstawowy algorytm.

Dziękuję bardzo za państwa uwagę! Będę zobowiązany za wszelkie uwagi.