Automatyczna interpretacja pytań i udzielanie odpowiedzi (Question & Answering)

Slides:



Advertisements
Podobne prezentacje
INSTRUKCJA KORZYSTANIA Z KATALOGU ON-LINE
Advertisements

Data Mining w e-commerce
Plan prezentacji Problem plagiatów w szkolnictwie średnim. Plagiatowanie, a niesamodzielność Geneza systemu Plagiat.pl Plagiat.pl - zasady działania Funkcjonalności.
Wprowadzenie do eksploracji tekstu i technik płytkiej analizy tekstu
Support.ebsco.com Wyszukiwanie w bazie Business Source w EBSCOhost Przewodnik.
Komponenty bazy danych Baza danych Jest to uporządkowany zbiór powiązanych ze sobą danych charakterystycznych dla pewnej klasy obiektów lub zdarzeń,
XML w zarządzaniu formularzami ubezpieczeniowymi ZUS
11 RDF Wertykalne zastosowania XML-a. 22 RDF - Wprowadzenie Problemy Sieć jest nieczytelna dla programów komputerowych. Sieć zawiera zbyt wiele informacji.
Kwerendy –wszystkie typy (usuwające, aktualizujące i inne)
Wycofywanie potwierdzonych transakcji
Dokumentowanie wymagań w języku XML
Promotor: prof. dr hab. Włodzisław Duch
Rozpoznawanie Twarzy i Systemy Biometryczne, 2005/2006
Zastosowanie pamięci semantycznej we wspomaganiu decyzji medycznych
Wykład 2: Systemy klasy C.A.T. (Computer-Aided Translation)
1 Kryteria wyboru systemów: Przystępując do procesu wdrażania zintegrowanego systemu zarządzania, należy odpowiedzieć na następujące pytania związane z.
Ukryte indeksowanie semantyczne SVD Struktury danych
Tworzenie stron w języku WML jest zbliżone do tworzenia stron w HTML. W obydwu przypadkach używa się do tego celu znaczników (tagów). Zadaniem znaczników.
Mirosław ŚWIERCZ Politechnika Białostocka, Wydział Elektryczny
Uniwersytet Jagielloński
Zaawansowane przetwarzanie tekstu dla potrzeb bibliotek cyfrowych Stanisław Osiński
Multimedialne bazy danych
Wykład 2 Cykl życia systemu informacyjnego
Bibliotekarz – odkrywca. Agenda Proces tworzenia informacji Indeksy wyszukiwawcze Budowa rekordu w Promaxie Zapytania.
System ułatwiający zarządzanie Jednostką
Mariusz Polarczyk, Zofia Kasprzak
Model przestrzenny Diagramu Obiegu Dokumentów
Przetwarzanie tekstu i strony WWW Copyright, 1999 © Jerzy R. Nawrocki Wprowadzenie.
System generowania wzorów matematycznych MathML
Wanda Klenczon Biblioteka Narodowa
Autor: Justyna Radomska
System e-zamówienia.
Test de français international. > Obiektywny i uznany egzamin Stworzony w odpowiedzi na potrzeby firm i instytucji z kapitałem francuskim Stosowany przez.
Implementacja systemu
Rozumienie czytanego tekstu
Rozwiązanie zadań do zaliczenia I0G1S4 // indeks
Encyklopedie i słowniki w bibliotece szkolnej
O projekcie Efektem projektu o nazwie „Przygotowanie Urzędu Miasta Tarnobrzeg do świadczenia usług publicznych drogą elektroniczną za pośrednictwem.
Modelowanie obiektowe Diagramy UML – diagram przypadków użycia
Bazy danych Microsoft access 2007.
Rozdział V: Globalne sieci komputerowe
Aleph Raporty, raport danych osobowych, ubytki OPAC.
Metoda studium przypadku jako element XI Konkursu Wiedzy Ekonomicznej
Wyszukiwanie informacji w internecie
Znaki specjalne Co i jak + brak przykładów.  Aby wstawić symbol lub znak specjalny należy na karcie Wstawianie w grupie Symbole kliknąć na przycisk Symbol.
ZASADY KORZYSTANIA Z KATALOGU BIBLIOTECZNEGO
Informacje na temat matury z języka polskiego od 2015 roku.
Systemy Business Intelligence – warunki użytkowania Halina Tańska Wydział Matematyki i Informatyki Uniwersytet Warmińsko-Mazurski „e-commerce” Olsztyn.
Charakterystyka powszechnie stosowanych metod badawczych
Procesy informacyjne w zarządzaniu
Diagramy przepływu danych
Projektowanie postaci formularza:
Podział sieci komputerowych
TEMAT: ACCESS - KWERENDY.
Przewodnik Wprowadzenie do
Szablony w programie microsoft word 2010
Metoda Dyna-Lingua M.S. Materiały wykorzystane w prezentacji pochodzą z książki: Metoda terapeutyczna Dyna-Lingua, MS. w leczeniu autyzmu, Red. Młynarksa.
Ontologie Monika Nawrot Agnieszka Janowska Akademia Górniczo-Hutnicza Kraków 2006.
Przewodnik
WIZUALIZACJA ZBIORÓW BIBLIOTEKI GŁÓWNEJ POLITECHNIKI WARSZAWSKIEJ Lizbona Agnieszka Maria Kowalczuk, Łukasz Skonieczny, Małgorzata Wornbard.
Graficzny Interfejs Użytkownika
Matura 2016 Analiza wyników.
Patenty azjatyckie SLAJD 1 -dlaczego nie ???.
Kurs Access.
Poradnik: Polska Bibliografia Lekarska - Jak szukać literatury na wybrany temat w Bibliotece i Centrum Informacji Naukowej PMWSZ w Opolu.
Wstęp do Informatyki - Wykład 14
między starymi a nowymi czasami
* PROCESÓW TECHNOLOGICZNYCH
Wyniki próbnego egzaminu gimnazjalnego – język obcy nowożytny.
Zapis prezentacji:

Automatyczna interpretacja pytań i udzielanie odpowiedzi (Question & Answering)

Uwagi historyczne 1926 – Ajdukiewicz, „Analiza semantyczna zdania pytajnego” 1972 – LUNAR – system konsultowania bazy danych na temat próbek gruntu księżycowego 1977 – LADDER – dialogowy dostęp do rozproszonych baz danych – HAM-ANS i WISBER – dialog na temat rezerwacji hotelowej 1983 – ORBIS – pytania na temat planet układu słonecznego

Wyszukiwanie informacji Znalezienie w dużej populacji dokumentów tych spośród nich, które zawierają informacje będące odpowiedzią na kwerendę użytkownika. Obecne techniki IR powstały w wyniku automatyzacji systemów bibliotecznych. Information Retrieval

Podstawowe metody IR Indeksowanie – wyszukiwanie w tekście terminów, które go reprezentują  tokenizacja  lematyzacja Uzgadnianie – wykrywanie stopnia podobieństwa pomiędzy reprezentacją tekstu a kwerendą

Ekstrakcja informacji Pozyskanie konkretnych faktów z określonego dokumentu w odpowiedzi na zapytanie. „Dowolna metoda odfiltrowywania informacji z dużego korpusu tekstów”. Information Extraction

Fazy przetwarzania IE Lokalna analiza tekstu  wytworzenie wzorców i zapełnienie ich lingwistycznymi realizacjami faktów/relacji Integracja wyszukanych faktów  inferencja nowych, nie odnotowanych jawnie w dokumencie faktów Przekształcenie wyników do pożądanego formatu

Question & Answering (Q&A) Na pytanie postawione w języku naturalnym udzielana jest udokumentowana odpowiedź, również w języku naturalnym. Q&A wykorzystuje techniki IR, IE oraz modelowanie rozumienia języka naturalnego (MU). IR + IE + MU = Q&A

Schemat systemu Q&A Zrozumienie pytania Wyszukanie dokumentów Ekstrakcja informacji Integracja informacji Generowanie odpowiedzi

Zrozumienie pytania Uzyskanie szablonu sytuacji będącej przedmiotem pytania. Wymaga pełnej analizy obejmującej wszystkie poziomy opisu:  morfologia  składnia  semantyka  pragmatyka

Wyszukanie dokumentów Szablon służy do wygenerowania kwerendy w celu uzyskania dokumentów zawierających odpowiedź. Również w miarę możliwości w dokumentach lokalizowane są obszary podejrzane o zawieranie odpowiedzi.

Zrozumienie pytania i wyszukanie dokumentów

Ekstrakcja informacji Wydobywanie informacji z dokumentów lub ich fragmentów, w sposób sterowany szablonem pytajnym. Na wyjściu otrzymywane są zbiory szablonów częściowo wypełnionych informacją.

Ekstrakcja informacji

Integracja informacji Celem jest stworzenie jednego wypełnionego szablonu wraz ze wskazaniem na źródła i protokołem rozstrzygnięcia sprzeczności. Możliwe jest wykonanie dodatkowych kwerend, automatycznie generowanych przez system.

Integracja informacji

Generowanie odpowiedzi

Jakość systemu Q&A czas rzeczywisty – kilka sekund na odpowiedź dokładność – „zła odpowiedź jest gorsza niż żadna” użyteczność – dostosowywanie do potrzeb użytkownika zupełność – kompletność odpowiedzi, szukanie w wielu źródłach istotność – rozpoznanie elementów istotnych w kontekście użytkownika

Wizja rozwoju Q&A