Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Świat Bytów Wirtualnych 1 Włodzisław Duch Katedra Informatyki Stosowanej, Uniwersytet Mikołaja Kopernika, Toruń School of Computer Engineering, Nanyang.

Podobne prezentacje


Prezentacja na temat: "Świat Bytów Wirtualnych 1 Włodzisław Duch Katedra Informatyki Stosowanej, Uniwersytet Mikołaja Kopernika, Toruń School of Computer Engineering, Nanyang."— Zapis prezentacji:

1 Świat Bytów Wirtualnych 1 Włodzisław Duch Katedra Informatyki Stosowanej, Uniwersytet Mikołaja Kopernika, Toruń School of Computer Engineering, Nanyang Technological University, Singapore Google: Duch Kierunki rozwoju nowoczesnych technologii, Uniw. Łódzki,

2 PlanPlan Świat bytów wirtualnych w Internecie i telefonach: awatary, boty, sztuczne osobowości w cyberprzestrzeni. Elementy: cyberprzestrzeń, agent, bot, synteza mowy mówiąca głowa, awatar... Zastosowania: automatyzacja usług informacyjnych i reklamy... Potrzeby: robotyka kognitywna, automatyzacja złożonych czynności, interfejsy w języku naturalnym. Przykłady istniejących zastosowań: wirtualni asystenci – Talking Buddy, UltraHal; mówiące głowy na stronach – Lingubots i inne. Technologia: agenci, awatary, grafika - Haptek. Technologia: dialog z użytkownikiem, analiza języka naturalnego. Technologia: modele kognitywne złożonych zachowań. Co nadejdzie wkrótce? Dokąd to zmierza?

3 Cyberprzestrzeń: definicje Cyberprzestrzeń: świat sprzężonych ze sobą sieci komputerowych tworzący przestrzeń informacyjną z możliwością jej eksploracji oraz odczuwania przy pomocy zmysłów pobudzanych wspomaganymi komputerowo urządzeniami. Termin wprowadził William Gibson w powieści Neuromancer, gdzie opisał świat, w którym stosowane są cybernetyczne rozszerzenia możliwości ludzkiego organizmu, np. wymiana informacji ze światową siecią komputerową. Poruszanie się w sieci = w cyberprzestrzeni. Internet jako całość, rozumiany jako przestrzeń komunikacyjna, zwłaszcza World Wide Web, grupy dyskusyjne. W tym sensie do cyberprzestrzeni wkraczamy podłączając się do Sieci. Wygenerowane komputerowo środowisko wirtualnej rzeczywistości z dostępem do sieci komputerowej lub też jej pozbawione (np. światy stworzone w technologii VRML).

4 AgenciAgenci Nie ma jednoznacznej definicji agenta. Przez agenta (programowego) zwykle rozumie się działający w jakimś środowisku program zdolny do komunikacji, monitorowania swego otoczenia i podejmowania autonomicznych decyzji, aby osiągnąć cele określone podczas jej projektowania lub działania. Agent powinien mieć przynajmniej niektóre z cech: być mobilny, poruszać się w cyberprzestrzeni; autonomiczny, zdolny do podejmowania samodzielnych decyzji; umiejętność komunikacji z innymi agentami i użytkownikiem; być zdolnym do kooperacji lub korzystania z usług innych agentów; percepcję (zdolność do postrzegania i reagowania na zmiany środowiska); wykazywać tolerancję na błędy; wykorzystywać i gromadzić wiedzę; adaptować się (uczyć się) w celu osiągnięcia celu.

5 BotyBoty Fragment słowa Ro-bot; może być Soft-bot Agenci specjalizujący się w prowadzeniu dialogu, pierwotnie boty powstały aby działać w czasie nieobecności operatorów kanałowych w grupach dyskusyjnych IRC, pilnować porządku na kanale oraz chronić przed przejęciem. Najpopularniejszym botem dla IRC jest eggdrop. Popularne boty utrzymują Wikipedie we względnym porządku, automatyzując takie procesy jak tworzenie powiązań między stronami encyklopedii w różnych językach. Spotykane nazwy, czyli botyka Chatterbot, chatbot – bot paplający. Knowbot – bot szukający wiedzy i gromadzący wiedzę. Lingubot – nazwa botów firmy KiwiLogic. Mindbot – program pomagający myśleć, np. sugerujący pomysły. Shopbot – agent wyszukujący okazje...

6 Synteza mowy Przykłady starych i nowych programów do syntezy mowy. Całkiem dobry syntezer: Nie tylko prawidłowa wymowa ale i niezła intonacja. Syntezator mowy przydatny jest osobom niewidomym i niedowidzącym. W wersji rehabilitacyjnej pozwala na wybór sposobu interpretowania (parsowania) tekstu i ignorowanych znaków. Można przyśpieszyć czytanie tekstu aż do czterech razy bez zmiany jakości czy wysokości. Mówiąca przeglądarka Intelligent Web Reader jest dostępna za darmo. Dostępna jest wersja do urządzeń przenośnych (PDA, smartfon). Spore zainteresowanie lokalnych władz wdrożeniami tego typu systemów (fundusz rehabilitacyjny).

7 Rozpoznawanie mowy Bardzo dużo produktów związanych z rozpoznawaniem mowy. Microsoft oferuje darmowe SAPI (Speech Application Program Interface) Office 2003 ma narzędzia do rozpoznawania mowy. Darmowe narzędzia firmy Brainhat Dwa najbardziej znane programy to: Dragon Naturally Speaking (ScanSoft), osiąga po krótkim treningu (zwykle < 30 min) dokładność 95-99%. IBM ViaVoice osiąga podobną dokładność co Dragon NS, pozwalając na dodawanie nowych słów do słownika użytkownika. Współpracują ze wszystkimi aplikacjami Windows, powalają na wykonywania prostych komend, np. nawigacji po Internecie. Wymagają dużo RAM i szybkiego procesora.

8 Mówiące głowy Głównie grafika 3D, możliwości synchronizacji ruchu ust z dźwiękami z syntezatora mowy; grafika i synteza mowy, ale bez percepcji i prawdziwej interakcji. Przykłady: Ananova, czyta wiadomości, firma telefoniczna Orange dała za nią £95M – wkrótce w telefonach komórkowych? Andrea Catherwood, czyli Vandrea, czyta wiadomości programu BT5.Vandrea Simon czyta wiadomości w języku migowym. Technologia Veeper – przykład z Harvard School of Medicine, realistyczny dźwięk i grafika.Veeper – przykład z Harvard Inne Veepery

9 VeeperVeeper Technologia Veeper robienia głów 3D z własnych zdjęć. Firma Pulse dostarcza technologii pozwalającej na tworzenie i rozsyłanie wirtualnych postaci do użytkowników komputerów i urządzeń bezprzewodowych. Ich software zamienia zdjęcia na interaktywne postacie, które można oglądać bez dodatkowego oprogramowania. Zastosowania: marketing, usługi, wirtualna obsługa i sprzedaż, nauczanie, przesyłanie wiadomości – realistyczne ale pliki 1% wideo. Przykład pacjenta z Harvard School of Medicine przedstawiającego swój stan studentom.Harvard School of Medicine Przykłady kartek z głowami Veepera – można interakcyjnie podłożyć swoja, dodać dźwięk syntetyczny lub nagrany i wysłać pocztą elektroniczną. Spróbujcie!

10 Veeper cd. Popatrzmy na parę przykładów zastosowań, np IRS (urząd podatkowy!) Mobile Veepers Messaging Pozwala na przesyłanie mówiących 3-wymiarowych postaci odczytujących wiadomości tekstowe w wielu językach i głosami do wyboru. Analiza tekstu pozwala na robienie min i gestów! Face Tones Dzwonki do telefonu połączone z twarzami, które odczytują SMSy i maile, informują kto dzwoni. Broadcast Veepers Głowy czytające wiadomości, doniesienia sportowe, informacje o pogodzie, ruchu na drodze i innych sprawach, działające w telefonach. Mobile V-cards Szybkie tworzenie i wysyłanie fotorealistycznych animowanych fotografii, np. robionych aparatem telefonem. Location-Based Face Ads (LB-Fads) Reklama za pomocą mówiących głów, korzystając z GPS i technologii agentów, z informacją o lokalnych zdarzeniach, wyprzedażach itd.

11 HaptekHaptek Mówiące głowy, podobnie jak Veeper, Poziom pre-kognitywny, głównie grafika 3D, morfing, synteza mowy, synchronizacja ruchu ust. Duże możliwości graficzne oraz sterowania zachowaniem, w tym prozodią mowy, syntetycznymi emocjami, gestami i wyrazami twarzy. Przedstawia się Haptek Virtual CharacterHaptek Virtual Character Haptek Player, czyli oprogramowanie do odtwarzania, działa jako wtyczka w przeglądarkach za darmo. Narzędzia SDK do tworzenia postaci Hapteka są tanie. Działa jako wtyczka ActiveX, łatwo jest dodać własne programy w C++ lub w VisualStudio, można też używać języków skryptowych, JavaScript działa z darmowymi narzędziami MS SAPI do rozpoznawania mowy. Pokaz oprogramowania Peoples Putty do tworzenia i kontroli postaci Hapteka.

12 Chatterboty Boty w wersji desktop-bot (niezależne) lub web-bot (na serwerach), głównie analiza języka, prowadzenie dialogu. Linki do stron z botami są pod: W Polsce botyka: to projekt Tribota, mówiącego po polsku. Jeden z pierwszych: Eliza (Weizenbaum, MIT 1967), udaje psychoterapeutę, oparty na prostych skryptach - demo. MegaHall, symulator konwersacji, który się naprawdę uczy; Hal jest na poziomie 2- letniego dziecka i nauczył się sensu słów wyłącznie przez rozmowy; istnieje bardzo wiele osobowości Hal. Zastosowania? Może w zabawkach dla maluchów?

13 EllaZEllaZ Demonstracja EllaZ: Działa jako aplikacja na serwerze lub lokalnie w komputerze. Czyta książki, zna gry (karty, gry planszowe, hazardowe, I Ching), dostarcza informacji o pogodzie, giełdzie, walutach, zamienia jednostki i pomaga wykonywać obliczenia... Używa WordNetu, wielkiej bazy leksykalnej, może podawać definicje, synonimy, antonimy, hipernimy (kategorie nadrzędne, rodzaj czegoś) i hyponimy (kategorie szczegółowe, przykład czegoś). Np: "What are the hypernyms of horse?" Horse is a type of: hoofed mammal, animal, living thing. "What are the hyponyms of flower?" Flower has a type: peony, lesser celandine, windflower... Podpowiada np. jakie słowa pasują w krzyżówce do schematu U===E===L, albo jakie słowa kończą się na ant (do rymów).

14 AliceAlice Duży projekt ArtificiaL InteligenCE Foundation (Richard Wallace) Jeden z najlepszych botów, 3 razy wygrał nagrodę Loebnera. Rozmowa z Alice. CLAUDIO (Cybernetic Lifelike Android Used for Dialogue Interaction and Observation) zrobi test osobowości. Na stronie jest bardzo dobry przegląd około 30 projektów związanych z botami. ma linki do wielu botów w sieci, od Alice, przez Budda-bot do Szekspira. Sporo zastosowań do nauki angielskiego: W cyberprzestrzeni spotkać można wiele botów opartych na Alice. gdzie można wystawić swojego bota zrobionego w oparciu o język AIML używany przez Alice.

15 AIMLAIML AIML (Artificial Intelligence Markup Language) to zgodny z XML język, którego łatwo można się nauczyć, służący do przystosowania ALICE do swoich potrzeb. Tag: zaznacza jednostkę wiedzy" w bazie wiedzy Alice; to wzorzec wypowiedzi użytkownika; zawiera odpowiedź dla danego wzorca. Tagów jest ponad 20 i można je samemu rozszerzać. W AIML jest ok. 41,000 kategorii, np: WHAT ARE YOU Me I am the latest result in artificial intelligence, which can reproduce the capabilities of the human brain with greater speed and accuracy.

16 OddcastOddcast Firma sprzedaje głosy (w 64 językach), głowy i aplikacje je zawierające, – drogie!http://www.oddcast.com VHost Studio - tworzenie postaci, umieszczanie na stronach WWW, dodawanie plików dźwiękowych i synchronizacja z obrazem. VHost Workshop - przesyłanie wirtualnych postaci w listach do klientów, którzy mogą modyfikować nadesłane postacie i wiadomości. VHost AIMC - profesjonalny system pozwalający na pisanie skryptów w AIML, rozszerza możliwości Studio i Enterprise. VHost e-Learning Suite - zestaw programów do tworzenia aplikacji edukacyjnych, ich zawartości, modułów, logiki powiązań. VHost FAQ Maker - do robienia FAQ odczytywanych przez awatary. VHost Simulation Maker - symulacje scenariuszy z podziałem na role. VHost Quiz Maker - tworzenie testów i kwizów wyboru. VHost Analyzer - poleca produkty robiąc analizę zapytań użytkownika.

17 LingubotyLinguboty Linguboty na stronie i Bazy wiedzy i boty odpowiadające na pytania. German Chancellor's IT-Eagle Betty Feron pomaga pacjentom z stwardnieniem rozsianym. KMP Internet: relacje pomiędzy ludźmi i firmami. Opera Telecom: automatyczne usługi SMS. Swiftcall: asystent wyszukujący Swifty VW ma stronę z botem dla Supplier Self Registration (SSR) Schwarzkopf: wszystko dla włosów Novartis Pharmaceuticals: porady wirtualnego doktora DAB Bank, DaimlerChrysler, MCC Smart stosują linguboty... Droga technologia, ale niezła.

18 UltraHal - wirtualni asystenci Połączenie technologii botów i agentów; głównie analiza języka, prowadzenie dialogu, ale też dostęp do baz wiedzy, zapamiętywanie użytecznych faktów, prawdziwa interakcja z użytkownikiem. Ultra-Hal, firmy Zabaware (Robert Medeksza). Przykład dialogu: User: Rob's address is 3175 West 42nd St. Hal: Cool. I like learning new things like that. User: Sally's eyes are blue. Hal: Cool. I have learned something new. User: What is Rob's address? Hal: Rob's address is 3175 West 42nd St. User: What color are Sally's eyes? Hal: Sally's eyes are blue.

19 Co potrafi UltraHal? Krótki tutorial – prowadzi Zaba. Przede wszystkim chatterbot, który potrafi prowadzić konwersację na wiele tematów. Podręczna pamięć: zapamiętuje proste skojarzenia i przypomina o określonej godzinie lub na żądanie, np. zadzwoń do Jacka, Jarek. Może uruchomić programy jeśli wydamy polecenie np. Run Word. Może szukać pomocy dla wszystkich zainstalowanych programów. Można dodawać różnych agentów poprzez wtyczki pisane w VBScript, JavaScript, kontrolki ActiveX czy programy dołączone przez DDE. Ultra Hal Representative może odpowiadać na pytania osób odwiedzających strony Internetowe! Można sobie go ustawić za darmo.

20 Talking Buddy Agent używający animowanych postaci: powiadamia i czyta pocztę elektroniczną; zbiera i odczytuje informacje z giełdy, serwisów pogodowych i wybranych stron WWW, np. ostatnie wiadomości, ostrzeżenia przed wirusami; dostarcza pozdrowienia i wiadomości odczytując je lub odśpiewując adresatom; przypomina o zdarzeniach z kalendarza: spotkaniach, rocznicach, imieninach; opowiada kawały, ściągając je ze stron internetowych; konwersji formatów danych; znajduje interesujące strony WWW i je poleca; odczytuje zaznaczone informacje. Demonstracje...

21 Turing i Loebner Test Turinga (1950): czy jesteś programem czy komputerem? Od 1994 r Medal i Nagroda Loebnera przyznawana jest programowi, który przejdzie Test Turinga. Nagroda główna to 100 K$, co roku 2000 $. Sędziowie mają >15 min na rozmowę z botem lub człowiekiem, potem wystawiają ocenę. 2001: Alice dostał 14 punktów, ludzie : Ellaz, 2003: Jabberwock opowiada dowcipy, podaje pogodę, czyta na głos książki, interpretuje I-Ching, gra w karty, uczy się...http://www.ellaz.com/ Ocena programów i ludzi, na ile sztuczny/prawdziwy w skali Tylko 10% sędziów się myli (2000).

22 Przykład konwersacji Talk-Bot #3 by Chris Cowart User: Can you love? Talk-Bot: I've seen people do it.. it doesn't seem hard! W 1994 roku tematami były koty i psy, kriogenika, Rolling Stones, proces O.J. Simpsona, a zwyciężył program dyskutujący o seksie! Zawody w 1998 roku w Sydney nie miały ograniczeń tematu konwersacji. Programy często przejmują inicjatywę, co ułatwia oszukanie sędziego. Oceny: 1 – najbardziej ludzki, 10 – najmniej ludzki.

23 Przykład konwersacji PROGRAM: Hello. My name is Albert. Who are you? JUDGE002: Greetings, I'm judge 2 PROGRAM: I'm not sure what to talk about with you. Are you a girl or a boy? JUDGE002: girl. how are you? PROGRAM: Are you married? I'm doing just fine, thanks. JUDGE002: would you like to talk about somethng interesting? PROGRAM: MP is an abbreviation for Member of Parliament. JUDGE002: right, why did you say that? PROGRAM: I just felt like it. JUDGE002: okay, did you hit a wrong button? PROGRAM: Do you come from around here? JUDGE002: yes, do you? PROGRAM: No I don't.

24 Przykład cd. J002: where do you come from PROGRAM: I am from Earth. J002: well that's very specific indeed. what are your interests> PROGRAM: Would you like to have a drink with me later? let's not get too personal. J002: what do you work as? P. I've worked on a lot of PC's and some mini computers and mainframes when I was in college

25 Wyniki 2000 Program Alice oszukał sędziego 1 i 2.

26 Wyniki 2004 W 2000 roku najsłabszy człowiek był lepszy od najlepszego programu 3.3 razy, w 2004 już tylko 1.9 razy. Postęp?

27 Generacja tekstu Brutus - program tworzący opowiadania na zadany temat, np. zdanie: Jerzy obudził się pewnego ranka z koszmarnym uczuciem, że stał się wielkim insektem. Historie dziwaczne, a przez to interesujące, np. porównania: Oczy Harta były jak wielkie, krwawiące słońca. LAG: Literary augumented grammars. Formalizacja pojęcia zdrada. Nadaje się do pisania scenariuszy TV!

28 Gry słowne Gry komputerowe angażują głównie zdolności percepcyjno-ruchowe, w przeszłości to mowa i gry słowne stanowiły podstawę rozwoju. Dialog z użytkownikiem: o co mu chodzi? Trzeba zadawać pytania by sprecyzować dokładnie, co rozmówca ma na myśli. Gra w 20 pytań: pomyśl o czymś, a ja zgadnę. Czy to zwierzę, roślina, minerał czy coś innego?Gra w 20 pytań Jak zadawać inteligentne pytania? Gra w 20 pytań to kolejne wyzwanie dla AI, chcemy zrobić światowe mistrzostwa. Mamy już mówiącą głowę, z którą można pograć. Można też kupić zabawkę z grą w 20 pytań, ale bez awatara.mówiącą głowę Planujemy wiele zastosowań w grach edukacyjnych.

29 HITHIT HIT = Humanized InTerfaces, czyli naturalne interfejsy w komputerach i telefonach. Cel daleki: budowa sztucznego umysłu, czyli systemu z którym będziemy mogli mieć podobne relacje jak z ludźmi. Cel bliski: integracja wielu technologii, stworzenie modularnej platformy dla HIT, składającej się z mówiącej głowy, syntezy mowy, kontroli zachowania, wyrazu twarzy, gestów, percepcji słuchowej, wzrokowej, rozpoznawania mowy, lokalizacji obiektów, rozpoznawania osób po głosie i twarzy, dostępu do baz danych i informacji z Internetu, pamięci i kojarzenia faktów. Liczne zastosowania, ale wąsko określone, nie uniwersalna AI. Wielki rynek programów dla urządzeń przenośnych, bez klawiatury, które mają zbyt wiele możliwości by je wykorzystać. Na razie mam w projekcie 16 osób z NTU, ponad 4Mzł.

30 HIT: planowana platforma Ogólny schemat: funkcje podstawowe: synteza i rozpoznawanie mowy w ograniczonym, zakresie, grafika, proste f. językowe (NLP) + funkcje rozszerzone: percepcja, poznawcze, afektywne,behawioralne, wyspecjalizowani agenci. Wyzwanie: zbudować modularną platformę na PC, z głową 3D, funkcjami percepcyjnymi, kontrolą zachowania, funkcjami kognitywnymi i afektywnymi, przenieść ją telefony/usługi sieciowe. Integracja wielu istniejących projektów dotyczących AI, analizy sygnałów, komputerowej wizji, treści semantycznych multimediów itd; współpraca z przemysłem, silna konkurencja ze strony Microsoft, Intel, projektów UE. Percepcja: słuch i wzrok Funkcje poznawcze Funkcje afektywne Interfejsy do informacji tekstowej Kontrola zachowania Kontrola urządzeń Graficzna głowa Synteza mowy Zrozumienie tekstów Agenci d/s specjalnych

31 Mind-botsMind-bots Agenci, boty, roboty – maszyny bez głowy? Wyższe czynności poznawcze w agentach wymagają rozumowania w oparciu o percepcję, skojarzeń, myślenia, wiedzy o świecie, rozumienia stanów mentalnych innych agentów. Mind-bots: teoria poznawania (architektura poznawcza) + zdolności lingwistyczne, symulacje bez czynności sensomotorycznych. Przykłady: Gerald Edelman, roboty Nomad/Darwin w których złożone formy zachowania powstają z instynktów w sieciach neuronowych.Nomad/Darwin John Anderson, ACT-R, architektura poznawcza: teoria działania umysłu na poziomie symbolicznym, z elementami sub-symbolicznymi.architektura poznawcza Allan Newell, SOAR, uniwersalna teoria poznawania + system modelowania + analiza języka => regułowy system NL-SOAR.


Pobierz ppt "Świat Bytów Wirtualnych 1 Włodzisław Duch Katedra Informatyki Stosowanej, Uniwersytet Mikołaja Kopernika, Toruń School of Computer Engineering, Nanyang."

Podobne prezentacje


Reklamy Google