Uwagi na temat eksploracji danych dla telekomunikacji

Slides:



Advertisements
Podobne prezentacje
I część 1.
Advertisements

Prezentacja firmy Remigiusz Siudziński Warszawa,
Data Mining w e-commerce
Joanna Sawicka Wydział Nauk Ekonomicznych, Uniwersytet Warszawski
Project management w procesie budowy grona
Metody Sztucznej Inteligencji 2012/2013Zastosowania systemów rozmytych Dr hab. inż. Kazimierz Duzinkiewicz, Katedra Inżynierii Systemów Sterowania 1 Zastosowania.
Świadczenie usługi dystrybucyjnej - biznes OSD
OFERTA DLA PRZEMYSŁOWEGO ODBIORCY ENERGII ELEKTRYCZNEJ CENTROZAP S.A. Biuro Energetyki Ul. Wańkowicza Katowice Tel. +48(32) Fax. +48(32)
Analiza ryzyka projektu
e-commerce jako efektywny rozwój dystrybucji
Analiza potencjalnych skutków wdrożenia usługi WLR
1 mgr inż. Sylwester Laskowski Opiekun Naukowy: prof. dr hab. inż. Andrzej P. Wierzbicki.
Systemy dla przedsiębiorstw
Niestandardowe techniki badań marketingowych.
1 Projekt System 7/24. Białystok, 9 lipiec 2007 System 7/24 - jako przykład współpracy BIZNES - SAMORZĄD Warszawa,
1 Stan rozwoju Systemu Analiz Samorządowych czerwiec 2009 Dr Tomasz Potkański Z-ca Dyrektora Biura Związku Miast Polskich Warszawa,
Hurtownie Danych Mariusz Dołęga.
Ksantypa2: Architektura
Program Międzynarodowej Oceny Umiejętności Uczniów OECD PISA
Definicje operacji.
Czym jest zarządzanie operacyjne
INFORMAYZACJA PRZEDSIĘBIORSTW
1 Kryteria wyboru systemów: Przystępując do procesu wdrażania zintegrowanego systemu zarządzania, należy odpowiedzieć na następujące pytania związane z.
Wykład 7 Wojciech Pieprzyca
Jakość systemów informacyjnych (aspekt eksploatacyjny)
Praca Inżynierska „Analiza i projekt aplikacji informatycznej do wspomagania wybranych zadań ośrodków sportowych” Dyplomant: Marcin Iwanicki Promotor:
UKŁADY SZEREGOWO-RÓWNOLEGŁE
Typy systemów informacyjnych
Badanie kwartalne BO 2.3 SPO RZL Wybrane wyniki porównawcze edycji I- V Badanie kwartalne Beneficjentów Ostatecznych Działania 2.3 SPO RZL – schemat a.
Atlantis INSPECTOR System wspomagania zarządzaniem i ewidencją obiektów sieciowych.
Wykonawcy:Magdalena Bęczkowska Łukasz Maliszewski Piotr Kwiatek Piotr Litwiniuk Paweł Głębocki.
Formy pracy na odległość w dobie Nowej Gospodarki dr Zbigniew E. Zieliński Wyższa Szkoła Handlowa im. B. Markowskiego ul. Peryferyjna.
Strona 1 Wykład jest współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego Eksploracja danych M. Muraszkiewicz Instytut Informatyki,
GOSPODARKA OPARTA NA DANYCH
Produkcja skojarzona w systemie elektroenergetycznym
„Rynek pracy w powiecie trzebnickim: struktura bezrobocia i miejsca pracy.”
Jak optymalizować procesy. Jak działać efektywniej
Rozwiązania informatyczne dla przedsiębiorstw
Komputerowe wspomaganie medycznej diagnostyki obrazowej
Podstawy działania wybranych usług sieciowych
Moduł: Informatyka w Zarządzaniu
Zasady organizacji wydarzeń promocyjnych
Spotkanie Centrum Poczty i Postdata S.A.
Badanie kwartalne BO 2.3 SPO RZL Wybrane wyniki porównawcze edycji I- VII Badanie kwartalne Beneficjentów Ostatecznych Działania 2.3 SPO RZL – schemat.
Badanie kwartalne BO 2.3 SPO RZL Wybrane wyniki porównawcze edycji I- VII Badanie kwartalne Beneficjentów Ostatecznych Działania 2.3 SPO RZL – schemat.
Planowanie przepływów materiałów
Analiza ekonomiczno – finansowa Zajęcia 1 – Wprowadzenie.
Internetowego Biura Rachunkowego
EcoCondens Kompakt BBK 7-22 E.
1 Spotkanie dotowane w ramach Programu Rozwoju Sprzedaży Ilustracje pochodzą z ogólnodostępnych stron internetowych, w tym
Bazy i Systemy Bankowe Sp. z o.o. ul. Kasprzaka 3, 85 – 321 Bydgoszcz
Badanie kwartalne BO 2.3 SPO RZL Wybrane wyniki porównawcze edycji I- VI Badanie kwartalne Beneficjentów Ostatecznych Działania 2.3 SPO RZL – schemat a.
Jak Jaś parował skarpetki Andrzej Majkowski 1 informatyka +
© GfK 2014 | GfK Health | Leki homeopatzcyne widziane okiem lekarzy 1 LEKI HOMEOPATYCZNE WIDZIANE OKIEM LEKARZY Czerwiec 2014.
Informatyczne Systemy Zarządzania dr inż. Andrzej Macioł
Szkolenia E-Learning SIMP Consulting Stanisław Płaskowicki Dorota Płaskowicka.
Studium osiągalności. Rozmiar projektu (np. w punktach funkcyjny projektu w porównaniu do rozmiaru zakładanego zespołu projektowego i czasu Dostępność.
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski informatyka +
Kalendarz 2020.
ANKIETA ZOSTAŁA PRZEPROWADZONA WŚRÓD UCZNIÓW GIMNAZJUM ZPO W BORONOWIE.
ZINTEGROWANE SYSTEMY ZARZĄDZANIA
niezawodności Z problemem jakości systemów informacyjnych wiąże się problem zapewnienia odpowiedniej niezawodności ich działania.
Ergonomia procesów informacyjnych
Adaptacyjne Systemy Inteligentne Maciej Bielski, s4049.
Zintegrowany monitoring infrastruktury IT w Budimex
Gwarancje przepływności transmisji danych w sieciach ruchomych - debata Warszawa, 16 maja 2011.
IV Konferencja Naukowo-Techniczna "Nowoczesne technologie w projektowaniu, budowie.
{ Wsparcie informacyjne dla zarządzania strategicznego Tereshkun Volodymyr.
CIS Polska - mgr inż. Mirosław Pułyk
Raport postępu lub stanu
Zapis prezentacji:

Uwagi na temat eksploracji danych dla telekomunikacji M. Muraszkiewicz mietek@mimuw.edu.pl 27 października, 2000 M. Muraszkiewicz

Spis treści 2. Definicja Eksploracji Danych/Wiedzy (ED) 3 Spis treści 2. Definicja Eksploracji Danych/Wiedzy (ED) 3. Techniki eksploracji 4. Przykład 5. ED w telekomunikacji 1. Wstęp M. Muraszkiewicz

Choć dysponujemy informacjami, to wciąż brakuje nam ... wiedzy. Wstęp “Celem i przedmiotem przetwarzania komputerowego jest wgląd w świat, a nie liczby” Richard Hamming Choć dysponujemy informacjami, to wciąż brakuje nam ... wiedzy. M. Muraszkiewicz

Teraz przedyskutujemy : 1. Wstęp 3. Techniki eksploracji 4. Przykład 5. ED w telekomunikacji Teraz przedyskutujemy : 2. Definicja ED M. Muraszkiewicz

Terminologia Eksploracja danych Ekstrakcja danych Wydobywanie danych Archeologia danych ... Data mining Nota: Eksploracja danych jest podprocesem odkrywania wiedzy w bazach danych (ang. Knowledge Discovery in Data Bases) M. Muraszkiewicz

Definicja ED Tutaj przez eksplorację danych rozumiemy proces automatycznego odkrywania znaczącej, pożytecznej, dotychczas nieznanej i możliwie pełnej wiedzy zawartej w dużych bazach danych, wiedzy ujawniającej ukryte własności badanego przedmiotu. Wiedza ta przyjmuje postać reguł, prawidłowości, tendencji i korelacji, i jest następnie przedstawiana przygotowanemu do jej spożytkowania użytkownikowi w celu rozwiązania stojących przed nią/nim problemów i podjęcia istotnych decyzji. M. Muraszkiewicz

Mniej poważna definicja ED “Eksploracja danych polega na torturowaniu danych tak długo, aż zaczną zeznawać” M. Muraszkiewicz

Dlaczego ED ? Odkrytą wiedzę można wykorzystać m.in. do lepszego rozumienia świata, w którym żyjemy. usprawnienia procesów produkcyjnych, zarządzania, obsługi klientów, marketingu, zmniejszania nadużyć, ograniczenia migracji klientów do konkurentów. A więc łącznie do — zwiększenia przewagi konkurencyjnej. M. Muraszkiewicz

Wspomaganie procesów decyzyjnych Kontekst Eksploracja danych Wspomaganie procesów decyzyjnych Zasoby danych M. Muraszkiewicz

Przykłady Firma American Express podała, że wykorzystanie technik eksploracji na bazie danych klientów pozwoliło zwiększyć o 10 – 15 % użycie jej kart kredytowych. Bardzo duża firma handlowa dzięki ekstrakcji potrafiła określić 5-cio procentowy segment tych klientów, którzy charakteryzują się tym, że regularnie udzielają odpowiedzi na różne zapytania firmy. Klienci ci dostarczali 60 % wszystkich odpowiedzi. Dzięki ustaleniu tego faktu firma zwiększyła 12- krotnie stopę odpowiedzi i zmniejszyła koszty opłat pocztowych o 95 %. M. Muraszkiewicz

Kontekst ED świat statystyka bazy danych sztuczna inteligencja M. Muraszkiewicz

Czym ED nie jest ? procesem nieodzownie związanym z hurtowniami danych, typowym narzędziem analitycznym i środkiem do tworzenia sprawozdań, całkowicie zautomatyzowanym procesem, łatwym, tanim i szybkim do wdrożenia w organizacji procesem, przysłowiowym, wielozadaniowym scyzorykiem armii szwajcarskiej dobrym na wszelkie okazje, ... M. Muraszkiewicz

Teraz przedyskutujemy : 1. Wstęp 2. Definicja ED 4. Przykład 5. ED w telekomunikacji Teraz przedyskutujemy : 3. Techniki eksploracji M. Muraszkiewicz

Techniki eksploracji Najczęściej eksploracja oparta jest na następujących typach działań: klasyfikowanie (ang. classification) regresja (ang. regression) grupowanie (ang. clustering) kojarzenie (ang. association) reguły epizodyczne (ang. episode rules) M. Muraszkiewicz

Kojarzenie Kojarzenie polega na odszukiwaniu tych elementów, które wiążą się z zadanym zdarzeniem lub innym elementem. Algorytmy tu wykorzystywane pozwalają odkrywać reguły typu jeśli - to. Przykład jeśli : klient kupuje płatki owsiane, to : w 65 % przypadków klient ten kupi mleko “Łaciate” M. Muraszkiewicz

Teraz przedyskutujemy : 1. Wstęp 2. Definicja ED 3. Techniki eksploracji 5. ED w telekomunikacji Teraz przedyskutujemy : 4. Przykład M. Muraszkiewicz

Przykład Kierownictwo firmy zostało poinformowane, że nasila się zjawisko przechodzenia jej klientów do firmy konkurencyjnej. Zarząd podjął decyzje o zbadaniu sprawy i ustaleniu przyczyn tego zjawiska. W tym celu rozpoczęto projekt eksploracji danych, którego zadanie brzmiało: podać charakterystykę klienta, który ma skłonność do zmiany firmy. M. Muraszkiewicz

Przykład – cd. F(x) = 1,3x odchodzą pozostają wiek 80 70 60 50 40 średnia liczba rozmów 30 20 pozostają 10 20 40 60 80 wiek F(x) = 1,3x M. Muraszkiewicz

Ogólny schemat ED 1. Zdefiniować problem/zadanie i zanalizować otoczenie. 2. Wybrać zbiór danych do eksploracji i atrybuty. 3. Zdecydować jak przygotować dane do przetwarzania. Na przykład: czy wiek reprezentować jako przedział (np. 40-45 lat), czy jako liczbę (np. 40 lat). 4. Wybrać algorytm (lub ich kombinację) eksploracji i wykonać program realizujący ten algorytm. 5. Zanalizować wyniki wykonania programu i wybrać te, które uznajemy za rezultat pracy. 6. Przedłożyć wyniki kierownictwu organizacji i zasugerować sposób ich wykorzystania. M. Muraszkiewicz

Teraz przedyskutujemy : 1. Wstęp 2. Definicja ED 3. Techniki eksploracji 4. Przykład Teraz przedyskutujemy : 5. ED w telekomunikacji M. Muraszkiewicz

Łańcuch wartości Analiza potrzeb klientów Planowanie sieci Budowa i konserwacja sieci Eksploatacja sieci Billing Marketing Obsługa klienta Sprzedaż M. Muraszkiewicz

Pytania - Zadania ED W jaki sposób planować i optymalizować inwestycje na budowę i rozwój sieci utrzymując wysoki poziom usług, ale bez nadmiernej rozbudowy infrastruktury ? Jaka jest struktura i regularności ruchu w sieci ? Jak optymalizować topografię sieci ? Jak minimalizować koszty i nakłady czasowe na pomiary ruchu i parametrów eksploatacyjnych sieci ? M. Muraszkiewicz

Pytania - Zadania ED; cd. Jak rozpoznawać i klasyfikować problemy techniczne (anomalie, awarie), także problemy chronicznie powtarzające się, oraz ujawniać przyczyny anomalii ? Jak rozpoznawać i klasyfikować alarmy generowane przez sieć ? M. Muraszkiewicz

Pytania - Zadania ED; cd. Jakie są wzorce zachowań użytkowników i jak rozpoznawać połączenia stanowiące nadużycie w stosunku do operatora sieci ? Jaki jest profil użytkownika i motywacja, które mogą skłonić go do zmiany operatora sieci ? Jaki jest profil użytkowników, którzy płacą wysokie rachunki ? Jakiej reakcja użytkowników można się spodziewać na wprowadzenie nowych rodzajów usług czy taryf, uwzględniając różnorodność profili użytkowników ? M. Muraszkiewicz

Strategia realizacji projektu ED Analiza procesów biznesowych Etap I 1. Identyfikacja procesów podatnych na ED. 2. Wybór metod i narzędzi. 3. Eksperymentalne ED. Etap II Realizacja platformy i aplikacje ED. Zadania ED Analiza źródeł danych Metoda_1 Metoda_n . . . Zadanie . . . Żródło_k Żródło_1 M. Muraszkiewicz

Narzędzia uniwersalne Darwin Thinking Machines Corporation Enterprise Miner SAS Intelligent Miner IBM Mine Set Silicon Graphics RD2 Politechnika Poznańska oprogramowanie Politechnika Warszawska własne M. Muraszkiewicz

Narzędzia specjalizowane ACPro zmiana operatora Fraud/CPS France Telecom; nadużycia ControlArts alarmy Scout AT&T; diagnozowanie awarii TASA Uniwersytet Helsiński, Nokia M. Muraszkiewicz

Spostrzeżenia - 1 Zasadniczym warunkiem powodzenia ED jest udział zlecających prace specjalistów/ekspertów w fazach: - definiowania zadania, - eksperymentów, - ewaluacji wyników cząstkowych. M. Muraszkiewicz

Spostrzeżenia - 2 To samo zadanie warto rozwiązywać stosując rożne metody eksploracji danych (wyniki mogą być zaskakująco różne ! ). Jeśli wybrano już metodę rozwiązania zadania, to należy zabiegać o możliwość prowadzenia eksperymentów na rożnych zbiorach danych dotyczących tego zadania. M. Muraszkiewicz

Spostrzeżenia - 3 Przetwarzanie wstępne i końcowe danych stanowią około 85 % czasu przeznaczonego na rozwiązywanie zadania. M. Muraszkiewicz

Spostrzeżenia - 4 Komercyjne oprogramowanie do prowadzenia eksperymentów eksploracji danych nie zawsze jest skuteczne do rozwiązywania zadań stawianych przez operatorów telekomunikacyjnych; dotyczy to zwłaszcza analizy zadań gdzie występują bardziej złożone struktury danych oraz zależności temporalne (sekwencje zdarzeń, reguły epizodyczne). M. Muraszkiewicz

Spostrzeżenia - 5 Operatorzy nie są zainteresowani udostępnianiem swoich doświadczeń, gdyż traktują wiedzę pozyskaną za pomocą eksploracji danych jako element swej przewagi nad konkurentami. Transfer wiedzy i doświadczeń w zakresie eksploracji danych dla telekomunikacji praktycznie nie istnieje. M. Muraszkiewicz

Spostrzeżenia - 6 ED jest procesem złożonym, długotrwałym i kosztownym. Opiera się na zaawansowanych metodach, technikach i oprogramowaniu informatycznym. Zazwyczaj ED wymaga eksperymentowania, „dostrajania” i korzystania z kompetentnych konsultantów. M. Muraszkiewicz

Dziękuję za uwagę M. Muraszkiewicz