Klasyfikacja dokumentów tekstowych w oparciu o blogi

Slides:



Advertisements
Podobne prezentacje
Wprowadzenie do Data Miningu
Advertisements

Piotr Czekalski, ZMiTAC, Politechnika Śląska 2003
Portal EURES – rejestracja CV w bazie CV on - line
Data Mining w e-commerce
20041 Projektowanie dynamicznych witryn internetowych Paweł Górczyński ASP 3.0.
Gambit Centrum Oprogramowania i Szkoleń Sp. z o.o Kraków, al.Pokoju 29B/ Autoryzowany dystrybutor Thomson-Reuters.
Projekt Do kariery na skrzydłach – studiuj Aviation Management Projekt współfinansowany ze ś rodków Europejskiego Funduszu Społecznego. Biuro projektu:
SQL INJECTION Wykorzystanie błędów w językach skryptowych
Eksploracja danych “Drążymy informację ale zbieramy wiedzę” - słowa Johna Naisbett’a, motto z książki “Advances in knowledge discovery and data mining”
Rdzenne rozszerzenia Joomla!
Poprawne modele zawartości. Zarządzanie zmianami struktury. 30 października 2003.
XML w integracji aplikacji
Wycofywanie potwierdzonych transakcji
Arkadiusz Twardoń ZTiPSK
Microsoft Exchange Server 2003 Obieg dokumentów
Promotor: prof. dr hab. Włodzisław Duch
WekaSQL Język i aplikacja przetwarzania oraz eksploracji danych.
WekaSQL Język i aplikacja przetwarzania oraz eksploracji danych.
Co to jest studium przypadku?
EBSCOhost Nowe opcje. Ulepszenia tezaurusów i ich użycia.
Microsoft WinFS – nowy system plików, zasada działania. Wojtek Galek.
Odkrywanie wzorców sekwencji
Ukryte indeksowanie semantyczne SVD Struktury danych
System eksploracji danych z wykorzystaniem dokumentów XML
P I OTR SKOŁYSZ. POCHODZENIE I CELE CZYM JEST.NET ? CO IMPLEMENTUJE MONO ? ŚRODOWISKO PRACY [MONODEVELOP] SYTEMY OPERACYJNE CO PROGRAMOWAĆ ? JĘZYKI PRZYKŁADOWY.
Systemy zarządzania treścią CMS
Promotor: dr.inż. Aleksandra Werner
Przetwarzanie w oknie - nowa siła zapytań
Systemy zarządzania treścią Wykład 1
Struktura aplikacji System elektronicznej obsługi klienta
Zrozumieć Umbraco w 45 minut.
Wyszukiwanie Informacji Na Stronach WWW
CDN OPT!MA integracja z Systemem Microsoft Office 2003.
Promotor: dr.inż. Aleksandra Werner
Magdalena kurzyńska Sławomir Kwasiborski
MEDIAPress2 -> DataFormXT -> QuarkXPress
Konsultant w ABC Data Centrum Edukacyjne Microsoft Certified Trainer od 2004 roku Microsoft Most Valuable Professional od 2008 roku Autor dwóch książek.
InTouch.
OfficeObjects® Portal
Enterprise Architecture Patterns
Kostyantyn Doronovych, 79129, sr1640 Łukasz Marciniak, 79166, sr1640
Autor: Karol Podsiadło Kierujący pracą: dr inż. Ewa Płuciennik-Psota
Iwona Moczydłowska 4 listopada 2011r. Blogi w nauczaniu języka obcego.
SYSTEMY EKSPERTOWE I SZTUCZNA INTELIGENCJA
System do zarządzania i ewidencji dokumentów.
IV EKSPLORACJA DANYCH Zadania eksploracji danych: klasyfikacja
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Kartowanie flory 1. Dokładne zbadanie ekosystemów na danym obszarze 2. Waloryzacja flory 3. Praca w terenie.
Treści multimedialne - kodowanie, przetwarzanie, prezentacjaOdtwarzanie treści multimedialnych Andrzej Majkowski informatyka +
Multimedialny podręcznik prezentujący narzędzia zarządzania wymaganiami Rational RequistePro i Rational SoDa Tomasz Dąbrowski Krzysztof Szczech.
Typy danych, klucz podstawowy, klucz obcy
Biblioteki cyfrowe i repozytoria
Transfer Wiedzy w Leśnym Centrum Informacji dr inż. Dorota Farfał Sękocin Stary 5 grudnia 2011 r.
ŁÓDŹ Budowa cyfrowego archiwum przy pomocy aplikacji IBM DB2 Content Manager Anna Leśniak 18 stycznia 2005.
1 Nawigacja w Internecie Ewa Półtorak Zakład Kształcenia na Odległość Instytut Języków Romańskich i Translatoryki Uniwersytetu Śląskiego.
Each week we will compare our weather Co tydzie ń mo ż emy porówna ć nasze pogodowych Cambourne K ę dzierzyn-Ko ź le.
Wortal Publicznych Służb Zatrudnienia. Stan obecny Przegląd witryn urzędów Różnorodność i standaryzacja.
Weed Wizualna eksploracja danych Andrzej Bartoszek Adam Dudczak Przemysław Gwóźdz Jakub Jankowski.
Weed Wizualna eksploracja danych Visual Data Mining Rafał Fabiański Michał Krysiński Marcin Mielnicki Tomasz Płuciennik.
Opracowanie: Katarzyna Gagan, Anna Krawczuk
SQL Server Analysis Services Action!
Wykorzystanie algorytmu Text Mining do analizy przyjmowanych przez rodziców celów wychowawczych Agnieszka Szymańska.
Optymalizacja SAS OLAP Studio
Otwarta infrastruktura hurtowni danych
JAKUB BAREŁKOWSKI REKLAMA W WYSZUKIWARKACH
Reklama w wyszukiwarkach internetowych. Formy reklamy w wyszukiwarkach internetowych ●wyniki organiczne zbudowane na podstawie algorytmu oceniającego.
Reklama w wyszukiwarkach internetowych Jakub Barełkowski.
Strukturalny język zapytań SQL - historia
IEEE SPMP Autor : Tomasz Czwarno
Inteligentne oprogramowanie z wykorzystaniem SQL Server Data Mining
Zapis prezentacji:

Klasyfikacja dokumentów tekstowych w oparciu o blogi Autorzy: Bartosz Skorupski Tomasz Stężycki

Plan prezentacji Definicje i zakres projektu, Text mining – zastosowania, Analiza tekstu, Technologia i architektura systemu, Harmonogram prac, Studium przypadku

Definicje i zakres projektu Data Mining Data Mining jest metodą eksploracji danych, polegającą na wydobywaniu: Informacji z dużych zbiorów danych lub baz danych, Potencjalnie użytecznej informacji z danych Text Mining Text Mining jest procesem, który polega na: Wydobywaniu nowych, poprawnych danych w dokumentach tekstowych, Automatycznej analizie zawartości dokumentów tekstowych dla przyszłych zastosowań

Cel i zakres projektu Celem jest stworzenie prototypu systemu klasyfikacji dokumentów tekstowych w oparciu o blogi, na podstawie wcześniej zdefiniowanych klas. System powinien działać na zasadzie uczenia się. W tym celu należy zebrać odpowiednią próbkę informacji tekstowej wraz ze znanymi przydziałami do klas, a następnie wykorzystać jeden ze znanych algorytmów uczących.

Text mining – zastosowania Wyszukiwarki, Większe portale (ankiety, artykuły prasowe, itp.), Systemy zarządzania wiedzą, Systemy e-Biznesowe, Aplikacje klienckie, Klasyfikujące e-maile, Klasyfikujące blogi

Analiza tekstu Analiza tekstu pozyskanych zasobów uwzględniając: Selekcja i grupowanie, Określenie znaczenia słów, fraz i przydzielenie ich do odpowiedniej kategorii, Wykorzystanie algorytmu uczenia się

Technologia i architektura aplikacji Text Mining Engine Data sources Compare the Indexed keywords with the words that have to be in each type. Results ordered by rand desc. The ones with the highest rank are closest to created vector. Proceed the Full Text Indexing Create a vector with a must have term or terms SQL Server Component ASP .NET Neural Network

Studium przypadku Klasyfikacja blogów Generowanie blogów danych tekstowych Klasyfikacja Dodanie treści i powiązanie blogów hiperłączami Zaplecze pozycjonerskie dla wyszukiwarek internetowych

Harmonogram prac