Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Wyszukiwanie Informacji Na Stronach WWW

Podobne prezentacje


Prezentacja na temat: "Wyszukiwanie Informacji Na Stronach WWW"— Zapis prezentacji:

1 Wyszukiwanie Informacji Na Stronach WWW
W Internecie można znaleźć wiele potrzebnych i ciekawych informacji, ale jest ich tak dużo, że czasami nie sposób do nich dotrzeć. Najlepiej jeżeli znamy dokładny adres strony z poszukiwanymi wiadomościami, ale niestety tak jest rzadko. Wtedy należy posłużyć się dostępnymi narzędziami służącymi do wyszukiwania informacji. Autor: Piotr Wasilewicz

2 Narzędzia Wyszukiwania Informacji W Internecie
wyszukiwarki tekstowe (szperacze) katalogi stron webring wyszukiwarki i katalogi specjalistyczne INTERNET Obecnie dostępne są następujące narzędzia: wyszukiwarki tekstowe, popularnie nazywane szperaczami, katalogi stron internetowych, webring oraz wyszukiwarki i katalogi specjalistyczne.

3 Katalogi Stron - Działanie
Redaktor Redaktor Redaktor INTERNET Redaktor Najstarszą metodą wyszukiwania informacji są katalogi stron internetowych. Serwisy te zatrudniają redaktorów, którzy przeglądają strony internetowe i decydują do jakiej kategorii je zaliczyć. Mogą również dodać krótki opis witryny. W ten sposób powstaje komputerowy katalog udostępniany wszystkim zainteresowanym. Redaktor Redaktor Katalog

4 Drzewiasta struktura katalogu
Strony WWW Kategorie podrzędne Katalog jest drzewiastą strukturą, w którą szukający się zagłębia. Witryny przypisane są, ze względu na swoją zawartość do poszczególnych kategorii, które dzielą się na kategorie podrzędne. Kategorie główne

5 Katalogi Stron - Budowa
Edukacja Kursy Strony WWW Język angielski E -Teacher Szkoły Szkoły podstawowe Gim. Nr 3 Gim. Nr 1 Gim. Nr 12 Gimnazja Drzewiasta struktura przypomina drzewo katalogów i podkatalogów eksploratora Windows. Na końcu tej struktury znajdują się strony zawierające odsyłacze internetowe do konkretnych witryn. Szkoły średnie Kategoria główna Kategoria podrzędna I Kategoria podrzędna II Odsyłacze do stron WWW

6 Wady I Zalety Katalogów Stron
Mała ilość adresów umieszczonych w katalogu Aktualizacja katalogu Różna interpretacja zawartości strony przez różnych ludzi Rzetelność – bazę adresów opracowują ludzie, którym zależy na wiarygodności umieszczonych tam danych Wadą katalogów jest mała liczba zawartych w nich stron w porównaniu z innymi narzędziami. Powodem są ludzkie możliwości – jest to praca polegająca na dokładnym przejrzeniu witryny i zakwalifikowaniu jej do odpowiedniej kategorii. Drugą wadą jest aktualizacja katalogu. Strony internetowe powstają, znikają i zmieniają się a weryfikacja ich zawartości czy obecności wymaga ponownego odwiedzenia ich przez redaktora. Jest to drugi powód umieszczania małej ilości adresów w katalogu. Trzecią wadą jest różna interpretacja świata przez ludzi. Tą samą stronę dwie osoby mogą umieścić w różnych kategoriach. Co może prowadzić do nieporozumień. Na przykład strona poświęcona grze w szachy może zostać umieszczona przez redaktora katalogu w kategorii sport, natomiast szukający tej strony będzie poszukiwał informacji na ten temat w kategorii gry. Zaletą katalogów jest to, że opracowują je ludzie którym zależy na wiarygodności umieszczonych w nich danych. Możemy więc mieć pewność, że ktoś za nie odpowiada. W przypadku klasyfikowania automatycznego mogą się zdarzyć pomyłki i nieporozumienia, np. wielu osobom zależy aby ich strona była oglądana częściej ze względu na umieszczone na niej reklamy wtedy próbują oszukiwać. Program łatwiej oszukać niż człowieka.

7 Wyszukiwarki Tekstowe - Budowa
Program analizy tekstów Program obsługi bazy danych Bardziej wydajnym sposobem klasyfikowania stron WWW są wyszukiwarki internetowe nazywane również szperaczami tekstowymi, które tworzą automatycznie swoje bazy danych o witrynach. Oprogramowanie wyszukiwarki składa się z dwóch oddzielnych modułów, z których pierwszy odwiedza witryny internetowe, analizując umieszczone na nich teksty, oraz podąża za odsyłaczami hipertekstowymi do kolejnych stron. Drugi zaś obsługuje powstającą w ten sposób bazę danych, często nazywaną indeksem. Korzystanie z bazy polega na wpisywaniu poszukiwanych słów i obejrzeniu wyświetlonych wyników w postaci hipertekstowych odsyłaczy do stron, które zawierają wpisane wyrażenie. Jako pierwsze wyświetlane są adresy witryn, które bardziej odpowiadają zadanemu pytaniu.

8 Wyszukiwarki Tekstowe - Działanie
INTERNET Oprogramowanie szperacza próbuje samodzielnie określić tematykę dokumentu i jego wartość, co ma później wpływ na miejsce, które dany dokument zajmie w klasyfikacji odpowiedzi. Automatyczne wybieranie słów kluczowych z przeglądanych dokumentów polega na analizie umiejscowienia poszczególnych wyrazów i częstości ich powtarzania w stosunku do innych. Taki sposób badania zawartości stron WWW nazywa się wyszukiwaniem tekstowym. Baza danych

9 Wady I Zalety wyszukiwarek
Automatyczna analiza tekstu prowadząca czasami do błędów Wykorzystanie mechanizmów indeksujących poprzez firmy reklamowe Aktualizacja bazy danych szperacza Wyświetlanie tych samych stron znajdujących się pod różnymi adresami Dość duża liczba adresów umieszczonych w bazie w stosunku do innych mechanizmów wyszukiwawczych Niestety nawet najlepszy program analizujący zawartość stron WWW czasami nie potrafi poradzić sobie z zawiłościami ludzkiego języka – co prowadzi do błędów. Założenia programu analizującego często wykorzystywane są przez firmy reklamowe, które na przykład umieszczają na swoich stronach wyrazy najczęściej zadawane przez szukających informacji. Wyrazy te mogą mieć kolor tła strony, tak że nie są widoczne przez przeglądających, jednak rejestrowane przez wyszukiwarkę. Firmy reklamowe dążą do tego, aby ludzie zobaczyli umieszczone na nich reklamy. Problemem jest także aktualizacja danych w bazie szperacza – szperacz nie nadąża za zmieniającą się zawartością stron. Co przy ogromnej liczbie pozycji w bazie jest nie lada zadaniem, np. serwis wyszukiwawczy FAST Search posiada w bazie ok. 200 mln stron. Inną wadą jest wyświetlanie w liście wyników wyszukiwania tych samych stron, które znajdują się pod różnymi adresami. Zaletą wyszukiwarek jest duża liczba poindeksowanych stron, co czyni je najpopularniejszym narzędziem poszukiwania informacji w Sieci.

10 Formułowanie Zapytań Do wyszukiwarek
Różne wyszukiwarki dysponują różnymi rodzajami zapytań, co daje jeszcze większe możliwości odnalezienia poszukiwanej informacji, w krótszym czasie.

11 Wyszukiwanie Według Słów Kluczowych
Szukaj komputer Najprostszym sposobem zadawania pytania bazie danych szperacza jest wpisanie poszukiwanego wyrazu lub wyrazów określających pożądaną przez nas informację. Baza danych wyświetli nam listę stron, które zawierają poszukiwane słowo lub słowa. Na przykład słowo komputer. Może to jednak spowodować wyświetlenie listy zawierającej np adresów, której przejrzenie może stać się czasochłonne.

12 Przeszukiwanie Otrzymanych Wyników
W takim przypadku niektóre szperacze pozwalają nam na przeszukanie otrzymanych wyników. Należy sformułować dodatkowe pytanie do bazy, co umożliwi zmniejszenie liczby otrzymanych stron i dokładniejsze wyniki wyszukiwania. Na przykład poszukujemy stron internetowych szkół wyższych. Na pytanie szkoły baza wyszukiwarki zwróciła nam bardzo dużą listę adresów. Dzięki możliwości przeszukania otrzymanych wyników zadajemy ponowne pytanie wyższe, ograniczając w ten sposób liczbę otrzymanych wyników.

13 Wyszukiwanie Frazy „Pan Tadeusz” Pan Tadeusz
Wpisanie do wyszukiwarki dwóch słów Pan Tadeusz spowoduje wyświetlenie stron zawierających słowo Pan i witryn zawierających wyraz Tadeusz oraz tych, które zawierają oba słowa. Jednak nam chodziło o strony dotyczące tylko Pana Tadeusza. Należy ponownie zadać to samo pytanie jednak oba wyrazy umieścić w cudzysłowie. Otrzymamy listę zawierającą adresy stron, które w swoim tekście posiadają dwa słowa obok siebie i to w pożądanej kolejności. „Pan Tadeusz”

14 Poczt ? Poczt * Poczt a Poczt a Poczt y Poczt y Poczt owy Poczt ówka
Wyszukiwanie Rozmyte Poczt ? Poczt * Poczt a Poczt a Poczt y Poczt y Poczt owy Poczt ówka Poczt ylion Wyszukiwanie rozmyte polega na uwzględnieniu różnych form danego wyrazu. W pytaniu podajemy początek wyrazu pozostałą część zastępujemy znakiem ? lub *. Znak ? zastępuje tylko jedną literę, zaś * zastępuje większą ilość znaków. Jak widać w podanym przykładzie szukamy ogólnie stron na temat poczty. Jednak gdy wpiszemy słowo poczta to wyszukiwarka wyświetli nam adresy stron zawierających wyraz poczta, a pominie strony zawierające wyrazy poczty, pocztowy itd. Poczt owiec

15 Konieczność Występowania Wyrazu Lub Nie
Wyraz musi wystąpić Wyraz nie może wystąpić +komputer -komputer Inną możliwość dają nam dwa znaki + i -. Pierwszy wymusza na szperaczu wyświetlenie stron, które muszą zawierać wyraz poprzedzony +. Drugi zaś wyklucza strony zawierające dane słowo. Poszukujemy stron różnych gimnazjów. Jeżeli zadamy pytanie gimnazjum, to szperacz wyświetli nam obok stron gimnazjów, także adresy wydawnictw i księgarni internetowych, które oferują podręczniki dla gimnazjum. Zadanie pytania gimnazjum –wydawnictwa – księgarnie umożliwi nam pozbycia się tych nieinteresujących nas w tej chwili adresów. Przedstawione zapytania niejednokrotnie można ze sobą łączyć co daje jeszcze lepsze efekty.

16 Pytanie Odpowiedź Metawyszukiwarki Wyszukiwarki Metawyszukiwarka
Czasami w czasie szukania potrzebnych informacji na stronach WWW na zadane pytanie wyszukiwarka nie wyświetli nam żadnego adresu lub będzie ich bardzo mało. Wtedy można skorzystać z metawyszukiwarek. Są to serwisy internetowe, które nie posiadają własnej bazy danych, ale potrafią wysłać nasze zapytanie do kilku lub kilkunastu samodzielnych szperaczy, odebrać je od nich i przedstawić w przejrzystej formie. Odpowiedź Metawyszukiwarka

17 Wady I Zalety metawyszukiwarek
Brak dostępu do różnych rodzajów zapytań jakie dają wyszukiwarki Dostęp do większej ilości adresów Obróbka wyświetlonej listy odpowiedzi: sortowanie odpowiedzi usuwanie nieistniejących adresów Wadą metawyszukiwarek jest brak dostępu do specyficznych zapytań złożonych jakie dają pojedyncze szperacze. Zaletą jest to, że można zadać jedno pytanie do kilku szperaczy przy odwiedzeniu tylko jednego serwisu. Zaoszczędza to czas i daje możliwość przeszukania większej części zasobów Internetu. Niektóre metawyszukiwarki dodatkowo opracowują otrzymaną listę wyników: Usuwają powtarzające się adresy i te, które już nie istnieją w Internecie, a są jeszcze zapisane w bazie wyszukiwarki. Dodatkowo mogą sortować na różne sposoby wyświetloną listę.

18 Webring Ciekawą formą nawigacji po stronach WWW jest webring (sieciowy pierścień). Webring łączy ze sobą strony o określonej tematyce. Każda witryna należąca do określonego pierścienia posiada odpowiednie odsyłacze do innych stron webringu. Daje to możliwość przeglądania stron po kolei do tyłu i do przodu, wyświetlenie listy z adresami wszystkich stron, a nawet losowy wybór strony z tego webringu.

19 Katalogi I wyszukiwarki Specjalistyczne
Internet umożliwia dostęp nie tylko do stron WWW, ale także do zdjęć, programów, kamer internetowych itp. Powstały specjalistyczne wyszukiwarki i katalogi, które gromadzą adresy stron dotyczących tylko określonej tematyki bądź jednego rodzaju informacji.


Pobierz ppt "Wyszukiwanie Informacji Na Stronach WWW"

Podobne prezentacje


Reklamy Google