Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Repozytoria instytucjonalne a wyszukiwarki akademickie

Podobne prezentacje


Prezentacja na temat: "Repozytoria instytucjonalne a wyszukiwarki akademickie"— Zapis prezentacji:

1 Repozytoria instytucjonalne a wyszukiwarki akademickie
Jak zwiększyć widoczność zasobów repozytoryjnych Tomasz Lewandowski Platforma Otwartej Nauki, ICM, UW 7. Seminarium Open Access, Biblioteka Uniwersytetu Łódzkiego,

2 Misja repozytoriów instytucjonalnych

3 Misja repozytoriów instytucjonalnych
1. Indeksacja

4 Misja repozytoriów instytucjonalnych
1. Indeksacja 2. Archiwizacja

5 Misja repozytoriów instytucjonalnych
1. Indeksacja 2. Archiwizacja 3. Rozpowszechnianie

6 Misja repozytoriów instytucjonalnych
1. Indeksacja 2. Archiwizacja 3. Rozpowszechnianie

7 Misja repozytoriów instytucjonalnych
3. Rozpowszechnianie środowisko: Internet

8 Misja repozytoriów instytucjonalnych
3. Rozpowszechnianie środowisko: Internet trzeba dostosować się do reguł gry

9 Misja repozytoriów instytucjonalnych
3. Rozpowszechnianie środowisko: Internet trzeba dostosować się do reguł gry Ruch użytkowników przekierowywany przez wyszukiwarki

10 Dlaczego Google Scholar?

11 Dlaczego Google Scholar?
1. Aktualnie to jedyna rozpoznawalna wyszukiwarka akademicka na rynku

12 Dlaczego Google Scholar?
1. Aktualnie to jedyna rozpoznawalna wyszukiwarka akademicka na rynku 2. Działa jak agregator

13 Dlaczego Google Scholar?
1. Aktualnie to jedyna rozpoznawalna wyszukiwarka akademicka na rynku 2. Działa jak agregator rozpoznawalny

14 Dlaczego Google Scholar?
1. Aktualnie to jedyna rozpoznawalna wyszukiwarka akademicka na rynku 2. Działa jak agregator rozpoznawalny z aktywnymi użytkownikami

15 Dlaczego Google Scholar?
1. Aktualnie to jedyna rozpoznawalna wyszukiwarka akademicka na rynku 2. Działa jak agregator rozpoznawalny z aktywnymi użytkownikami 3. ...

16 Dlaczego Google Scholar?

17 Dlaczego Google Scholar?
1. Aktualnie to jedyna rozpoznawalna wyszukiwarka akademicka na rynku 2. Działa jak agregator rozpoznawalny z aktywnymi użytkownikami 3. Google Scholar mniej faworyzuje język angielski

18 Dlaczego Google Scholar?
1. Aktualnie to jedyna rozpoznawalna wyszukiwarka akademicka na rynku 2. Działa jak agregator rozpoznawalny z aktywnymi użytkownikami 3. Google Scholar mniej faworyzuje język angielski 4. Widoczna potrzeba społeczności naukowej ( repozytorium CeON)

19 Dlaczego Google Scholar?
1. Aktualnie to jedyna rozpoznawalna wyszukiwarka akademicka na rynku 2. Działa jak agregator rozpoznawalny z aktywnymi użytkownikami 3. Google Scholar mniej faworyzuje język angielski 4. Widoczna potrzeba społeczności naukowej ( repozytorium CeON)

20 Dostępność a Widoczność

21 Dostępność a Widoczność

22 Dostępność a Widoczność
E. Orduna-Malea, D. López-Cózar The Dark Side of Open Access Repositories in Google and Google Scholar: the case of Latin-American Repositories.

23 Dostępność a Widoczność
E. Orduna-Malea, D. López-Cózar The Dark Side of Open Access Repositories in Google and Google Scholar: the case of Latin-American Repositories. K. Arlitsch, P.S. O'Brien Invisible institutional repositories: addressing the low indexing ratios of IRs in Google.

24 1. Konstrukcja akademickiej wyszukiwarki internetowej

25 1. Konstrukcja akademickiej wyszukiwarki internetowej
2. Świat według crawlera

26 1. Konstrukcja akademickiej wyszukiwarki internetowej
2. Świat według crawlera 3. Kilka porad praktycznych

27 1. Konstrukcja akademickiej wyszukiwarki internetowej
2. Świat według crawlera 3. Kilka porad praktycznych podsumowanie

28 1. Konstrukcja wyszukiwarki

29 1. Konstrukcja wyszukiwarki
SERP – Search Engine Result Page

30 1. Konstrukcja wyszukiwarki
SERP – Search Engine Result Page Dlaczego powstaje tak szybko?

31 1. Konstrukcja wyszukiwarki
Crawler – robot przeszukujący internet.

32 1. Konstrukcja wyszukiwarki
Crawler – robot przeszukujący internet. Porusza się po Sieci podążając za linkami.

33 1. Konstrukcja wyszukiwarki
Crawler – robot przeszukujący internet. Porusza się po Sieci podążając za linkami. Pieszczotliwie nazywany 'pajączkiem'.

34 1. Konstrukcja wyszukiwarki
Crawler – robot przeszukujący internet. Porusza się po Sieci podążając za linkami. Indeks – spis stron internetowych przygotowywany przez flotę crawlerów.

35 1. Konstrukcja wyszukiwarki
Crawler – robot przeszukujący internet. Porusza się po Sieci podążając za linkami. Indeks – spis stron internetowych przygotowywany przez flotę crawlerów. Ranking – dowolny sposób oceny zawartości indeksu.

36 1. Konstrukcja wyszukiwarki
Crawler – robot przeszukujący internet. Porusza się po Sieci podążając za linkami. Indeks – spis stron internetowych przygotowywany przez flotę crawlerów. Ranking – dowolny sposób oceny zawartości indeksu. Google długo używał PageRank.

37 1. Konstrukcja wyszukiwarki
Google Scholar ma trzy źródła indeksowanych stron.

38 1. Konstrukcja wyszukiwarki
Google Scholar ma trzy źródła indeksowanych stron. 1. Harvestery.

39 1. Konstrukcja wyszukiwarki
Google Scholar ma trzy źródła indeksowanych stron. 1. Harvestery. Raczej poza zasięgiem repozytoriów.

40 1. Konstrukcja wyszukiwarki
Google Scholar ma trzy źródła indeksowanych stron. 1. Harvestery. Raczej poza zasięgiem repozytoriów. 2. Konta naukowców w Google Scholar.

41 1. Konstrukcja wyszukiwarki
Google Scholar ma trzy źródła indeksowanych stron. 1. Harvestery. Raczej poza zasięgiem repozytoriów. 2. Konta naukowców w Google Scholar. Zachęcać zainteresowanych deponujących.

42 1. Konstrukcja wyszukiwarki
Google Scholar ma trzy źródła indeksowanych stron. 1. Harvestery. Raczej poza zasięgiem repozytoriów. 2. Konta naukowców w Google Scholar. Zachęcać zainteresowanych deponujących. 3. Crawlery. Loteria. Można jednak zwiększyć szanse.

43 1. Konstrukcja wyszukiwarki
Specyfika Google Scholar.

44 1. Konstrukcja wyszukiwarki
Specyfika Google Scholar Indeksowanie artykułów, a nie stron internetowych.

45 1. Konstrukcja wyszukiwarki
Specyfika Google Scholar Indeksowanie artykułów, a nie stron internetowych. Wiąże się to z rozpoznawaniem zasobów naukowych.

46 1. Konstrukcja wyszukiwarki
Specyfika Google Scholar Indeksowanie artykułów, a nie stron internetowych. Wiąże się to z rozpoznawaniem zasobów naukowych. Ranking artykułów według ilości cytowań.

47 1. Konstrukcja wyszukiwarki
Specyfika Google Scholar Indeksowanie artykułów, a nie stron internetowych. Wiąże się to z rozpoznawaniem zasobów naukowych. Ranking artykułów według ilości cytowań. Prawie brak klasycznych problemów SEO

48 1. Konstrukcja wyszukiwarki
Specyfika Google Scholar Indeksowanie artykułów, a nie stron internetowych. Wiąże się to z rozpoznawaniem zasobów naukowych. Ranking artykułów według ilości cytowań. Prawie brak klasycznych problemów SEO Jakość deponowanych plików ma znaczenie

49 1. Konstrukcja wyszukiwarki
Specyfika Google jako całości Nastawienie na pozytywne doświadczenia użytkownika.

50 1. Konstrukcja wyszukiwarki
Specyfika Google jako całości Nastawienie na pozytywne doświadczenia użytkownika Scholar widzi więcej niż pokazuje w SERPach.

51 1. Konstrukcja wyszukiwarki
Specyfika Google jako całości Nastawienie na pozytywne doświadczenia użytkownika Scholar widzi więcej niż pokazuje w SERPach. Część linków odrzuca ze względu na spodziewane złe doświadczenia użytkownika, niespełnienie jego oczekiwań.

52 1. Konstrukcja wyszukiwarki
Specyfika Google Scholar jako części Google. Ograniczone zasoby crawlerów: czas i moc obliczeniowa.

53

54

55

56 2. Świat według crawlera Strona to tekst HTML.

57

58 2. Świat według crawlera Strona to tekst HTML.
Najważniejsze dla crawlera jest to, co nie wyświetla się jako tekst w przeglądarce: sekcja <head>, tagi <meta> itp.

59 2. Świat według crawlera GET, nie POST

60 2. Świat według crawlera GET, nie POST Bez formularzy.

61 2. Świat według crawlera GET, nie POST Bez formularzy. Bez logowania (nawet jako gość).

62 2. Świat według crawlera GET, nie POST Bez formularzy. Bez logowania (nawet jako gość). Browse (przeglądaj) zamiast Search (szukaj).

63 2. Świat według crawlera Gdzie crawler szuka danych?

64 2. Świat według crawlera Gdzie crawler szuka danych?

65 3. Kilka porad praktycznych

66 3. Kilka porad praktycznych
otwartanauka.pl Jak poprawić widoczność rekordów w Google Scholar?

67 3. Kilka porad praktycznych
otwartanauka.pl Jak poprawić widoczność rekordów w Google Scholar? D. Dapra, A. Acharya Indexing Repositories: Pitfalls and Best Practices.

68 3. Kilka porad praktycznych
robots.txt

69 3. Kilka porad praktycznych
robots.txt zazwyczaj tworzony rutynowo, więc łatwo o nim zapomnieć

70 3. Kilka porad praktycznych
robots.txt zazwyczaj tworzony rutynowo, więc łatwo o nim zapomnieć może całkowicie zablokować dostęp crawlerów do pewnych obszarów strony

71 3. Kilka porad praktycznych
robots.txt zazwyczaj tworzony rutynowo, więc łatwo o nim zapomnieć może całkowicie zablokować dostęp crawlerów do pewnych obszarów strony GS rekomenduje skasowanie wszystkich parametrów dissalow

72 3. Kilka porad praktycznych
Łatwy dostęp crawlera do artykułów.

73 3. Kilka porad praktycznych
Łatwy dostęp crawlera do artykułów. Odpowiedni kształt 'drzewa linków' w sekcji Browse.

74 3. Kilka porad praktycznych
Łatwy dostęp crawlera do artykułów. Odpowiedni kształt 'drzewa linków' w sekcji Browse. Za szerokie zbyt zwiększy losowość nawigacji.

75 3. Kilka porad praktycznych
Łatwy dostęp crawlera do artykułów. Odpowiedni kształt 'drzewa linków' w sekcji Browse. Za szerokie zbyt zwiększy losowość nawigacji. Za wysokie utrudni pracę crawlerom.

76 3. Kilka porad praktycznych
Łatwy dostęp crawlera do artykułów. Odpowiedni kształt 'drzewa linków' w sekcji Browse. Za szerokie zbyt zwiększy losowość nawigacji. Za wysokie utrudni pracę crawlerom. GS rekomenduje układ 'rok – miesiąc'.

77 3. Kilka porad praktycznych

78 3. Kilka porad praktycznych
Podsumowanie

79 3. Kilka porad praktycznych
Podsumowanie Konstrukcja wyszukiwarki internetowej.

80 3. Kilka porad praktycznych
Podsumowanie Konstrukcja wyszukiwarki internetowej. Warto zadbać o ogólną zgodność systemu repozytoryjnego z wytycznymi Google. (HTTPS, tagi <meta> w systemie Highwire lub podobnym, odpowiednie odpowiedzi HTTP)

81 3. Kilka porad praktycznych
Podsumowanie Konstrukcja wyszukiwarki internetowej. Każdy plik PDF powinien posiadać warstwę tekstową.

82 3. Kilka porad praktycznych
Podsumowanie Konstrukcja wyszukiwarki internetowej. Każdy plik PDF powinien posiadać warstwę tekstową. Oraz posiadać objętość nie większą niż 5MB.

83 3. Kilka porad praktycznych
Podsumowanie Konstrukcja wyszukiwarki internetowej. Każdy plik PDF powinien posiadać warstwę tekstową. Oraz posiadać objętość nie większą niż 5MB. Na początku pliku: tytuł i autor zgodne z metadanymi.

84 3. Kilka porad praktycznych
Podsumowanie Konstrukcja wyszukiwarki internetowej. Każdy plik PDF powinien posiadać warstwę tekstową. Oraz posiadać objętość nie większą niż 5MB. Na początku pliku: tytuł i autor zgodne z metadanymi. Na końcu pliku: bibliografia.

85 3. Kilka porad praktycznych
Podsumowanie Konstrukcja wyszukiwarki internetowej. Zasoby dostępne lokalnie.

86 3. Kilka porad praktycznych
Podsumowanie Konstrukcja wyszukiwarki internetowej. Zasoby dostępne lokalnie. Linków zewnętrznych GS nie bierze pod uwagę.

87 3. Kilka porad praktycznych
Podsumowanie Świat według crawlera.

88 3. Kilka porad praktycznych
Podsumowanie Świat według crawlera. Strona w całości nawigowalna dla crawlerów.

89 3. Kilka porad praktycznych
Podsumowanie Świat według crawlera. Strona w całości nawigowalna dla crawlerów. Jeśli dane są w rekordzie bibliograficznym, to jeszcze nie znaczy, że są też tam, gdzie będzie szukał crawler.

90 3. Kilka porad praktycznych
Podsumowanie Świat według crawlera. Javascript i POST wykluczone. Tylko GET.

91 3. Kilka porad praktycznych
Podsumowanie Świat według crawlera. Javascript i POST wykluczone. Tylko GET. GET rozpoznajemy po tym, że wszystko jest w URL.

92 3. Kilka porad praktycznych
Podsumowanie Świat według crawlera. Dostęp do zasobu powinien być bezpośredni.

93 3. Kilka porad praktycznych
Podsumowanie Świat według crawlera. Dostęp do zasobu powinien być bezpośredni. Wyskakujące okna, strony rejestracji / logowania, strony z regulaminem użytkowania, ankiety - to wszystko stanowić będzie przeszkodę.

94 Dziękuję za uwagę.


Pobierz ppt "Repozytoria instytucjonalne a wyszukiwarki akademickie"

Podobne prezentacje


Reklamy Google