Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
1
Format MARC 21 dla rekordu UKD
w Katalogu bibliotek publicznych Warszawy Ewa Florek
2
Baza UKD – kalendarium projektu
Idea odpowiedników słownych do symboli UKD powstała pod koniec lat 90-tych 2001 r. do rekordu bibliograficznego wprowadzono pole 990 $a i $c 2003 r. projekt kartoteki wzorcowej UKD 2004 r. powstanie kartoteki UKD maj 2005 r. prezentacja kartoteki i bazy testowej przedstawicielom bibliotek sieci czerwiec 2005 r. pierwsza prezentacja bazy na warsztatach w Bibliotece Narodowej
3
Odpowiednik słowny do symbolu UKD
Jest to opis klasy czyli fraza w brzmieniu najbardziej ogólnym odnosząca się do symbolu UKD W przypadku terminu wieloznacznego występuje konieczność opisu kontekstu Do jednego symbolu UKD może być przyjęty tylko jeden odpowiednik słowny Hasła indeksu przedmiotowego odpowiednikami słownymi w tym znaczeniu nie są i stanowić mogą jedynie dodatkowe punkty dostępu
4
UKD w wersji elektronicznej - pytania
Jakie funkcje tematycznego wyszukiwania informacji muszą być wspierane: wyszukiwanie i przeglądanie, tylko przeglądanie, tylko wyszukiwanie? Czy UKD będzie używana samodzielnie, czy wraz z innym alfabetycznym systemem indeksowania? Czy istnieją plany, aby odsłonić rekordy kartoteki i zrobić z niej część jakiejś większej wielojęzycznej bramy informacyjnej? Czy istnieją plany wsparcia automatycznej klasyfikacji w przyszłości?
5
UKD w wersji elektronicznej - pytania
Jakie są projekty struktury, zawartości i składni, które będą wspierać klasyfikację? Czy źródła metadanych są powiązane, czy niezależne? Które standardy / formaty metadanych będą nośnikiem indeksu UKD? Które elementy / pola są wspierane podczas korzystania z klasyfikacji? Jakie rodzaje formatów / kodowania są dostępne do przechowywania UKD?
6
UKD w wersji elektronicznej - pytania
Jak polityka katalogowania / indeksowania i standardy metadanych mają traktować różne dane dotyczące: osób, wydarzeń, zasięgu, tematów? Czy będą one dystrybuowane w różnych polach / elementach? Jak pola mają być ustawione w rankingu i połączone z wyszukiwarką do formy indeksu w używanym do odpytywania oprogramowaniu, w którym wdrożono UKD?
7
UKD w wersji elektronicznej - pytania
Czy dane tematyczne są wspierane przez kartotekę? Jaka jest architektura metadanych w relacji między opisem bibliograficznym dokumentu a kartoteką? Czy plik kartoteki będzie przechowywany na zewnątrz systemu i czy będzie wspólny dla różnych używanych w systemie funkcji, takich jak mapowanie i krzyżowanie kolekcji wyników wyszukiwań?
8
UKD – wymagania funkcjonalne i systemowe
Są dwa sposoby stosowania UKD: przy użyciu tylko symboli prostych lub symboli połączonych traktowanych jak symbole proste za pomocą zapisu syntetycznego W zależności od zakresu i celu stosowania klasyfikacji, oba podejścia stwarzają problemy związane ze sposobem udostępniania danych oraz wykorzystania symboli w systemie wyszukiwania informacji.
9
UKD – wymagania funkcjonalne i systemowe
Pierwszy zestaw problemów może być mniej lub bardziej złagodzony przez przygotowanie różnorodnych i bogatszych danych klasyfikacji, drugi polega na stworzeniu odpowiednich narzędzi do zarządzania i kontroli wykorzystania danych
10
UKD – implementacja z zapisem prostym
Służy systematycznemu przeglądaniu Tekst zapisu składa się z cyfr i znaczącej interpunkcji po co trzeciej cyfrze Symbole są automatycznie prawidłowo złożone przez system komputerowy Zapis symboli wstępnie połączonych może prowadzić do zakłócenia porządku systematycznego Zapis symboli wstępnie połączonych umożliwia wyszukiwanie tylko po pierwszym elemencie notacji Wyszukiwanie wspierają odpowiedniki słowne
11
UKD – implementacja z zapisem prostym
Problemy z wdrażaniem Konieczność stosowania kombinacji symboli w olbrzymich klasach np. 821 Literatura czy 94 Historia Symbole wchodzące w skład kombinacji powinny być oznaczone do automatycznego przetwarzania Prawostronne skracanie symbolu musi prowadzić do szerszego poziomu klasy (np. przypadek zakresu klas) Konieczność zachowania odpowiedniego porządku dodawanych symboli poddziałów wspólnych Powstałe ciągi porządkowane są inaczej niż proponuje system UKD
12
UKD – implementacja z zapisem prostym
Zarządzanie klasyfikacją Interfejs użytkownika: prezentacja z odpowiednikami lub bez z zaznaczeniem hierarchii (wcięcie, inny znak) Kartoteka wspomagająca przeglądanie i wyszukiwanie: symboli klas razem z odpowiednikami terminów, które nie występują w opisie odsyłaczy „zob. też” określenie hierarchii w obsłudze odchyleń notacji wyświetlanie (nie przetwarzanie czy sortowanie) symboli złożonych
13
UKD – implementacja z zapisem syntetycznym
Synteza zwiększa złożoność systemu klasyfikacji i wymaga wsparcia narzędziami zarządzania Schemat symboli połączonych przeznaczony do indeksowania to zorganizowany, uzgodniony schemat terminów indeksacji, który ma swoje słownictwo i składnię a znaczenie każdego elementu pozostaje takie samo na zewnątrz i wewnątrz kombinacji i może być wyszukiwany niezależnie od sposobu połączenia np. wynik wyboru (438) Polska pobierze wszystkie elementy związane z Polską bez względu na temat
14
UKD – implementacja z zapisem syntetycznym
Są dwa wymagania dotyczące obsługi syntetycznej UKD: istnienie symboli złożonych wyszukiwanie każdego elementu, który jest wbudowany w połączone symbole klasyfikacji Zarządzanie UKD oznacza kontrolę nad indywidualnymi symbolami używanymi osobno lub wbudowanymi w symbole połączone. Kontrola ta powinna opierać się na formatowaniu danych tak, aby każdy element symbolu był rozpoznawany przez system bez względu na oznaczenia i wskaźniki używane do wyświetlania i niezależnie od jego miejsca w połączeniu
15
UKD – implementacja z zapisem syntetycznym
Problemy z wdrażaniem Kluczowym znaczeniem dla funkcjonowania klasyfikacji jest łatwość użytkowania i zarządzania narzędziem indeksowania - plikiem zawierającym połączone symbole W zależności od polityki indeksowania i wdrażania, całkowita liczba połączonych symboli może wynosić od kilku do kilkuset tysięcy rekordów Dlatego system połączonych symboli UKD prowadzący do tworzenia nowych opisów pojęć, powinien być stopniowo budowany raczej we współpracy przez wielu implementujących
16
UKD – implementacja z zapisem syntetycznym
Problemy z wdrażaniem Przeglądanie i wyszukiwanie - wymagania: wyszukiwanie symboli prostych z wszystkich symboli możliwość zapisu połączonych symboli UKD możliwość wyszukiwania przez skracanie symboli możliwość wyszukiwania oddzielnie każdego poddziału wspólnego możliwość wyszukiwania symboli znajdujących się w środku zakresu symboli Większość z tych problemów można rozwiązać, kiedy implementowana klasyfikacja jest zakodowana
17
UKD – implementacja z zapisem syntetycznym
Zarządzanie klasyfikacją Można wybrać jedno z następujących podejść: dostarczanie zbudowanych i oddzielnie zapisanych elementów UKD dla opisów bibliograficznych utrzymywanie klasyfikacji jako osobnych danych z systemem linków do wyszukiwania informacji utrzymywanie obu – indeksu z rekordów bibliograficznych i kartoteki danych klasyfikacji Trzecie podejście jest najbardziej wydajne i niezawodne, gdyż symbole można odpowiednio przetwarzać i wymieniać
18
Znaczenie formatów danych
Im wyższy poziom sformalizowania danych klasyfikacji, tym staje się ona potężniejsza, wykazuje mniejszą podatność na manipulację, ale wymaga więcej pośrednictwa od obsługującego ją człowieka oraz bardziej wyrafinowanych mechanizmów jej wdrażania i eksploatacji. Obecnie istniejące formaty danych i analizy struktury mogą pomóc w gromadzeniu informacji niezbędnych do stworzenia funkcjonalnej bazy danych, mogą utrzymywać funkcje kontroli przez kartotekę, konserwacji, wymiany danych, wyszukiwania informacji oraz odpowiednią funkcjonalność narzędzia.
19
Znaczenie formatów danych
Formaty danych klasyfikacji: UKD MRF dostępne w pliku MRF Manual: nie ma w strukturze informacji na temat obchodzenia się z elementami połączonych notacji potrzebnych do pełnego zautomatyzowania UNIMARC Format danych klasyfikacji: w obsłudze symboli połączonych występowały problemy w przeszukiwaniu znaczeń odrębnych elementów i zarządzaniu globalnymi zmianami w elementach składowych
20
Znaczenie formatów danych
Formaty danych klasyfikacji: MARC 21 Format dla klasyfikacji: opracowany w 1991 r. (i na bieżąco aktualizowany) przez Bibliotekę Kongresu, w celu zarządzania systemami klasyfikacji: Biblioteki Kongresu oraz Dewey’a. Obie klasyfikacje są numeryczne, a nie syntetyczne, więc format może nie do końca odpowiadać na przedstawione potrzeby. Jednak można tu wprowadzić takie dane jak: odpowiednik, uwagi, instrukcje, przykłady, oznaczyć hierarchię, strukturę indeksu terminów, odsyłacze itp.
21
MARC 21 dla danych klasyfikacji
Rekord MARC 21 składa się z trzech elementów: struktury rekordu, która jest implementacją międzynarodowego standardu Format wymiany informacji (ISO 2709) i jego amerykańskiego odpowiednika Bibliograficzna wymiana informacji (ANSI / NISO Z39.2) oznaczenia zawartości – kodów i konwencji identyfikujących i charakteryzujących elementy danych rekordu treści elementów danych określone przez standardy spoza formatów np. schemat klasyfikacji
22
MARC 21 dla danych klasyfikacji
ZAKRES FORMATU KLASYFIKACJI Format MARC 21 dla danych klasyfikacji jest nośnikiem informacji o symbolach klasyfikacji i związanych z nimi odpowiednikami słownymi. Źródłem informacji jest schemat klasyfikacji określony w polu 084 (schemat klasyfikacji i wydanie), podpolu $a (kod schematu klasyfikacji).
23
MARC 21 dla danych klasyfikacji
Rodzaje rekordów klasyfikacji Rekordy klasyfikacji różnią się od innych typów rekordów MARC kodem <w> (dane klasyfikacji) w polu Leader/06 (typ rekordu). Pole 008/06 (rodzaj rekordu) określa: rekord poddziału wspólnego – pole 153 zawiera symbol lub zakres z tablic poddziałów wspólnych – kod <a> rekord tablic głównych – pole 153 zawiera symbol lub zakres z tablic głównych - kod <b> rekord indeksu terminów – pole 154 zawiera termin reprezentujący koncept i nie związany z symbolem lub zakresem – kod <c>
24
MARC 21 dla danych klasyfikacji
Rodzaje symboli Symbole klasyfikacji wraz z odpowiednikami mogą pojawić się w polach 153, 453, 553. Pole 008/07 (typ symbolu klasyfikacji) określa: symbol pojedynczy – symbol lub początek zakresu w powtarzalnym $a zdefiniowany zakres symboli – określona w tablicach rozpiętość symboli od początkowego z $a, do końcowego z $c sumaryczny zakres symboli – pojedyncze symbole określone są we własnych rekordach, a odpowiednik z $j podsumowuje temat
25
MARC 21 dla danych klasyfikacji
Wykorzystanie symboli w rekordach bibliograficznych i kartoteki Pole 080 rekordu bibliograficznego zawiera symbol UKD. Symbol klasyfikacji może być: ważny – stosowany w rekordzie bibliograficznym, kartotece lub do tworzenia symboli połączonych częściowo ważny – w przypadku zakresu symboli, gdy tylko jeden jest ważny i tylko on może być stosowany nieważny – symbol nie może być stosowany, ale tworzy się rekord, ponieważ wymagany jest bardziej szczegółowy odsyłacz niż z pola 453
26
MARC 21 dla danych klasyfikacji
Wymagane pola danych klasyfikacji Rekord danych klasyfikacji powinien zawierać co najmniej następujące pola: 008 – dane kontrolne 084 – schemat klasyfikacji i wydanie 153 – symbol klasyfikacji lub 154 – ogólny wyjaśniający indeks terminów
27
MARC 21 dla danych klasyfikacji
ELEMENTY REKORDÓW KLASYFIKACJI Rekord klasyfikacji składa się z 3 głównych komponentów: Leader – pozycjonowane liczby lub wartości kodów dostarczające informacji do przetwarzania rekordu Directory – tablica adresów zawierająca etykiety, długość i położenie każdej zmiennej wyjściowej w rekordzie Pola danych – dane w rekordzie zorganizowane w polach identyfikowanych 3-numeryczną etykietą
28
MARC 21 dla danych klasyfikacji
Typy pól danych: pola kontrolne – pola 00X zawierające numer kontrolny i zakodowane informacje do przetwarzania rekordów. Nie mają wskaźników ani kodów podpól pola danych zmiennej długości – pozostałe pola zdefiniowane w formacie. Identyfikowane są przez etykietę i zawierają dwa wskaźniki pozycji oraz kod podpola poprzedzający każdy element danych
29
MARC 21 dla danych klasyfikacji
Bloki pól danych (według pierwszego znaku etykiety): 0XX – informacje kontrolne, numery, kody 1XX – symbole klasyfikacji i odpowiedniki 2XX – odsyłacze „zob.” 3XX – odsyłacze „zob. też” 4XX – tropy symboli odrzuconych 5XX – tropy symboli ważnych 6XX – pola uwag 70X -75X – dodatkowe punkty dostępu 76X – pola symboli zbudowanych
30
MARC 21 dla danych klasyfikacji
Pola symboli klasyfikacji, odsyłaczy i tropów (153, 253, 353, 453, 553) mają takie same dwa ostatnie znaki etykiety. Wskaźnik pozycji – dwa pierwsze znaki w polach danych, zawiera wartości interpretujące lub uzupełniające dane. Kody podpól – wyróżniają elementy danych w polu wymagające osobnej manipulacji.
31
MARC 21 dla danych klasyfikacji
Stałe wyświetlania są konwencją wyświetlania pojęć, wyrażeń, odstępów, znaków interpunkcyjnych, która może być generowana przez system w określonym porządku w celu wizualnej prezentacji danych najbardziej przemawiającej do użytkownika. Do tego wykorzystywane mogą być niektóre etykiety pól, kody podpól, wartości wskaźników oraz wartości kodów. Stosowanie stałych wyświetlania jest określane przez każdą organizację lub system.
32
DZIĘKUJĘ ZA UWAGĘ Bibliografia
SLAVIC, A. UDC implementation: from library shelves to a structured indexing language. [on-line]. [dostęp 21 kwietnia 2010]. Dostępny w World Wide Web: MARC 21 Format for Classfication Data. [on-line]. [dostęp 15 stycznia 2010]. Dostępny w World Wide Web: DZIĘKUJĘ ZA UWAGĘ
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.