Format MARC 21 dla rekordu UKD w Katalogu bibliotek publicznych Warszawy Ewa Florek
Baza UKD – kalendarium projektu Idea odpowiedników słownych do symboli UKD powstała pod koniec lat 90-tych 2001 r. do rekordu bibliograficznego wprowadzono pole 990 $a i $c 2003 r. projekt kartoteki wzorcowej UKD 2004 r. powstanie kartoteki UKD maj 2005 r. prezentacja kartoteki i bazy testowej przedstawicielom bibliotek sieci czerwiec 2005 r. pierwsza prezentacja bazy na warsztatach w Bibliotece Narodowej
Odpowiednik słowny do symbolu UKD Jest to opis klasy czyli fraza w brzmieniu najbardziej ogólnym odnosząca się do symbolu UKD W przypadku terminu wieloznacznego występuje konieczność opisu kontekstu Do jednego symbolu UKD może być przyjęty tylko jeden odpowiednik słowny Hasła indeksu przedmiotowego odpowiednikami słownymi w tym znaczeniu nie są i stanowić mogą jedynie dodatkowe punkty dostępu
UKD w wersji elektronicznej - pytania Jakie funkcje tematycznego wyszukiwania informacji muszą być wspierane: wyszukiwanie i przeglądanie, tylko przeglądanie, tylko wyszukiwanie? Czy UKD będzie używana samodzielnie, czy wraz z innym alfabetycznym systemem indeksowania? Czy istnieją plany, aby odsłonić rekordy kartoteki i zrobić z niej część jakiejś większej wielojęzycznej bramy informacyjnej? Czy istnieją plany wsparcia automatycznej klasyfikacji w przyszłości?
UKD w wersji elektronicznej - pytania Jakie są projekty struktury, zawartości i składni, które będą wspierać klasyfikację? Czy źródła metadanych są powiązane, czy niezależne? Które standardy / formaty metadanych będą nośnikiem indeksu UKD? Które elementy / pola są wspierane podczas korzystania z klasyfikacji? Jakie rodzaje formatów / kodowania są dostępne do przechowywania UKD?
UKD w wersji elektronicznej - pytania Jak polityka katalogowania / indeksowania i standardy metadanych mają traktować różne dane dotyczące: osób, wydarzeń, zasięgu, tematów? Czy będą one dystrybuowane w różnych polach / elementach? Jak pola mają być ustawione w rankingu i połączone z wyszukiwarką do formy indeksu w używanym do odpytywania oprogramowaniu, w którym wdrożono UKD?
UKD w wersji elektronicznej - pytania Czy dane tematyczne są wspierane przez kartotekę? Jaka jest architektura metadanych w relacji między opisem bibliograficznym dokumentu a kartoteką? Czy plik kartoteki będzie przechowywany na zewnątrz systemu i czy będzie wspólny dla różnych używanych w systemie funkcji, takich jak mapowanie i krzyżowanie kolekcji wyników wyszukiwań?
UKD – wymagania funkcjonalne i systemowe Są dwa sposoby stosowania UKD: przy użyciu tylko symboli prostych lub symboli połączonych traktowanych jak symbole proste za pomocą zapisu syntetycznego W zależności od zakresu i celu stosowania klasyfikacji, oba podejścia stwarzają problemy związane ze sposobem udostępniania danych oraz wykorzystania symboli w systemie wyszukiwania informacji.
UKD – wymagania funkcjonalne i systemowe Pierwszy zestaw problemów może być mniej lub bardziej złagodzony przez przygotowanie różnorodnych i bogatszych danych klasyfikacji, drugi polega na stworzeniu odpowiednich narzędzi do zarządzania i kontroli wykorzystania danych
UKD – implementacja z zapisem prostym Służy systematycznemu przeglądaniu Tekst zapisu składa się z cyfr i znaczącej interpunkcji po co trzeciej cyfrze Symbole są automatycznie prawidłowo złożone przez system komputerowy Zapis symboli wstępnie połączonych może prowadzić do zakłócenia porządku systematycznego Zapis symboli wstępnie połączonych umożliwia wyszukiwanie tylko po pierwszym elemencie notacji Wyszukiwanie wspierają odpowiedniki słowne
UKD – implementacja z zapisem prostym Problemy z wdrażaniem Konieczność stosowania kombinacji symboli w olbrzymich klasach np. 821 Literatura czy 94 Historia Symbole wchodzące w skład kombinacji powinny być oznaczone do automatycznego przetwarzania Prawostronne skracanie symbolu musi prowadzić do szerszego poziomu klasy (np. przypadek zakresu klas) Konieczność zachowania odpowiedniego porządku dodawanych symboli poddziałów wspólnych Powstałe ciągi porządkowane są inaczej niż proponuje system UKD
UKD – implementacja z zapisem prostym Zarządzanie klasyfikacją Interfejs użytkownika: prezentacja z odpowiednikami lub bez z zaznaczeniem hierarchii (wcięcie, inny znak) Kartoteka wspomagająca przeglądanie i wyszukiwanie: symboli klas razem z odpowiednikami terminów, które nie występują w opisie odsyłaczy „zob. też” określenie hierarchii w obsłudze odchyleń notacji wyświetlanie (nie przetwarzanie czy sortowanie) symboli złożonych
UKD – implementacja z zapisem syntetycznym Synteza zwiększa złożoność systemu klasyfikacji i wymaga wsparcia narzędziami zarządzania Schemat symboli połączonych przeznaczony do indeksowania to zorganizowany, uzgodniony schemat terminów indeksacji, który ma swoje słownictwo i składnię a znaczenie każdego elementu pozostaje takie samo na zewnątrz i wewnątrz kombinacji i może być wyszukiwany niezależnie od sposobu połączenia np. wynik wyboru (438) Polska pobierze wszystkie elementy związane z Polską bez względu na temat
UKD – implementacja z zapisem syntetycznym Są dwa wymagania dotyczące obsługi syntetycznej UKD: istnienie symboli złożonych wyszukiwanie każdego elementu, który jest wbudowany w połączone symbole klasyfikacji Zarządzanie UKD oznacza kontrolę nad indywidualnymi symbolami używanymi osobno lub wbudowanymi w symbole połączone. Kontrola ta powinna opierać się na formatowaniu danych tak, aby każdy element symbolu był rozpoznawany przez system bez względu na oznaczenia i wskaźniki używane do wyświetlania i niezależnie od jego miejsca w połączeniu
UKD – implementacja z zapisem syntetycznym Problemy z wdrażaniem Kluczowym znaczeniem dla funkcjonowania klasyfikacji jest łatwość użytkowania i zarządzania narzędziem indeksowania - plikiem zawierającym połączone symbole W zależności od polityki indeksowania i wdrażania, całkowita liczba połączonych symboli może wynosić od kilku do kilkuset tysięcy rekordów Dlatego system połączonych symboli UKD prowadzący do tworzenia nowych opisów pojęć, powinien być stopniowo budowany raczej we współpracy przez wielu implementujących
UKD – implementacja z zapisem syntetycznym Problemy z wdrażaniem Przeglądanie i wyszukiwanie - wymagania: wyszukiwanie symboli prostych z wszystkich symboli możliwość zapisu połączonych symboli UKD możliwość wyszukiwania przez skracanie symboli możliwość wyszukiwania oddzielnie każdego poddziału wspólnego możliwość wyszukiwania symboli znajdujących się w środku zakresu symboli Większość z tych problemów można rozwiązać, kiedy implementowana klasyfikacja jest zakodowana
UKD – implementacja z zapisem syntetycznym Zarządzanie klasyfikacją Można wybrać jedno z następujących podejść: dostarczanie zbudowanych i oddzielnie zapisanych elementów UKD dla opisów bibliograficznych utrzymywanie klasyfikacji jako osobnych danych z systemem linków do wyszukiwania informacji utrzymywanie obu – indeksu z rekordów bibliograficznych i kartoteki danych klasyfikacji Trzecie podejście jest najbardziej wydajne i niezawodne, gdyż symbole można odpowiednio przetwarzać i wymieniać
Znaczenie formatów danych Im wyższy poziom sformalizowania danych klasyfikacji, tym staje się ona potężniejsza, wykazuje mniejszą podatność na manipulację, ale wymaga więcej pośrednictwa od obsługującego ją człowieka oraz bardziej wyrafinowanych mechanizmów jej wdrażania i eksploatacji. Obecnie istniejące formaty danych i analizy struktury mogą pomóc w gromadzeniu informacji niezbędnych do stworzenia funkcjonalnej bazy danych, mogą utrzymywać funkcje kontroli przez kartotekę, konserwacji, wymiany danych, wyszukiwania informacji oraz odpowiednią funkcjonalność narzędzia.
Znaczenie formatów danych Formaty danych klasyfikacji: UKD MRF dostępne w pliku MRF Manual: nie ma w strukturze informacji na temat obchodzenia się z elementami połączonych notacji potrzebnych do pełnego zautomatyzowania UNIMARC Format danych klasyfikacji: w obsłudze symboli połączonych występowały problemy w przeszukiwaniu znaczeń odrębnych elementów i zarządzaniu globalnymi zmianami w elementach składowych
Znaczenie formatów danych Formaty danych klasyfikacji: MARC 21 Format dla klasyfikacji: opracowany w 1991 r. (i na bieżąco aktualizowany) przez Bibliotekę Kongresu, w celu zarządzania systemami klasyfikacji: Biblioteki Kongresu oraz Dewey’a. Obie klasyfikacje są numeryczne, a nie syntetyczne, więc format może nie do końca odpowiadać na przedstawione potrzeby. Jednak można tu wprowadzić takie dane jak: odpowiednik, uwagi, instrukcje, przykłady, oznaczyć hierarchię, strukturę indeksu terminów, odsyłacze itp.
MARC 21 dla danych klasyfikacji Rekord MARC 21 składa się z trzech elementów: struktury rekordu, która jest implementacją międzynarodowego standardu Format wymiany informacji (ISO 2709) i jego amerykańskiego odpowiednika Bibliograficzna wymiana informacji (ANSI / NISO Z39.2) oznaczenia zawartości – kodów i konwencji identyfikujących i charakteryzujących elementy danych rekordu treści elementów danych określone przez standardy spoza formatów np. schemat klasyfikacji
MARC 21 dla danych klasyfikacji ZAKRES FORMATU KLASYFIKACJI Format MARC 21 dla danych klasyfikacji jest nośnikiem informacji o symbolach klasyfikacji i związanych z nimi odpowiednikami słownymi. Źródłem informacji jest schemat klasyfikacji określony w polu 084 (schemat klasyfikacji i wydanie), podpolu $a (kod schematu klasyfikacji).
MARC 21 dla danych klasyfikacji Rodzaje rekordów klasyfikacji Rekordy klasyfikacji różnią się od innych typów rekordów MARC kodem <w> (dane klasyfikacji) w polu Leader/06 (typ rekordu). Pole 008/06 (rodzaj rekordu) określa: rekord poddziału wspólnego – pole 153 zawiera symbol lub zakres z tablic poddziałów wspólnych – kod <a> rekord tablic głównych – pole 153 zawiera symbol lub zakres z tablic głównych - kod <b> rekord indeksu terminów – pole 154 zawiera termin reprezentujący koncept i nie związany z symbolem lub zakresem – kod <c>
MARC 21 dla danych klasyfikacji Rodzaje symboli Symbole klasyfikacji wraz z odpowiednikami mogą pojawić się w polach 153, 453, 553. Pole 008/07 (typ symbolu klasyfikacji) określa: symbol pojedynczy – symbol lub początek zakresu w powtarzalnym $a zdefiniowany zakres symboli – określona w tablicach rozpiętość symboli od początkowego z $a, do końcowego z $c sumaryczny zakres symboli – pojedyncze symbole określone są we własnych rekordach, a odpowiednik z $j podsumowuje temat
MARC 21 dla danych klasyfikacji Wykorzystanie symboli w rekordach bibliograficznych i kartoteki Pole 080 rekordu bibliograficznego zawiera symbol UKD. Symbol klasyfikacji może być: ważny – stosowany w rekordzie bibliograficznym, kartotece lub do tworzenia symboli połączonych częściowo ważny – w przypadku zakresu symboli, gdy tylko jeden jest ważny i tylko on może być stosowany nieważny – symbol nie może być stosowany, ale tworzy się rekord, ponieważ wymagany jest bardziej szczegółowy odsyłacz niż z pola 453
MARC 21 dla danych klasyfikacji Wymagane pola danych klasyfikacji Rekord danych klasyfikacji powinien zawierać co najmniej następujące pola: 008 – dane kontrolne 084 – schemat klasyfikacji i wydanie 153 – symbol klasyfikacji lub 154 – ogólny wyjaśniający indeks terminów
MARC 21 dla danych klasyfikacji ELEMENTY REKORDÓW KLASYFIKACJI Rekord klasyfikacji składa się z 3 głównych komponentów: Leader – pozycjonowane liczby lub wartości kodów dostarczające informacji do przetwarzania rekordu Directory – tablica adresów zawierająca etykiety, długość i położenie każdej zmiennej wyjściowej w rekordzie Pola danych – dane w rekordzie zorganizowane w polach identyfikowanych 3-numeryczną etykietą
MARC 21 dla danych klasyfikacji Typy pól danych: pola kontrolne – pola 00X zawierające numer kontrolny i zakodowane informacje do przetwarzania rekordów. Nie mają wskaźników ani kodów podpól pola danych zmiennej długości – pozostałe pola zdefiniowane w formacie. Identyfikowane są przez etykietę i zawierają dwa wskaźniki pozycji oraz kod podpola poprzedzający każdy element danych
MARC 21 dla danych klasyfikacji Bloki pól danych (według pierwszego znaku etykiety): 0XX – informacje kontrolne, numery, kody 1XX – symbole klasyfikacji i odpowiedniki 2XX – odsyłacze „zob.” 3XX – odsyłacze „zob. też” 4XX – tropy symboli odrzuconych 5XX – tropy symboli ważnych 6XX – pola uwag 70X -75X – dodatkowe punkty dostępu 76X – pola symboli zbudowanych
MARC 21 dla danych klasyfikacji Pola symboli klasyfikacji, odsyłaczy i tropów (153, 253, 353, 453, 553) mają takie same dwa ostatnie znaki etykiety. Wskaźnik pozycji – dwa pierwsze znaki w polach danych, zawiera wartości interpretujące lub uzupełniające dane. Kody podpól – wyróżniają elementy danych w polu wymagające osobnej manipulacji.
MARC 21 dla danych klasyfikacji Stałe wyświetlania są konwencją wyświetlania pojęć, wyrażeń, odstępów, znaków interpunkcyjnych, która może być generowana przez system w określonym porządku w celu wizualnej prezentacji danych najbardziej przemawiającej do użytkownika. Do tego wykorzystywane mogą być niektóre etykiety pól, kody podpól, wartości wskaźników oraz wartości kodów. Stosowanie stałych wyświetlania jest określane przez każdą organizację lub system.
DZIĘKUJĘ ZA UWAGĘ Bibliografia SLAVIC, A. UDC implementation: from library shelves to a structured indexing language. [on-line]. [dostęp 21 kwietnia 2010]. Dostępny w World Wide Web: http://archive.ifla.org/IV/ifla69/papers/032e-Slavic.pdf MARC 21 Format for Classfication Data. [on-line]. [dostęp 15 stycznia 2010]. Dostępny w World Wide Web: http://www.loc.gov/marc/classification/eccdhome.html DZIĘKUJĘ ZA UWAGĘ