Magdalena Rowińska Centrum NUKAT NUKAT - Autostrada Informacji Cyfrowej: rola standardów w tworzeniu katalogów bibliotecznych Magdalena Rowińska Centrum NUKAT X Ogólnopolska Konferencja z cyklu „Automatyzacja Bibliotek Publicznych” pt. „Modele współpracy bibliotek publicznych – czy razem możemy więcej, szybciej, lepiej?”
2002- 2012 2 377 192 rekordów bibliograficznych 0 symboli lokalizacji 2 377 192 rekordów bibliograficznych 8 201 521 symboli lokalizacji
NUKAT – Autostrada Informacji Cyfrowej jest projektem realizowanym przez Bibliotekę Uniwersytecką w Warszawie w latach 2009-2013. Wartość projektu to 9 724 313,40 zł. Projekt jest finansowany z Programu Operacyjnego Innowacyjna Gospodarka. Ma na celu rozbudowę i modernizację wytypowanych narzędzi informacyjnych: katalogu NUKAT katalogu rozproszonego KaRo katalogu online bibliotek Uniwersytetu Warszawskiego biblioteki cyfrowej e-bUW
NUKAT – Autostrada Informacji Cyfrowej – scalanie danych W fazie pisania założeń projektu wytypowanych zostało 30 bibliotek, których katalogi będą scalane. Wybór bibliotek był niezwykle istotny, musiały to być biblioteki, których katalogi są tworzone wg określonych zasad oraz wykorzystujące Centralną Kartotekę Haseł Wzorcowych NUKAT. Większość działań przeprowadzanych jest automatycznie. W wyniku automatycznego porównania danych otrzymujemy: rekordy, które mają swoje odpowiedniki w katalogu NUKAT rekordy oryginalne, których w NUKAT nie ma rekordy do dalszej oceny przez administratorów i/lub bibliotekarzy uczestniczących w scalaniu.
Scalanie danych zostało podzielone na kilka etapów: Etap wstępny – testowe przekazanie rekordów przez bibliotekę i sprawdzenie ich poprawności przez Centrum NUKAT. Etap I – podmiana rekordów w katalogu lokalnym na rekordy z katalogu NUKAT. Etap II – scalanie właściwe. Etap III – prace administratorów Centrum NUKAT. Etap IV – ręczne scalanie przez bibliotekarzy z danej biblioteki.
Aby prowadzić automatyczne działania na puli rekordów, niezwykle ważne jest dokładne wytypowanie elementów obowiązkowych w tychże rekordach. Priorytetem działań jest całkowita ochrona danych w katalogu centralnym oraz w katalogach lokalnych. Odrzucono rekordy, których porównywanie automatyczne dawałoby niepewne, niejednoznaczne wyniki.
Kryteria wyboru/standardy Format MARC21 Centralna Kartoteka Haseł Wzorcowych Zawartość rekordu bibliograficznego oraz zasady katalogowania - dokumenty zwarte piśmiennicze - pewna data wydania - unikatowy dla bazy lokalnej numer systemowy - ISBN - dokumenty wielotomowe - pola obowiązkowe Zestaw znaków
Format MARC (MAchine-Readable Cataloging) – przeznaczony jest do zapisu i wymiany danych. Dane zapisane w formacie są odpowiednio uporządkowane, ujednolicone i oznaczone, dzięki czemu są czytelne dla komputera. Format MARC21 jest formatem wymiennym, o oznacza, że umożliwia prawidłową wymianę danych pomiędzy różnymi systemami. Ponadto niezwykle ważna jest prawidłowa obsługa formatu przez system biblioteczny stosowany w danej bibliotece. System musi umożliwiać: - import danych w formacie MARC, - eksport danych w formacie MARC, - prawidłową interpretację danych i obsługę powiązań
Centralna Kartoteka Haseł Wzorcowych Kartoteka haseł wzorcowych służy kontroli poprawności haseł zastosowanych w rekordach bibliograficznych, gwarantuje spójność danych. Kartoteki wzorcowe wykorzystywane są przy wprowadzaniu danych do bazy oraz przy wyszukiwaniu. Tworzy się je dla elementów stanowiących podstawowe czynniki wyszukiwania, tj. nazwy osobowe i ciał zbiorowych, tytuły ujednolicone, tytuły serii wydawniczych, hasła przedmiotowe.
Zestaw znaków - zgodność z zestawem znaków UTF-8 Dokumenty zwarte piśmiennicze LDR/06 – a (dokument piśmienniczy) LDR/07 – m (poziom monograficzny) Pewna data wydania 008/06 – s 008/07-10 – data wydania Unikatowy dla bazy lokalnej numer systemowy - jednoznaczna identyfikacja rekordu w katalogu biblioteki
ISBN - międzynarodowy znormalizowany numer książki Rekordy zakwalifikowane do automatycznego scalania muszą zawierać przynajmniej jedno pole 020, w którym prawidłowo został podany ISBN - w podpolu $a numer musi być poprawny, a w podpolu $z błędny. ISBN w powiązaniu z innymi elementami – data, tytuł, oznaczenie wydania (lub jego brak) – jest elementem, który pozwala na jednoznaczne scalenie dokumentów, bądź uznanie rekordu za rekord oryginalny.
Dokumenty wielotomowe Z automatycznego scalania wyeliminowano rekordy dla dokumentów wielotomowych z hierarchiczną budową tytułu właściwego – 245 $n i/lub $p. Powód: jednolitość przyjętej zasady opracowania, którą trudno byłoby zachować przy scalaniu automatycznym.
Pola obowiązkowe Oprócz pola 020 w scalanych rekordach muszą znaleźć się obowiązkowe i niepowtarzalne pola: - 040 – instytucja sporządzająca opis, - 245 – strefa tytułu i oznaczenia odpowiedzialności, - 260 – strefa adresu wydawniczego, - 300 – strefa opisu fizycznego.
unikatowy dla bazy lokalnej numer systemowy Pole/podpole Powtarzalność Wartość Inne warunki Kontrolowane khw Obowiązkowe Etykieta/06 NP a NIE TAK Etykieta/07 m 008/06 s 008/07-10 1900<x<2010 001 unikatowy dla bazy lokalnej numer systemowy 020 P $a prawidłowy ISBN $z nieprawidłowy ISBN 035 prefiks różny od xx lub zz 040 245 $n – brak $p - brak 260 300 i/lub 256
Prace dodatkowe Rekordy scalane automatycznie kontrolowane były m. in Prace dodatkowe Rekordy scalane automatycznie kontrolowane były m.in. pod kątem: - obecności pola 240 w rekordzie z katalogu lokalnego, gdy w rekordzie w NUKAT tego pola nie było (konieczne dodanie pola 240 do rekordu w NUKAT) - rozbieżności w podpolach $b pól 245 – podtytułu, dodatku do tytułu (przy scalaniu automatycznym tytuły właściwe musiały być identyczne, był to warunek konieczny scalania) - rozbieżności w liczbowaniu stronic W rekordach przejętych jako oryginalne sprawdzano: - kodowanie (zgodność z zestawem znaków UTF-8) - komunikaty o hasłach niepermanentnych.
Dane z sierpnia 2012 roku przedstawiają następujące wyniki prowadzonych prac: 2 270 496 – ogólna liczba rekordów weryfikowanych, 964 819 – dodanych symboli lokalizacji do rekordów bibliograficznych w NUKAT, 261 671 – nowych rekordów wprowadzonych do NUKAT, 1 226 490 – łączna liczba rekordów scalonych = wzrost centralnej informacji o zbiorach polskich bibliotek, 198 201 – rekordów zweryfikowanych przez administratorów NUKAT, 31 408 – rekordów bibliograficznych uzupełnionych hasłami przedmiotowymi.
Stosowanie standardów przy budowaniu katalogu bibliotecznego gwarantuje nie tylko dobry dostęp do informacji, co jest priorytetem każdej biblioteki, ale jest również działaniem ekonomicznym, gdyż od razu tworzy się wysoką jakość i nie ma potrzeby prowadzenia prac dodatkowych. Stosowanie standardów w tworzeniu katalogów bibliotecznych umożliwia współpracę oraz przeprowadzanie trudnych, nietypowych działań, takich jak wymiana danych, zmiana systemu. Standardy zapewniają bezpieczną przyszłość.
Dziękuję za uwagę! Magdalena Rowińska Centrum NUKAT m.rowinska@uw.edu.pl