Od MARC-a do TEI-a Praktyczne znaczenie formalizowanego opisu maszynowego.

Slides:



Advertisements
Podobne prezentacje
Tytuł prezentacji NUKAT wobec nowych trendów w katalogowaniu
Advertisements

Gambit Centrum Oprogramowania i Szkoleń Sp. z o.o Kraków, al.Pokoju 29B/ Autoryzowany dystrybutor Thomson-Reuters.
Rafał Hryniów Tomasz Pieciukiewicz
BIBLIOGRAFIA ZAŁACZNIKOWA I MATERIAŁY ŹRÓDŁOWE do prezentacji pt.
Własność intelektualna w teorii i praktyce bibliotek cyfrowych
Prezentacja Organizacja informacji o zasobach w katalogu komputerowym
Opis metodyki i procesu produkcji oprogramowania
Zmiany w Sprawozdaniu z działalności BW w roku 2011 Artur Wrzochalski BUW, r.
Publiczna Biblioteka Pedagogiczna w Poznaniu Filia w Swarzędzu
Wikiźródła – oddolna cyfryzacja
Budowa i funkcje elektronicznego katalogu biblioteki szkolnej
Magdalena Rowińska Centrum NUKAT
Katalog komputerowy WebPac
Opracowanie katalogowe gazet w Bibliotece Narodowej
Wyszukiwanie informacji
0 BIBLIOTEKI XXI WIEKU. CZY PRZETRWAMY? Ogólnopolska konferencja bibliotekarzy Łódź, czerwca 2006.
Autor: Artur Lewandowski Promotor: mgr inż. Dariusz Olczyk
Repozytorium egzemplarza obowiązkowego publikacji elektronicznej
dLibra – Środowisko dla Biblioteki Cyfrowej
Przykład wykorzystania komercyjnych i niekomercyjnych źródeł informacji w pracy Biblioteki Chemicznej ZUT Agnieszka Bajda
Źródła informacji z zakresu nauk przyrodniczych
Bibliotekarz – odkrywca. Agenda Proces tworzenia informacji Indeksy wyszukiwawcze Budowa rekordu w Promaxie Zapytania.
WARSZTAT INFORMACYJNY BIBLIOTEKI
PRZYPISY BIBLIOGRAFICZNE
II Spotkanie Polskiej Grupy Użytkowników VTLS Virtua 16 – 17 czerwca 2008, Biblioteka Uniwersytecka w Warszawie Magdalena Rowińska Centrum NUKAT
STANDARDY BIBLIOGRAFICZNE Biblioteka Narodowa SEKCJA BIBLIOGRAFII IFLA Grażyna Jaroszewicz.
BIBLIOGRAFIA Opis bibliograficzny książki Bibliografia załącznikowa
PRACA BIBLIOTEKARZA W ZESPOLE SZKÓŁ SZPITALNYCH
Biblioteka Centrum Myśli Jana Pawła II Biblioteka jest instytucją, która samym swoim istnieniem świadczy o rozwoju kultury. Jest ona bowiem skarbnicą piśmiennictwa,
Graniastosłupy proste i nie tylko
Magdalena Rowińska Centrum NUKAT
Materiał do badań : Uniwersytet Rzeszowski semestr 2005/ kierunki studiów : filologia polska, historia, matematyka - II i IV rok 143 studentów i.
Zbiory biblioteczne W bibliotekach gromadzone są różnorodne zbiory, między innymi: książki, filmy na kasetach VHS oraz DVD, różne programy multimedialne,
Opracowanie zbiorów i normalizacja
BIBLIOTEKA WYŻSZEJ SZKOŁY ADMINISTRACJI I BIZNESU INSTRUKCJA KORZYSTANIA Z KATALOGU ON-LINE.
Wanda Klenczon Biblioteka Narodowa
Agenda Co to jest Scopus ? Author Identifier SCOPUS i scientometria.
Katalogi biblioteczne informacją o zbiorach
JAK SZUKAĆ W KATALOGU KOMPUTEROWYM?
XML – eXtensible Markup Language
Wiek kultury cyfrowej dla nauki w Europie
Model i etapy tworzenia repozytorium instytucjonalnego na podstawie badań własnych i doświadczeń bibliotek zagranicznych Emilia Karwasińska, Małgorzata.
Następna strona Czyli: gdzie, co, jak i dlaczego?
KATALOGI BIBLIOTECZNE
Przysposobienie biblioteczne i informacyjne
Urszula Sasimowicz-Andrzejewska
Tworzenie stron internetowych www World Wide Web
Droga poszukiwań informacji na dany temat oprac. M. Tofil Napisanie referatu, przygotowanie maturalnej prezentacji, wymaga zgromadzenia odpowiedniej ilości.
Opracowała: Edyta Guznowska – nauczyciel-bibliotekarz
Ujarzmić Worda Agnieszka Terebus.
Wprowadzenie do HTML Informatyka Cele lekcji: Wiadomości:
Andrzej Padziński BG UP Lublin
Mariola Augustyniak Biblioteka Uniwersytetu Łódzkiego
Gramatyki Lindenmayera
Konsorcja a polityka gromadzenia czasopism w bibliotekach Jolanta Stępniak Biblioteka Uniwersytecka w Warszawie.
XML w przykładach mgr inż. Marek Malinowski Zespół Matematyki i Fizyki Wydz. BMiP PW Płock.
ZASADY KORZYSTANIA Z KATALOGU BIBLIOTECZNEGO
1 IPS Sp. z o.o. zaprasza na prezentację programów umożliwiających administrowanie prenumeratą czasopism.
Zasady korzystania z Internetu
Nowoczesna Biblioteka Akademicka The Association of College and Research Libraries “GUIDELINES FOR DISTANCE LEARNING LIBRARY SERVICE” [“Wytyczne.
HTML Hyper Text Markup Language komputerowe Esperanto cz. I historia, struktura dokumentu.
Co to jest format PDF PDF (ang. Portable Document Format) - jest formatem plików, który służy do prezentacji, przenoszenia oraz drukowania treści zarówno.
Pełnosprawny Student IX Kraków, 3 listopada 2015 r. Akademicka Biblioteka Cyfrowa Międzyuczelniana biblioteka materiałów dostępnych w wersjach elektronicznych.
The Poznan University of Economics Department of Management Information Systems XML - wprowadzenie.
Hipertekst HTML WWW.
SZKOLENIE KATALOG BIBLIOTECZNY
Poradnik: Polska Bibliografia Lekarska - Jak szukać literatury na wybrany temat w Bibliotece i Centrum Informacji Naukowej PMWSZ w Opolu.
Wypożyczenia międzybiblioteczne w Bibliotece Głównej Pomorskiego Uniwersytetu Medycznego w Szczecinie – diagnoza i rokowania Magdalena Kowalska, Izabela.
SZKOLENIE KATALOG BIBLIOTECZNY
Wypożyczenia międzybiblioteczne w Bibliotece Głównej Pomorskiego Uniwersytetu Medycznego w Szczecinie – diagnoza i rokowania Magdalena Kowalska, Izabela.
Zapis prezentacji:

Od MARC-a do TEI-a Praktyczne znaczenie formalizowanego opisu maszynowego

Potrzeby użytkownika Poszukiwanie wiedzy Zapytania o zawartość dokumentu – nazwy geograficzne – nazwiska (pseudonimy, przydomki) osób – inne nazwy własne (np. PZPR, Huta Warszawa, Stefan Batory, PZPN, Syrena) – nazwy pospolite (np. medycyna, strajki, przestępczość, archiwa, budżet, informatyka) Ogólny opis treści – szukanie w treści autor? wysokość w cm?, ilość stron?, wydawca?

MARC - Machine-Readable Cataloging Geneza – potrzeba zastąpienia katalogu kartkowego wydawnictw Skupienie się na opisie formalnym wydawnictwa Cechy: – Predefiniowana sztywna hierarchiczna struktura danych (powtarzalne pola i podpola) – Prosty format wymiany danych – Nie do końca sformalizowane zasady wypełniania pól i podpól

MARC - Biblioteka Jagiellońska pol Polityka Polityka / \c red. Nacz. Stefan Żółkiewski. 260 Warszawa : \b Wydaw. Prasowe "Polityka", \c \c 54 cm. 310 Tyg R. 1, nr Od R. 35, nr 11 wydawca : Spółdzielnia Pracy "Polityka". 500 Od nr 41 = 2006 (1995) zmiana formatu : 28 cm. 515 Od 1994 r. kontynuowana numeracja ciągła czasopisma bez oznaczania numeracji rocznika. 525 Od 1973 r. Posiada regularny dodatek : Polityka - Eksport -Import. 525 Od 1990 r. czasopismo posiada liczne dodatki regularne i nieregularne Żółkiewski, Stefan \d ( ). 930 BG UG, BG UMCS, BG AGH, BG ARL, BHL, BG AEK, BU KUL, BUWR,BG AP KR, BG PAN, BG ARK, B UMK 977 L98, Polityka 300 \c 54 cm

MARC - The Library of Congress 210 0_ |a Polityka 222 _0 |a Polityka |a Polityka _ |i ACQUIRE Title: |a Polityka. 260 __ |a Warszawa : |b Wydawn. Prasowe "Polityka", |c [ __ |a v. : |b ill. ; |c cm. 310 __ |a Weekly 362 0_ |a R. 1, nr. 1 ( )- 500 __ |a Title from caption. 500 __ |a Issued 1957-Oct. 7, 1995 in newspaper format _ |a MLA international bibliography of books and articles on the modern languages and literatures (Complete edition) |x __ |a Vols. 1- called also no __ |a Issues for called also 515 __ |a Issues for lack cardinal vol. numbering. 530 __ |a Also available on microfilm from Library of Congress Photoduplication Service and New York Public Library. 555 __ |a Index for 1957 bound with v.2, no.4 (1958); dup. index for 1960, with __ |a Accompanied by supplement: Polityka, eksport, import, 590 __ |a SERBIB/SERLOC merged record 592 __ |a ACQN: aq __ |a Weekly 592 __ |a Title update to include airmail 770 1_ |t Polityka, eksport, import |w (DLC) |w (OCoLC) _ |c Microfilm |d Library of Congress Photoduplication Service |w (DLC) |w (OCoLC) _ |c Microfilm |d New York Public Library |w (DLC)sn |w (OCoLC) __ |a DLC |a ICRL |a InU |a MH-R |a WaU 890 __ |a Polityka. Warszawa. |i sv __ |a 7 |b cbc |c serials |d u |e ncip |f 19 |g n-oclcserc 920 __ |a CIO 936 __ |a 14 pa´zdz LIC 991 __ |b c-GenColl |h AP54 |i.P59 |w SERIALS 991 __ |b r-EurRR |w ACQUIRE 992 __ |b |w ACQUIRE 992 __ |b Call x |w SERLOC

MARC - porównanie rekordów pol Polityka Polityka / \c red. Nacz. Stefan Żółkiewski. 260 Warszawa : \b Wydaw. Prasowe "Polityka", \c \c 54 cm. 310 Tyg R. 1, nr Od R. 35, nr 11 wydawca : Spółdzielnia Pracy "Polityka". 500 Od nr 41 = 2006 (1995) zmiana formatu : 28 cm. 515 Od 1994 r. kontynuowana numeracja ciągła czasopisma bez oznaczania numeracji rocznika. 525 Od 1973 r. Posiada regularny dodatek : Polityka - Eksport -Import. 525 Od 1990 r. czasopismo posiada liczne dodatki regularne i nieregularne Żółkiewski, Stefan \d ( ). Congress 210 0_ |a Polityka 222 _0 |a Polityka |a Polityka _ |i ACQUIRE Title: |a Polityka. 260 __ |a Warszawa : |b Wydawn. Prasowe "Polityka", |c [ __ |a v. : |b ill. ; |c cm. 310 __ |a Weekly 362 0_ |a R. 1, nr. 1 ( )- 500 __ |a Title from caption. 500 __ |a Issued 1957-Oct. 7, 1995 in newspaper format. 515 __ |a Vols. 1- called also no __ |a Issues for called also 515 __ |a Issues for lack cardinal vol. numbering. 580 __ |a Accompanied by supplement: Polityka, eksport, import, 592 __ |a Weekly 592 __ |a Title update to include airmail 770 1_ |t Polityka, eksport, import |w (DLC) |w (OCoLC) Jagiellonka

MARC – plusy Format opisu uniezależniony od platformy sprzętowej Sztywna struktura danych (łatwość wymiany) Powszechność stosowania – wprowadzony przez Biblioteką Narodową MAK, (praktycznie darmowe rozpowszechnianie dla bibliotek, zapewnienie struktury danych podobnej do US MARC – Implementacja VTLS w BUW – Nieformalne uznanie MARC-a za standard

MARC – minusy Sztywna struktura danych – trudności z wykonaniem opisu niektórych elementów "wydawnictw specjalnych" Biblioteczne "pochodzenie" – duży nacisk na opis cech formalnych – mniejszy na opis treści Konkretne (fizyczne) wydanie dzieła jako podstawowy rekord w systemie Trudności ze zdefiniowaniem wielopoziomej organizacji dokumentacji

Obszar zainteresowania MARC Dom otwarty : \b komedya w trzech aktach / \c Michałn Bałucki Bałucki, Michał \d ( ). 260 Warszawa : \b S. Lewental, \c s. ; \c 18 cm TAK! NIE!

TEI - Text Encoding Initiative Zwiększone możliwości komputerów – wykorzystanie ich nie tylko do katalogowania cech podstawowych dokumentów ale także do analizy treści. Potrzeba sformalizowania opisu nie tyle formy fizycznej i podstawowych cech wydawnictwa, ale struktury tekstu i zawartości treści. TEI

O co tu chodzi? MARC - wyłącznie ewidencja HTML – sposób formatowania tekstu niezależny od platformy sprzętowej i aplikacyjnej XML – sposób formatowania tekstu niezależny od platformy sprzętowej i aplikacyjnej + sposób zamieszczenia informacji merytorycznej o jego zawartości TEI – tekst + informacja merytoryczna o jego zawartości

Skan WŁADYSŁAW (roztargniony, odsuwając ją lekko). Zaraz, zaraz, moja droga bo to ważny pociąg. JANINA (zadyszana odchodzi) A to grzecznie! Niéma co mówić (bierze robótkę z koszyczka, leżącego na stoliku i siada na kanapie, na końcu oddalonym od Władysława). TELESFOR (wstaje zadowolony i zapajając albo popra- wiając fajeczkę zbliża się do Janiny i mówi wskazując tekst

Tekst zakodowany (HTML) Dom otwarty Komedya w trzech aktach WŁADYSŁAW (roztargniony, odsuwając ją lekko). Zaraz, zaraz, moja droga bo to ważny pociąg. JANINA (zadyszana odchodzi) A to grzecznie! Niéma co mówić (bierze robótkę z koszyczka, leżącego na stoliku i siada na kanapie, na ko ńcu oddalonym od Władysława). TELESFOR (wstaje zadowolony i zapajając albo popra- wiając fajeczkę zbliża się do Janiny i mówi wskazując Zadanie kodowania wykonał za mnie komputer!!!

Uproszczony przykład dodawania informacji merytorycznej WŁADYSŁAW (roztargniony, odsuwając ją lekko). Zaraz, zaraz, moja droga bo to ważny pociąg. JANINA (zadyszana odchodzi) A to grzecznie! Niéma co mówić (bierze robótkę z koszyczka, leżącego na stoliku i siada na kanapie, na ko ńcu oddalonym od > Władysława ). TELESFOR (wstaje zadowolony i zapajając albo popra- wiając fajeczkę zbliża się do Janiny i mówi wskazując

Cytat Rafał T. Prinke, Fontes ex machina: komputerowa analiza źródeł historycznych, Centrum elektronicznych tekstów humanistycznych PAN, Poznań 2000, s. 157: Krótko po publikacji Wskazówek TEI (P3), ich współredaktorzy – Lou Burnard i C.M. Sperberg- McQuenn – opublikowali dwie okrojone wersje DTD z myślą o początkujących użytkownikach, których mogła przerazić (i zniechęcić) dwutomowa cegła o objętości 1300 stron. Pierwsza z nich, nazwana szkieletową (ang. bare bones), obejmowała jedynie absolutne minimum znaczników i mogła służyć tylko za opakowanie czystego tekstu z oznaczeniem jego podstawowej struktury. Zgodnie z przewidywaniem autorów nie zyskała ona uznania w środowisku, ponieważ...

Cytatu cd.... nie dawała ona możliwości adnotowania elementów które naprawdę interesują humanistów.

TEI – przykład kodowania Bibliography Nelson, T. H. Replacing the printed word: a complete literary system. Information Processing '80: Proceedings of the IFIPS Congress, October 1980 Simon H. Lavington North-Holland Amsterdam 1980 źródło:

TEI – przykład kodowania pp 1013–23 Apparently a draft of section 4 of Literary Machines. Ted Nelson: Literary Machines (privately published, 1987) Baxter, Glen Glen Baxter His Life: the years of struggle London: Thames and Hudson, źródło:

specyfikacja (Sperberg-McQueen, Burnard 1994) -- por. Także

Podsumowanie TAK dla inteligentnego kodowania jeżeli: – Dysponujemy gotowym oprogramowaniem wspomagającym ten proces (lub zamówimy jego wykonanie) – Potrafimy wskazać dokumenty warte zakodowania (drogi proces dla niszowych badań) – Planujemy kodowanie na masową skalę dokumentów już posiadających strukturę (potrafimy zautomatyzować proces transferu danych) – Przejmujemy dokumenty zakodowane in statu nascendi (autor, wydawca, aktotwórca)

Podsumowanie cd. NIE dla kodowania tekstów jeżeli: – Planujemy dużo czasochłonnych prac ręcznych z pojedyńczymi dokumentami (drogo i powoli!) – Planujemy jedynie zakodowanie kilku pozycji (te próby na świecie już wykonano) – Nie znajdziemy odbiorców naszej pracy – Nie będziemy potrafili wskazać dokonanego z powodzeniem wdrożenia odpowiadającego naszym planom – Doprowadzi to do obowiążku kodowania dokumentów przekazywanych w dowolnej formie przez (akto)twórcę

No to co ma MARC do TEI-a?

TEI Wrigley, E. A. Parish registers and the historian Steel, D. J. National index of parish registers London Society of Genealogists 1968 vol. 1 pp. 155–167. MARC _ |a Steel, D. J. |q (Donald John) |a National index of parish registers / |c by D.J. Steel. 260 __ |a London : |b Published for the Society of Genealogists [by] Phillimore, Można zrobić bibliografię (np.)

Parę pytań MARC? – który zajmuje się konkretnym egzemplarzem wydawnictwa TEI? – który głęboko wchodzi w szczegóły treści, z jednoczesnym skupieniem się na przedstawienu hierarchii tekstu To może EAD?

. NIGDY nie zastanawiałem się jak wykonać kodowanie np. w RTF (rich text format) - dla mnie oznaczało to po prostu naciśnięcie w edytorze guzika zapisz jako a dla Państwa?