Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Od MARC-a do TEI-a Praktyczne znaczenie formalizowanego opisu maszynowego.

Podobne prezentacje


Prezentacja na temat: "Od MARC-a do TEI-a Praktyczne znaczenie formalizowanego opisu maszynowego."— Zapis prezentacji:

1

2 Od MARC-a do TEI-a Praktyczne znaczenie formalizowanego opisu maszynowego

3 Potrzeby użytkownika Poszukiwanie wiedzy Zapytania o zawartość dokumentu – nazwy geograficzne – nazwiska (pseudonimy, przydomki) osób – inne nazwy własne (np. PZPR, Huta Warszawa, Stefan Batory, PZPN, Syrena) – nazwy pospolite (np. medycyna, strajki, przestępczość, archiwa, budżet, informatyka) Ogólny opis treści – szukanie w treści autor? wysokość w cm?, ilość stron?, wydawca?

4 MARC - Machine-Readable Cataloging Geneza – potrzeba zastąpienia katalogu kartkowego wydawnictw Skupienie się na opisie formalnym wydawnictwa Cechy: – Predefiniowana sztywna hierarchiczna struktura danych (powtarzalne pola i podpola) – Prosty format wymiany danych – Nie do końca sformalizowane zasady wypełniania pól i podpól

5 MARC - Biblioteka Jagiellońska 041 0 pol 222 0 Polityka 245 00 Polityka / \c red. Nacz. Stefan Żółkiewski. 260 Warszawa : \b Wydaw. Prasowe "Polityka", \c 1957-. 300 \c 54 cm. 310 Tyg. 362 0 R. 1, nr 1-. 500 Od R. 35, nr 11 wydawca : Spółdzielnia Pracy "Polityka". 500 Od nr 41 = 2006 (1995) zmiana formatu : 28 cm. 515 Od 1994 r. kontynuowana numeracja ciągła czasopisma bez oznaczania numeracji rocznika. 525 Od 1973 r. Posiada regularny dodatek : Polityka - Eksport -Import. 525 Od 1990 r. czasopismo posiada liczne dodatki regularne i nieregularne. 700 1 Żółkiewski, Stefan \d (1911-1991). 930 BG UG, BG UMCS, BG AGH, BG ARL, BHL, BG AEK, BU KUL, BUWR,BG AP KR, BG PAN, BG ARK, B UMK 977 L98,03 222 0 Polityka 300 \c 54 cm

6 MARC - The Library of Congress 210 0_ |a Polityka 222 _0 |a Polityka 245 00 |a Polityka. 249 0_ |i ACQUIRE Title: |a Polityka. 260 __ |a Warszawa : |b Wydawn. Prasowe "Polityka", |c [1957- 300 __ |a v. : |b ill. ; |c 29-56 cm. 310 __ |a Weekly 362 0_ |a R. 1, nr. 1 (27.2-5.3 1957)- 500 __ |a Title from caption. 500 __ |a Issued 1957-Oct. 7, 1995 in newspaper format. 510 2_ |a MLA international bibliography of books and articles on the modern languages and literatures (Complete edition) |x 0024-8215 515 __ |a Vols. 1- called also no. 1-. 515 __ |a Issues for called also 515 __ |a Issues for lack cardinal vol. numbering. 530 __ |a Also available on microfilm from Library of Congress Photoduplication Service and New York Public Library. 555 __ |a Index for 1957 bound with v.2, no.4 (1958); dup. index for 1960, with 1961. 580 __ |a Accompanied by supplement: Polityka, eksport, import, 590 __ |a SERBIB/SERLOC merged record 592 __ |a ACQN: aq 94009285 592 __ |a Weekly 592 __ |a Title update to include airmail 770 1_ |t Polityka, eksport, import |w (DLC) 00225836 |w (OCoLC)10685653 776 1_ |c Microfilm |d Library of Congress Photoduplication Service |w (DLC) 80645763 |w (OCoLC)6562846 776 1_ |c Microfilm |d New York Public Library |w (DLC)sn 92014327 |w (OCoLC)19333343 850 __ |a DLC |a ICRL |a InU |a MH-R |a WaU 890 __ |a Polityka. Warszawa. |i sv86-26501 906 __ |a 7 |b cbc |c serials |d u |e ncip |f 19 |g n-oclcserc 920 __ |a CIO 936 __ |a 14 pa´zdz. 1995 LIC 991 __ |b c-GenColl |h AP54 |i.P59 |w SERIALS 991 __ |b r-EurRR |w ACQUIRE 992 __ |b 93000592 |w ACQUIRE 992 __ |b Call x7-5305 |w SERLOC

7 MARC - porównanie rekordów 041 0 pol 222 0 Polityka 245 00 Polityka / \c red. Nacz. Stefan Żółkiewski. 260 Warszawa : \b Wydaw. Prasowe "Polityka", \c 1957-. 300 \c 54 cm. 310 Tyg. 362 0 R. 1, nr 1-. 500 Od R. 35, nr 11 wydawca : Spółdzielnia Pracy "Polityka". 500 Od nr 41 = 2006 (1995) zmiana formatu : 28 cm. 515 Od 1994 r. kontynuowana numeracja ciągła czasopisma bez oznaczania numeracji rocznika. 525 Od 1973 r. Posiada regularny dodatek : Polityka - Eksport -Import. 525 Od 1990 r. czasopismo posiada liczne dodatki regularne i nieregularne. 700 1 Żółkiewski, Stefan \d (1911-1991). Congress 210 0_ |a Polityka 222 _0 |a Polityka 245 00 |a Polityka. 249 0_ |i ACQUIRE Title: |a Polityka. 260 __ |a Warszawa : |b Wydawn. Prasowe "Polityka", |c [1957- 300 __ |a v. : |b ill. ; |c 29-56 cm. 310 __ |a Weekly 362 0_ |a R. 1, nr. 1 (27.2-5.3 1957)- 500 __ |a Title from caption. 500 __ |a Issued 1957-Oct. 7, 1995 in newspaper format. 515 __ |a Vols. 1- called also no. 1-. 515 __ |a Issues for called also 515 __ |a Issues for lack cardinal vol. numbering. 580 __ |a Accompanied by supplement: Polityka, eksport, import, 592 __ |a Weekly 592 __ |a Title update to include airmail 770 1_ |t Polityka, eksport, import |w (DLC) 00225836 |w (OCoLC)10685653 Jagiellonka

8 MARC – plusy Format opisu uniezależniony od platformy sprzętowej Sztywna struktura danych (łatwość wymiany) Powszechność stosowania – wprowadzony przez Biblioteką Narodową MAK, (praktycznie darmowe rozpowszechnianie dla bibliotek, zapewnienie struktury danych podobnej do US MARC – Implementacja VTLS w BUW – Nieformalne uznanie MARC-a za standard

9 MARC – minusy Sztywna struktura danych – trudności z wykonaniem opisu niektórych elementów "wydawnictw specjalnych" Biblioteczne "pochodzenie" – duży nacisk na opis cech formalnych – mniejszy na opis treści Konkretne (fizyczne) wydanie dzieła jako podstawowy rekord w systemie Trudności ze zdefiniowaniem wielopoziomej organizacji dokumentacji

10 Obszar zainteresowania MARC 245 00 Dom otwarty : \b komedya w trzech aktach / \c Michałn Bałucki. 100 1 Bałucki, Michał \d (1837-1901). 260 Warszawa : \b S. Lewental, \c 1888. 300 295 s. ; \c 18 cm TAK! NIE!

11 TEI - Text Encoding Initiative Zwiększone możliwości komputerów – wykorzystanie ich nie tylko do katalogowania cech podstawowych dokumentów ale także do analizy treści. Potrzeba sformalizowania opisu nie tyle formy fizycznej i podstawowych cech wydawnictwa, ale struktury tekstu i zawartości treści. TEI

12 O co tu chodzi? MARC - wyłącznie ewidencja HTML – sposób formatowania tekstu niezależny od platformy sprzętowej i aplikacyjnej XML – sposób formatowania tekstu niezależny od platformy sprzętowej i aplikacyjnej + sposób zamieszczenia informacji merytorycznej o jego zawartości TEI – tekst + informacja merytoryczna o jego zawartości

13 Skan WŁADYSŁAW (roztargniony, odsuwając ją lekko). Zaraz, zaraz, moja droga bo to ważny pociąg. JANINA (zadyszana odchodzi) A to grzecznie! Niéma co mówić (bierze robótkę z koszyczka, leżącego na stoliku i siada na kanapie, na końcu oddalonym od Władysława). TELESFOR (wstaje zadowolony i zapajając albo popra- wiając fajeczkę zbliża się do Janiny i mówi wskazując tekst

14 Tekst zakodowany (HTML) Dom otwarty Komedya w trzech aktach WŁADYSŁAW (roztargniony, odsuwając ją lekko). Zaraz, zaraz, moja droga bo to ważny pociąg. JANINA (zadyszana odchodzi) A to grzecznie! Niéma co mówić (bierze robótkę z koszyczka, leżącego na stoliku i siada na kanapie, na ko ńcu oddalonym od Władysława). TELESFOR (wstaje zadowolony i zapajając albo popra- wiając fajeczkę zbliża się do Janiny i mówi wskazując Zadanie kodowania wykonał za mnie komputer!!!

15 Uproszczony przykład dodawania informacji merytorycznej WŁADYSŁAW (roztargniony, odsuwając ją lekko). Zaraz, zaraz, moja droga bo to ważny pociąg. JANINA (zadyszana odchodzi) A to grzecznie! Niéma co mówić (bierze robótkę z koszyczka, leżącego na stoliku i siada na kanapie, na ko ńcu oddalonym od > Władysława ). TELESFOR (wstaje zadowolony i zapajając albo popra- wiając fajeczkę zbliża się do Janiny i mówi wskazując

16 Cytat Rafał T. Prinke, Fontes ex machina: komputerowa analiza źródeł historycznych, Centrum elektronicznych tekstów humanistycznych PAN, Poznań 2000, s. 157: Krótko po publikacji Wskazówek TEI (P3), ich współredaktorzy – Lou Burnard i C.M. Sperberg- McQuenn – opublikowali dwie okrojone wersje DTD z myślą o początkujących użytkownikach, których mogła przerazić (i zniechęcić) dwutomowa cegła o objętości 1300 stron. Pierwsza z nich, nazwana szkieletową (ang. bare bones), obejmowała jedynie absolutne minimum znaczników i mogła służyć tylko za opakowanie czystego tekstu z oznaczeniem jego podstawowej struktury. Zgodnie z przewidywaniem autorów nie zyskała ona uznania w środowisku, ponieważ...

17 Cytatu cd.... nie dawała ona możliwości adnotowania elementów które naprawdę interesują humanistów.

18 TEI – przykład kodowania Bibliography Nelson, T. H. Replacing the printed word: a complete literary system. Information Processing '80: Proceedings of the IFIPS Congress, October 1980 Simon H. Lavington North-Holland Amsterdam 1980 źródło: http://www.tei-c.org/

19 TEI – przykład kodowania pp 1013–23 Apparently a draft of section 4 of Literary Machines. Ted Nelson: Literary Machines (privately published, 1987) Baxter, Glen Glen Baxter His Life: the years of struggle London: Thames and Hudson, 1988. źródło: http://www.tei-c.org/

20 specyfikacja (Sperberg-McQueen, Burnard 1994) -- por. Także http://www.uic.edu/org/tei

21 Podsumowanie TAK dla inteligentnego kodowania jeżeli: – Dysponujemy gotowym oprogramowaniem wspomagającym ten proces (lub zamówimy jego wykonanie) – Potrafimy wskazać dokumenty warte zakodowania (drogi proces dla niszowych badań) – Planujemy kodowanie na masową skalę dokumentów już posiadających strukturę (potrafimy zautomatyzować proces transferu danych) – Przejmujemy dokumenty zakodowane in statu nascendi (autor, wydawca, aktotwórca)

22 Podsumowanie cd. NIE dla kodowania tekstów jeżeli: – Planujemy dużo czasochłonnych prac ręcznych z pojedyńczymi dokumentami (drogo i powoli!) – Planujemy jedynie zakodowanie kilku pozycji (te próby na świecie już wykonano) – Nie znajdziemy odbiorców naszej pracy – Nie będziemy potrafili wskazać dokonanego z powodzeniem wdrożenia odpowiadającego naszym planom – Doprowadzi to do obowiążku kodowania dokumentów przekazywanych w dowolnej formie przez (akto)twórcę

23 No to co ma MARC do TEI-a?

24 TEI Wrigley, E. A. Parish registers and the historian Steel, D. J. National index of parish registers London Society of Genealogists 1968 vol. 1 pp. 155–167. MARC 1 00 1_ |a Steel, D. J. |q (Donald John) 245 10 |a National index of parish registers / |c by D.J. Steel. 260 __ |a London : |b Published for the Society of Genealogists [by] Phillimore, Można zrobić bibliografię (np.)

25 Parę pytań MARC? – który zajmuje się konkretnym egzemplarzem wydawnictwa TEI? – który głęboko wchodzi w szczegóły treści, z jednoczesnym skupieniem się na przedstawienu hierarchii tekstu To może EAD?

26 . NIGDY nie zastanawiałem się jak wykonać kodowanie np. w RTF (rich text format) - dla mnie oznaczało to po prostu naciśnięcie w edytorze guzika zapisz jako a dla Państwa?


Pobierz ppt "Od MARC-a do TEI-a Praktyczne znaczenie formalizowanego opisu maszynowego."

Podobne prezentacje


Reklamy Google