Udział Biblioteki Narodowej w bieżących projektach Europeany Katarzyna Ślaska Biblioteka Narodowa
Europeana „Europeana daje nam okazję do podróżowania w czasie, ponad granicami i w głąb nowych koncepcji dotyczących definicji naszej kultury. Co więcej, pozwala stworzyć więź między ludźmi i ich historią oraz, dzięki interaktywnym stronom i narzędziom, także budować więzi międzyludzkie.” Vivianne Reading, Komisarz UE ds. Społeczeństwa informacyjnego
Współpraca BN i Europeany EDLnet: Thematic Networks (2007-2009) Europeana v.1.0 (2009-2011) EuropeanaTravel (2009-2011) Europeana v.2.0 (2011-2014) Europeana Newspapers Online (2012-2015)
Europeana v.2.0 Projekt finansowany w ramach ICT PSP Work Programme Koordynatorem jest Europeana Foundation Realizowany w latach 2011-2014
Partnerzy projektu Europeana Foundation Biblioteka Brytyjska Biblioteka Narodowa Austrii Uniwersytet Humboldta w Berlinie Ministerstwo Kultury, Hiszpania Biblioteka Narodowa Polski Instytut Audiowizualny, Holandia Narodowy Instytut Audiowizualny, Francja Consiglio Nazionale delle Ricerche, Italy Department of Tourism, Culture and Sport, Ireland
Cele projektu Europeana v.2.0 Rozwój portalu Europeana, wzbogacenie jego zawartości cyfrowej i poprawa funkcjonalności Poprawa satysfakcji użytkownika Lepsza koordynacja prac i poszerzenie sieci współpracujących z Europeaną instytucji i organizacji
European Cultural Commons European Cultural Commons to strategia rozumiana jako zespół działań zakładający masowe udostępnianie cyfrowe dziedzictwa kulturowego Europy. Jest jednym z najważniejszych zadań zdefiniowanych w Europejskiej Agendzie Cyfrowej 2020.
Różnorodność …
… i współdziałanie
Konferencja European Cultural Commons, 12.10.2011
Konferencja European Cultural Commons Celem konferencji było wypracowanie wizji realizacji strategii European Cultural Commons poprzez zapewnienie powszechnego dostępu do zdigitalizowanego dziedzictwa kulturowego, zaspokajającego potrzeby i oczekiwania zróżnicowanych grup użytkowników. Efektem prac ekspertów będzie analiza problemów w zakresie cyfrowego udostępniania dziedzictwa wraz z sugestiami sposobów ich rozwiązania.
Second European Cultural Commons Strategic Briefing 30 października 2012 Limassol, Cypr Kontynuacja dyskusji zainicjowanej na konferencji w Warszawie Przygotowanie rekomendacji do omówienia podczas Europeana Annual General Meeting
Projekt Europeana Newspapers online
Europeana Newspapers – dlaczego prasa? „Gazety są wskazówką sekundową historii" Arthur Schopenhauer Dlaczego gazety? Interesujące dla różnych grup odbiorców Projekt wpisuje się w politykę UE oraz realizuje cele Europeany W bibliotekach czasopisma są pomiędzy: niebem = pełne ciągi zasobów, mikrofilmy wysokiej jakości i piekłem = niska jakość oryginałów, brakujące numery i dodatki, kopie mikrofilmowe złej jakości, prawa autorskie do współczesnych gazet
Europeana Newspapers: Plany i zamierzenia Agregacja i poprawa jakości reprodukcji cyfrowych gazet w Bibliotece Europejskiej i w portalu Europeana Zastosowanie nowoczesnych narzędzi wspierających OCR, OLR (segmentacja tekstu na artykuły) i rozpoznawanie nazw własnych (NER) Biblioteki biorące udział w projekcie dostarczą do Europeany 18 milionów stron gazet Kolejne biblioteki będą zachęcane do przekazywania reprodukcji gazet do Biblioteki Europejskiej i Europeany
Założenia projektu Europeana Newspapers Konsorcjum składa się z 17 partnerów reprezentujących 12 państw Biblioteki narodowe Biblioteki uniwersyteckie Inne jednostki Projekt zakłada zaangażowanie bibliotek nie wchodzących w skład konsorcjum Finansowany jest w ramach Best Practice Network programu ICT PSP Komisji Europejskiej Realizowany jest od lutego 2012 do lutego 2015 r.
Konsorcjum Europeana Newspapers NLE NLF LIBER SUB HH NLL CCS USAL NLP BL SBB ONB KB NLT UIBK BnF UB LFT
Partnerzy projektu 9. Uniwersytet w Salford 10. CCS Content Conversion Specialists GmbH 11. LIBER 12. Biblioteka Narodowa Łotwy 13. Biblioteka Narodowa Turcji 14. Biblioteka Uniwersytecka w Belgradzie 15. Uniwersytet w Innsbrucku 16. Biblioteka Dr. Friedricha Tessmanna 17. Biblioteka Brytyjska 1. Biblioteka Państwowa w Berlinie (koordynator) 2. Biblioteka Narodowa Holandii 3. Biblioteka Narodowa Estonii 4. Biblioteka Narodowa Austrii 5. Biblioteka Narodowa Finlandii 6. Biblioteka Uniwersytecka w Hamburgu 7. Biblioteka Narodowa Francji 8. Biblioteka Narodowa Polski
Cele European Newspapers Online 1) Wybór, obróbka cyfrowa i agregacja prasy europejskiej Europeana stanie się największą biblioteką cyfrową gazet Wzbogacenie Europeany o 18 milionów stron gazet, w większości przeszukiwalnych pełnotekstowo Przeprowadzenie procesów OCR i segmentacji tekstu 2) Analiza istniejących zasobów prasy Zgromadzenie informacji o europejskich kolekcjach gazet 3) Przygotowanie rekomendacji i zestawu dobrych praktyk Opracowanie wzorcowej ścieżki digitalizacji prasy Przygotowanie rekomendacji dotyczących digitalizacji, obróbki cyfrowej, ścieżki digitalizacji, metadanych oraz narzędzi ewaluacyjnych 4) Udostęnienie gazet z możliwością przeszukiwania pełnotekstowego Poprawa dostępu do kolekcji prasy w Europeania
1) Wybór, obróbka cyfrowa i agregacja zasobów Agregacja 18 milionów stron gazet do European oraz Biblioteki Europejskiej 8 milionów stron bez obróbki cyfrowej 10 milionów stron z przeprowadzonym procesem OCR (Uniwersytet w Insbrucku) 2 miliony stron z przeprowadzonym procesem OCR oraz OLR (segmentacja tekstu) (CCS, Germany) Analiza dostarczonych zasobów prasy w postaci cyfrowej i wybór tytułów, przeznaczonych do obróbki cyfrowej www.europeana.eu/ www.theeuropeanlibrary.org/
1) Obróbka cyfrowa – OCR i OLR 10 milionów stron z OCR: Uniwersytet w Insbrucku 2 miliony stron z OCR iOLR (firma CCS) Uniwersytet w Insbrucku wzbogaca OCR o informacje strukturalne na podstawie Document Understanding Platform CCS wykonuje pliki OCR i weryfikuje rozpoznaje szpalt, strukturyzację, segmentację na artykuły i typ strony CCS dostarcza bibliotekom oprogramowanie umożliwiające wprowadzanie poprawek rozpoznawania tekstu i jego segmentacji CCS: Rozpoznawanie tekstu, segemntacja Innsbruck: Rozpoznawanie nagłówków i przypisów oraz spisów treści
1) Obróbka cyfrowa - Named Entity Recognition Biblioteka Narodowa Holandii prowadzi badania w zakresie rozpoznawania nazw własnych (NER) dla zasobów prasy publikowanych w języku holenderskim, angielskim oraz niemieckim
2) Analiza istniejących zasobów prasy Do połowy 2012 r. partnerzy projektu dokonają analizy zasobów czasopiśmienniczych w swoich zbiorach Dane zostaną udostępnione w “Zeitschriftendatenbank” (Centralnym Katalogu Czasopism) Biblioteki Państwowej w Berlinie Zaproponują również potencjalnych nowych partnerów projektu, którzy mogą swoimi zasobami wzbogacić kolekcję Europeana Newspapers Analiza będzie obejmowała również ocenę jakości technicznej zdigitalizowanych zasobów prasy i metadanych opisowych Kontaktowy adres mailowy dla instytucji zainteresowanych współpracą z projektem: survey@europeana-newspapers.eu/
3) Przygotowanie rekomendacji i zestawu dobrych praktyk Analiza formatów metadanych stosowanych przez partnerów projektu w opisie gazet i czasopism Zestawienie modeli metadanych ze standardami METS/ALTO i opracowanie rekomendacji dobrych praktyk w zakresie formatów stosowanych do opisu gazet i czasopism przeznaczonych do digitalizacji i obróbki cyfrowej Przygotowane rekomendacje zostaną przetestowane i poddane ewaluacji Przygotowanie rekomendacji i zestawu dobrych praktyk w zakresie obróbki cyfrowej reprodukcji cyfrowych gazet przeznaczonych do zamieszczania w portalu Europeana
4) Udostępnienie zasobów prasy W ramach projektu w portalu TEL zostanie udostępniona przeglądarka umożliwiająca: Przeszukiwanie pełnotekstowe przez m.in. terminy wyszukiwawcze, nazwy własne, kolekcje gazet, daty …. Przeglądanie reprodukcji cyfrowych gazet Przejście do zasobów cyfrowych macierzystej biblioteki Po zakończeniu projektu przeglądarka zostanie przeniesiona do Europeany
Gazety polskie w Newspapers Online
Katarzyna Ślaska k.slaska@bn.org.pl Dziękuję za uwagę! Katarzyna Ślaska k.slaska@bn.org.pl