PD w praktyce projektów Wikimedia Tomasz Ganicz Stowarzyszenie Wikimedia Polska
Open content Cztery zasady Stallmana: 1.Wolność dowolnego wykorzystania do własnych celów 2.Wolność zbadania i własnej reinterpretacji sensu 3.Wolność redystrybucji – również komercyjnej 4.Wolność dowolnego modyfikowania Cztery zasady Stallmana: 1.Wolność dowolnego wykorzystania do własnych celów 2.Wolność zbadania i własnej reinterpretacji sensu 3.Wolność redystrybucji – również komercyjnej 4.Wolność dowolnego modyfikowania Creative Commons License Design Science License Free Creations License, Free Art Licence GNU Free Documentation License Open Content License Open Directory Project License Open Gaming License Open Publication License Creative Commons License Design Science License Free Creations License, Free Art Licence GNU Free Documentation License Open Content License Open Directory Project License Open Gaming License Open Publication License I oczywiście materiały z domeny publicznej
Co to jest Wikipedia? Wyobraź sobie świat, w którym każda osoba na planecie ma dostęp do sumy wiedzy całej ludzkości. Do tego właśnie dążymy Jimmy Jimbo Wales – założyciel Wikipedii Wyobraź sobie świat, w którym każda osoba na planecie ma dostęp do sumy wiedzy całej ludzkości. Do tego właśnie dążymy Jimmy Jimbo Wales – założyciel Wikipedii Encyklopedia bez ograniczeń papierowych odpowiedników Treść udostępniana na wolnej licencji (CC-BY-SA 3.0) Edytować może każdy, łatwa składnia, z poziomu przeglądarki Encyklopedia bez ograniczeń papierowych odpowiedników Treść udostępniana na wolnej licencji (CC-BY-SA 3.0) Edytować może każdy, łatwa składnia, z poziomu przeglądarki
Wiki
Kto edytuje? Wikipedyści ok. 200 nowych dziennie aktywni: ok. 2 tys. (edytują min. 5 razy w miesiącu) bardzo aktywni ok. 350 (edytują min. 100 razy w miesiącu) Wiek zakres: % lat, 20% lat, 20% lat Wykształcenie zakres: szkoła podstawowa – profesor belwederski najliczniejszą grupę stanowią studenci i magistrzy następnie uczniowie liceów, gimnazjów i doktorzy Wikipedyści ok. 200 nowych dziennie aktywni: ok. 2 tys. (edytują min. 5 razy w miesiącu) bardzo aktywni ok. 350 (edytują min. 100 razy w miesiącu) Wiek zakres: % lat, 20% lat, 20% lat Wykształcenie zakres: szkoła podstawowa – profesor belwederski najliczniejszą grupę stanowią studenci i magistrzy następnie uczniowie liceów, gimnazjów i doktorzy
Kto tym zarządza? Fundacja Wikimedia z siedzibą na Florydzie opłaca i zarządza siecią serwerów, w oparciu o które działa Wikipedia i inne projekty zrzeszone pod szyldem Wikimedia. Fundacja Wikimedia odpowiada też za prawne aspekty funkcjonowania projektów i decyduje o otwieraniu i zamykaniu projektów. Fundacja nie ingeruje bezpośrednio w działanie projektów, chyba że projekt przechodzi kryzys lub są z nim jakieś prawne problemy; projekty są samorządne. Wewnątrz projektów zarządzanie odbywa się merytokratycznie w formie dyskusji i głosowań, a także wyborów na funkcje administratorów. Fundacja Wikimedia z siedzibą na Florydzie opłaca i zarządza siecią serwerów, w oparciu o które działa Wikipedia i inne projekty zrzeszone pod szyldem Wikimedia. Fundacja Wikimedia odpowiada też za prawne aspekty funkcjonowania projektów i decyduje o otwieraniu i zamykaniu projektów. Fundacja nie ingeruje bezpośrednio w działanie projektów, chyba że projekt przechodzi kryzys lub są z nim jakieś prawne problemy; projekty są samorządne. Wewnątrz projektów zarządzanie odbywa się merytokratycznie w formie dyskusji i głosowań, a także wyborów na funkcje administratorów.
Wikipedia obecnie Ponad artykułów w polskiej Wikipedii Niemal 3,6 miliona artykułów w angielskiej Wikipedii Ponad 10 milionów artykułów we wszystkich językach Ok. 5 mln. mediów w Wikimedia Commons 250 wersji językowych 9. pod względem popularności serwis w internecie (Alexa, 26 lutego 2007) Polska wersja – 4. pod względem liczby artykułów Polska wersja – 9. najczęściej odwiedzana strona WWW, nr. 1 w kategorii edukacja (Internet Standard, 29 stycznia 2006) Ponad artykułów w polskiej Wikipedii Niemal 3,6 miliona artykułów w angielskiej Wikipedii Ponad 10 milionów artykułów we wszystkich językach Ok. 5 mln. mediów w Wikimedia Commons 250 wersji językowych 9. pod względem popularności serwis w internecie (Alexa, 26 lutego 2007) Polska wersja – 4. pod względem liczby artykułów Polska wersja – 9. najczęściej odwiedzana strona WWW, nr. 1 w kategorii edukacja (Internet Standard, 29 stycznia 2006)
Wikipedia i… Wikiźródła: - teksty źródłowe (historyczne, pamiątkarskie, ustawy itd..) tekstów w wersji polskiej, w anglojęzycznej. Wikimedia Commons – centralne repozytorium zdjęć i multimediów (ponad 6 mln. plików, z czego 1/5-1/6 z domeny publicznej) Wikibooks, Wikicytaty, Wikispecies, Wikiversity, MediaWiki. Wikiźródła: - teksty źródłowe (historyczne, pamiątkarskie, ustawy itd..) tekstów w wersji polskiej, w anglojęzycznej. Wikimedia Commons – centralne repozytorium zdjęć i multimediów (ponad 6 mln. plików, z czego 1/5-1/6 z domeny publicznej) Wikibooks, Wikicytaty, Wikispecies, Wikiversity, MediaWiki.
Kontrola naruszeń praw autorskich Przez edytorów wzajemna obserwacja edycji zgłaszanie administratorom potencjalnych naruszeń udział w dyskusjach na temat zasad Przez administratorów lokalnych obserwacja wszystkich edycji usuwanie oczywistych naruszeń dyskusja nad wątpliwymi Przez prawników Wikimedia Foundation reagowanie na zażalenia zew. podmiotów ingerowanie w projekty, które przyjęły błędne zasady zamykanie całkowite projektów Przez edytorów wzajemna obserwacja edycji zgłaszanie administratorom potencjalnych naruszeń udział w dyskusjach na temat zasad Przez administratorów lokalnych obserwacja wszystkich edycji usuwanie oczywistych naruszeń dyskusja nad wątpliwymi Przez prawników Wikimedia Foundation reagowanie na zażalenia zew. podmiotów ingerowanie w projekty, które przyjęły błędne zasady zamykanie całkowite projektów
Przykład - Commons Zasady dla PD: ublic_domain ublic_domain Znakowanie szablonami: Dyskusje, czy zasada szablonu poprawna: Zgłaszanie podejrzanych przypadków: /05/26 0/05/26 Usuwanie… Zasady dla PD: ublic_domain ublic_domain Znakowanie szablonami: Dyskusje, czy zasada szablonu poprawna: Zgłaszanie podejrzanych przypadków: /05/26 0/05/26 Usuwanie…
Wikiźródła - idea Pierwotny zamysł: projekt siostrzany Wikipedii gromadzący źródłowe teksty potrzebne do ilustrowania treści tej encyklopedii, tworzony w takim samym trybie jak Wikipedia Rozrósł się do: samodzielnie funkcjonującej biblioteki tekstów źródłowych, która skupiła wokół siebie społeczność wolontariuszy. Tworzyć go: może każdy, komu się chce i zaakceptuje zasady projektu Wikipedia – wikipedysta, Wikiźródła – wikiskryba Wikipedia – Kawiarenka pod wesołym wikipedystą Wikiźródła – Skryptorium Pierwotny zamysł: projekt siostrzany Wikipedii gromadzący źródłowe teksty potrzebne do ilustrowania treści tej encyklopedii, tworzony w takim samym trybie jak Wikipedia Rozrósł się do: samodzielnie funkcjonującej biblioteki tekstów źródłowych, która skupiła wokół siebie społeczność wolontariuszy. Tworzyć go: może każdy, komu się chce i zaakceptuje zasady projektu Wikipedia – wikipedysta, Wikiźródła – wikiskryba Wikipedia – Kawiarenka pod wesołym wikipedystą Wikiźródła – Skryptorium
Zawartość Co zawiera: oryginalne teksty literackie uznanych autorów wcześniej opublikowane oryginalne teksty naukowe dokumenty państwowe (historyczne i aktualne) tłumaczenia oryginalnych tekstów (w tym własne) kody źródłowe oprogramowania Warunek: utwór musi być w domenie publicznej lub udostępniony na wolnej licencji Co zawiera: oryginalne teksty literackie uznanych autorów wcześniej opublikowane oryginalne teksty naukowe dokumenty państwowe (historyczne i aktualne) tłumaczenia oryginalnych tekstów (w tym własne) kody źródłowe oprogramowania Warunek: utwór musi być w domenie publicznej lub udostępniony na wolnej licencji
Historia Początek: 2003 (jako Project Sourceberg) Polska wersja: początkowo rozwijana jako podprojekt na stronach wersji angielskiej – w 2005 własna domena i nazwa wikiźródła wersja en tekstów wersja en tekstów Aktualnie: 101 wersji językowych – 15 wersji ma ponad tekstów, 3 mają ponad Polska: tekstów (10-ta największa) Początek: 2003 (jako Project Sourceberg) Polska wersja: początkowo rozwijana jako podprojekt na stronach wersji angielskiej – w 2005 własna domena i nazwa wikiźródła wersja en tekstów wersja en tekstów Aktualnie: 101 wersji językowych – 15 wersji ma ponad tekstów, 3 mają ponad Polska: tekstów (10-ta największa)
Jak to działa Oprogramowanie: MediaWiki, z paroma dodatkowymi narzędziami wspierającymi OCR Źródła tekstów: przenoszenie z Wikipedii inne strony WWW ręczne przepisywanie ze źródeł papierowych własne tłumaczenia OCR ze skanów + tzw. proofreading Oprogramowanie: MediaWiki, z paroma dodatkowymi narzędziami wspierającymi OCR Źródła tekstów: przenoszenie z Wikipedii inne strony WWW ręczne przepisywanie ze źródeł papierowych własne tłumaczenia OCR ze skanów + tzw. proofreading
Proces produkcyjny z OCR Robimy skany książki samemu i ładujemy je do Wikimedia Commons lub pobieram skany w formacie djv z którejś z bibliotek cyfrowychWikimedia Commons Tworzymy strukturę index dla danej książki (jest ona tworzona półautomatycznie) index Robimy surowy OCR strona po stronie – albo oprogramowaniem własnym, albo on-line przez system udostępniony na serwerze Wikimedia Foundation Strona po stronie poprawiamy tekst z OCR na specjalnych stronach proofreadproofread Druga osoba przegląda tekst ponownie i go zatwierdza Finalny tekst przenosimy do oficjalnej przestrzeni Wikiźródeł.
Powielanie pracy bibliotek cyfrowych? Nie do końca: Nasze treści są dość starannie sformatowane, przejrzane i udostępnione w formie otwartego tekstu, który można w prosty sposób skopiować i po którym się łatwo nawigujeotwartego tekstu Mamy sporo tekstów nie-literackich - zwłaszcza historycznych – ręcznie przepisanych i/lub przetłumaczonychręcznie przepisanych Mamy sporo tekstów ustaw i innych aktualnych dokumentów państwowychustaw Nasze teksty są często bezpośrednio powiązane z artykułami w Wikipedii na ich temat (lub ich autorów)artykułami Są skategoryzowane – kliknięcie na kategorię kieruje do zbioru wszystkich tekstów na dany tematskategoryzowane
Zamiast podsumowania Po to mamy domenę publiczną aby na różne sposoby wykorzystywać i udostępniać zawarte tam treści, a nie aby one kurzyły się na bibliotecznych półkach i w szafach archiwów.
Prawa autorskie Copyright: Tomasz Ganicz 2010 Autor udostępnia ten utwór na licencji CC-BY-SA 3.0 pl Logo Wikiźródeł, Wikimedia Commons i Wikipedii są zastrzeżonymi znakami towarowymi należącymi do Wikimedia Foundation Inc. Zrzuty ekranowe Wikiźródeł: Licencja: CC-BY-SA 3.0 deed Autorzy:Wikiskryby z Wikiźródeł. Copyright: Tomasz Ganicz 2010 Autor udostępnia ten utwór na licencji CC-BY-SA 3.0 pl Logo Wikiźródeł, Wikimedia Commons i Wikipedii są zastrzeżonymi znakami towarowymi należącymi do Wikimedia Foundation Inc. Zrzuty ekranowe Wikiźródeł: Licencja: CC-BY-SA 3.0 deed Autorzy:Wikiskryby z Wikiźródeł.