Jak znaleźć igłę w stogu siana Rola obliczeń komputerowych w eksperymentach fizyki wysokich energii Piotr Golonka CERN EN/ICE-SCD.

Slides:



Advertisements
Podobne prezentacje
Pytanie to coraz cz ęś ciej nasuwa si ę przeci ę tnemu cz ł owiekowi chc ą cemu stworzy ć now ą sie ć w domu. Pytanie to coraz cz ęś ciej nasuwa si.
Advertisements

Jak znaleźć igłę w stogu siana Rola obliczeń komputerowych w eksperymentach fizyki wysokich energii Krzysztof Korcyl na bazie wykładu Piotra Golonki CERN.
Polskie 10 lat w Unii. Polityczne aspekty członkostwa - jak Polska zmieniła Europę.
© IEn Gdańsk 2011 Wpływ dużej generacji wiatrowej w Niemczech na pracę PSE Zachód Robert Jankowski Andrzej Kąkol Bogdan Sobczak Instytut Energetyki Oddział.
© IEn Gdańsk 2011 Technika fazorów synchronicznych Łukasz Kajda Instytut Energetyki Oddział Gdańsk Zakład OGA Gdańsk r.
Zasada i organizacja statystyki publicznej „Cz ł owiek – najlepsza inwestycja”
Doświadczenia z pracy ze schładzarką szybową w fabryce Szerencs Zakopane, Zoltán TÓTH Mátra Cukor.
Nauczanie na odległość Dr inż. Marlena Plebańska.
Budowa i działanie sieci komputerowych Sieć komputerowa - obejmuje minimum dwa komputery połączone ze sobą (przewodowo lub bezprzewodowo).
E- learning czyli nauka przez internet. E-learning E-learning łączy w sobie nauczanie na odległość oraz elastyczność czasową, bywa też łączony z tradycyjnym.
„e-Gdańsk – europejska metropolia on-line” Projekt Współfinansowany przez Unię Europejską z Europejskiego Funduszu Rozwoju Regionalnego.
Pionierka ogół umiejętności związanych z budowaniem przez harcerzy.
Konkurs 2.1. E-usługi publiczne (E-zdrowie) RPO WDŚ Wrocław
Projekt współfinansowany ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego Benchmarking – narzędzie efektywnej kontroli zarządczej.
Składniki odżywcze i ich rola w organizmie Białka, cukry i tłuszcze
OPERATORZY LOGISTYCZNI 3 PL I 4PL NA TLE RYNKU TSL Prof. zw.dr hab. Włodzimierz Rydzkowski Uniwersytet Gdańsk, Katedra Polityki Transportowej.
ELEMENTY ZESTAWU KOMPUTEROWEGO
INTERNET Damian chmielewski. „Międzysieć”??!!! ■Internet (skrót od ”inter-network”, dosłownie tłumacząc z ang. „między-sieć”) – ogólnoświatowa sieć komputerowa.
Warstwa biznesowaWarstwa techniczna ??? To przejście jest połączone z innym procesem To przejście wywołuje samowyzwalacz To przejście jest warunkowe.
Scenariusz lekcji chemii: „Od czego zależy szybkość rozpuszczania substancji w wodzie?” opracowanie: Zbigniew Rzemieniuk.
Projekt Regulaminu Działania Komitetu Monitorującego Regionalny Program Operacyjny Województwa Pomorskiego na lata
Co potrafię w przyjaźni z komputerem?.  Z jakich elementów się składa? Z jakich elementów się składa?  Do czego służy? Do czego służy?  Jakie programy.
OPTYMALNY CEL I PODSTAWY ROZWOJU SZKOŁY. PRZEDE WSZYSTKIM DZISIEJSZA SZKOŁA POWINNA PRZYGOTOWYWAĆ DO ŻYCIA W DRUGIEJ POŁOWIE XXI WIEKU.
Algorytmy Informatyka Zakres rozszerzony
Materiały pochodzą z Platformy Edukacyjnej Portalu Wszelkie treści i zasoby edukacyjne publikowane na łamach Portalu
KOSZTY W UJĘCIU ZARZĄDCZYM. POJĘCIE KOSZTU Koszt stanowi wyrażone w pieniądzu celowe zużycie majątku trwałego i obrotowego, usług obcych, nakładów pracy.
AKCJA LATO 2016 Gdański Inkubator Przedsiębiorczości STARTER.
Konrad Benedyk Zarządzanie i Inżynieria Produkcji 1 rok, II stopień
„Jak zwiększyć bezpieczeństwo uczestników ruchu drogowego?” Co nam dała realizacja projektu?
Sieci komputerowe. Podział sieci. Podstawowe pojęcia związane z sieciami. Internet - określenia podstawowych terminów. Komunikacja w sieci.
 Informatyk jest to osoba, która wykształciła się na specjalistę w dziedzinie nowych technologii, posiadająca wiedzę i umiejętności na temat ogółu metod.
Teoria masowej obsługi Michał Suchanek Katedra Ekonomiki i Funkcjonowania Przedsiębiorstw Transportowych.
Budżet rodzinny Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Czym jest gramofon DJ-ski?. Gramofon DJ-ski posiada suwak Pitch służący do płynnego przyspieszania bądź zwalniania obrotów talerza, na którym umieszcza.
Wieloaspektowa analiza czasowo- kosztowa projektów ze szczególnym uwzględnieniem kryterium jakości rozwiązań projektowych AUTOR: ANNA MARCINKOWSKA PROMOTOR:
I Liceum Ogólnokształcące im. Ziemi Kujawskiej we Włocławku.
Optymalna wielkość produkcji przedsiębiorstwa działającego w doskonałej konkurencji (analiza krótkookresowa) Przypomnijmy założenia modelu doskonałej.
Woda O tym, dlaczego powinniśmy ją oszczędzać Jan Stasiewicz, kl. II C.
Cząstki elementarne. Model standardowy Martyna Bienia r.
Zapotrzebowanie szpitali publicznych na środki finansowe w odniesieniu do zadłużenia sektora ochrony zdrowia - Raport Electus Forum Rynku Zdrowia Warszawa,
DZIEŃ BEZPIECZNEGO INTERNETU. S PIS TREŚCI 1. INTERNET INTERNET 2. DZIEŃ BEZPIECZNEGO INTERNETUDZIEŃ BEZPIECZNEGO INTERNETU 3.RAZEM TWORZYMY LEPSZY INTERNETRAZEM.
Od recesji do koniunktury.. Podstawowe pojęcia. Recesja – zjawisko makroekonomiczne polegające na znacznym zahamowaniu tempa wzrostu gospodarczego, skutkujące.
Urządzenia i technologie mobilne. Tablet Mobilny komputer większy niż telefon komórkowy, którego główną właściwością jest posiadanie dużego ekranu z zastosowaną.
Co to Internet? Internet (skrótowiec od ang. inter-network, dosłownie "między- sieć") – ogólnoświatowa sieć komputerowa, określana również jako sieć sieci.
System operacyjny Renata P. System operacyjny - jest to zbiór nadrzędnych i niezbędnych programów umożliwiających pracę na komputerze. Jest on pośrednikiem.
O PARADOKSIE BRAESSA Zbigniew Świtalski Paweł Skałecki Wydział Matematyki, Informatyki i Ekonometrii Uniwersytet Zielonogórski Zakopane 2016.
Symulacja halo dla wiązki protonów w akceleratorze LHC
Mikroprocesory.
Młodzieżowe miniprzedsiębiorstwo
Pliki-Partycje-Dyski
T.15 Wybór narzędzi dla reengineeringu (szczegóły).
Elektronika front-end
Schematy blokowe.
Co i gdzie się mierzy Najważniejsze ośrodki fizyki cząstek na świecie z podaniem ich najciekawszych wyników i kierunków przyszłych badań Charakterystyka.
Wstęp do Informatyki - Wykład 3
KOREKTOR RÓWNOLEGŁY DLA UKŁADÓW Z NIEMINIMALNOFAZOWYMI OBIEKTAMI Ryszard Gessing Instytut Automatyki, Politechnika Śląska Plan referatu Wprowadzenie.
Dobieranie komputera Podzespoły.
Jak to jest zrobione... Komputer Kinga Małczuk.
Git - system kontroli wersji
Języki programowania.
P o l i t e c h n i k a K r a k o w s k a Biblioteka Główna / OIN
SYSTEM KONTROLI FREKWENCJI
Microsoft Office Project 2003 Professional
Alternatywny slajd początkowy – logo bez animacji
Zakład Hydrotechniczny Rudna 26 styczeń 2017
Prawa ruchu ośrodków ciągłych c. d.
Program na dziś Wprowadzenie Logika prezentacji i artykułu
Zapis prezentacji:

Jak znaleźć igłę w stogu siana Rola obliczeń komputerowych w eksperymentach fizyki wysokich energii Piotr Golonka CERN EN/ICE-SCD

P. Golonka2 Plan  Co jest igłą a co stogiem siana... między teorią a doświadczeniem  Seria złożonych problemów Zbieranie danych Opracowywanie danych Analiza danych  Technologie Klastry, GRID

P. Golonka3 Co jest stogiem siana? - LHC Genewa protony TeV = 7·10 12 eV

P. Golonka4 Co jest stogiem siana?... i detektory LHC Eksperyment Interesujące oddziaływania proton-proton

P. Golonka5 Co jest igłą ?  Większość zderzeń to zwykłe, dobrze znane oddziaływania.  Te interesujące które niosą informacje o nieznanych zjawiskach są bardzo rzadkie. Typowo 1 przypadek na 100 mln!  Jak „zauważyć” taki przypadek w aparaturze i zapisać go na taśmę gdy mamy tak duży strumień danych ≡ tak mało czasu na analizę „on-line”?

P. Golonka6 Czego szukamy w eksperymentach? Łamanie CP w układzie mezonów pięknych (B) Zjawiska rzadkie ~ – Pozostałe eksperymenty na LHC mają swoje zestawy „igieł” Cząstka Higgsa (ATLAS, CMS) Supersymetria (ATLAS, CMS) Plazma kwarkowo-gluonowa (ALICE)... Przykład: eksperyment LHCb

P. Golonka7 Przykład: rekonstrukcja śladów cząstek Symulacja komputerowa danych z 1 przypadku w detektorze wewnętrznym eksperymentu ATLAS Zagadka: znajdź 4 proste ślady

P. Golonka8 Przykład: rekonstrukcja śladów cząstek Rozwiązanie: Rozpad cząstki Higgsa na 4 miony: H → 4μ

P. Golonka9 Analiza danych: co zobaczy Fizyk: Cząstki Higgsa o masie ~150 GeV Masa inwariantna 4 leptonów [GeV] Tło od innych rozpadów dających 4 miony

P. Golonka10 Teoria, doświadczenie i... komputery Teoria Doświadczenie (?) = Metody komputerowe

P. Golonka11 “doświadczenie = teoria” (?) Generator(y) przypadków Dane Filtr przypadków Symulacja detektora

P. Golonka12 Symulacja i prawdziwy eksperyment Rekonstrukcja Analiza fizyczna W efekcie modelowania otrzymujemy dane symulowane w formacie takim jakie będą napływać z elektroniki odczytu aparatury eksperymentalnej. Symulacja 1.Generator przypadków (teoria) 2.Modelowanie odpowiedzi aparatury (Geant4) Prawdziwy eksperyment

P. Golonka13 Modelowanie aparatury Detektor wierzchołka Detektor RICH Identyfikacja cząstek Pełny spektrometr

P. Golonka14 Symulacja zjawisk w detektorach Slajd ze strony www eksperymentu CMS

P. Golonka15 Co jest stogiem siana  Przecięcia pęków wiązek: co 25 nanosekund (częstotliwość LHC: 40 MHz)  Nie wszystkie “pęczki” są pełne – zderzenia: 31 MHz  10 * 10 6 zderzeń w ciągu 1 sekundy widocznych w eksperymencie LHC-b! 10 mln100 tys1l. dysków (300 GB) 3 EB ( 3*10 18 )30 PB300 GBIlość danych l. przypadków RokDzieńSekunda Dane przepływające przez eksperyment  Dla eksperymentów ATLAS i CMS jest znacznie gorzej ATLAS 2PB/sek ≡ 3 mln CD/s

P. Golonka16 Dygresja... ile to bajtów? 1 Megabajt (1MB) zdjęcie z aparatu cyfrowego: 2 MB 1 Gigabajt (1GB) = 1000MB film na nośniku DVD: 6 GB 1 Terabajt (1TB) = 1000GB Największe twarde dyski: 1TB Światowa roczna produkcja książek: 8TB Biblioteka kongresu USA: 10 TB 1 Petabajt (1PB) = 1000TB Roczne składowanie danych w LHC: 14 PB Informacja w WWW: 8PB 1 Eksabajt (1EB) = 1000 PB Roczna produkcja informacji zapisanej cyfrowo: 5 EB Wszystkie dotąd wypowiedziane słowa: 5EB Wszystkie twarde dyski w stanie Minesota, USA (5 mln mieszkańców): 1EB Przepływ cyfrowej informacji w 2002: 18 EB ( z czego 98% to telefony) Ilość danych “widzianych” przez eksperyment na LHC: 3 EB 1 Zetabajt (1ZB) = 1000 EB Roczna konsumpcja informacji w USA: 3.6 ZB (55% to gry komputerowe, 35% telewizja) Źródło: HMI Report 2009, ;

P. Golonka17 Co jest stogiem siana  Przecięcia pęków wiązek: co 25 nanosekund (częstotliwość LHC: 40 MHz)  Nie wszystkie “pęczki” są pełne – zderzenia: 31 MHz  10 * 10 6 zderzeń w ciągu 1 sekundy widocznych w eksperymencie LHC-b! 10 mln100 tys1l. dysków (300 GB) 3 EB ( 3*10 18 )30 PB300 GBIlość danych l. przypadków RokDzieńSekunda  Zapis wszystkich przypadków jest niemożliwy  Na każdy przypadek należy jednak „zerknąć” i zadecydować czy jest interesujący. Do „przeglądania” przypadków służy system wyzwalania czyli filtracji przypadków ( tzw. tryger). Dane przepływające przez eksperyment  Dla eksperymentów ATLAS i CMS jest znacznie gorzej ATLAS 2PB/sek ≡ 3 mln CD/s

P. Golonka18 Zbieranie danych - system wyzwalania  Zadaniem systemu wyzwalania jest przede wszystkim jak najszybsze odrzucanie zbędnych przypadków (a nie wybieranie tych interesujących).  W kolejnych stopniach filtrowania mamy do dyspozycji coraz więcej czasu na dokładniejszą analizę przypadków zaakceptowanych i dokładniejsze odrzucanie. TAK NIE ? 1 ms 10 ms

P. Golonka19 Zbieranie danych 30 MHz 2 kHz 35 GB/s 2·10 10 przyp./rok 1 MHz HLT (algorytmy) Wyższy stopień wyzwalania 1 MHz → 1μs/przypadek. W ciagu 1 μs nie można nawet zdekodowac danych Co zrobic ??? 1000 procesorów → 1 ms/przypadek Możliwa staje się rekonstrukcja sladow w detektorze wierzcholka w rzucie rφ L0 (hardware) Wstępny poziom wyzwalania

P. Golonka20 Farma procesorów on-line Force10 E1200: 1260 portów GbE Przepustowość 50 GB/s 1 MHz na wejściu → 30 GB/s 1000 CPU 2 kHz na wyjściu Zapis 250 MB/s 1 m

P. Golonka21 Igła czy stóg siana? LHC Eksperymenty Interesujące oddziaływania p-p 15 Petabajtów / rok przefiltrowanych danych z czterech eksperymentow na LHC Filtrowanie Redukcja > Eksabajty/rok 15 Petabajtów/rok

P. Golonka22 Analiza danych  Analiza danych zapisanych na taśmy Przypadki przefiltrowane  Niespotykane dotąd wyzwania ~kilkanaście PB danych na rok 200 tys procesorów 10 tys dysków  Skoncentrowanie infrastruktury w jednym miejscu jest niesłychanie trudne (i niecelowe bo blokuje rozwój innych ośrodków). Instalacja, zasilanie, chłodzenie, obsługa systemów operacyjnych i oprogramowania  Konieczny model rozproszonych obliczeń czyli zespól współpracujących ze sobą farm komputerowych. Czy można jednak stworzyć coś bardziej uniwersalnego co byłoby przydatne także dla innych dziedzin?

P. Golonka23 GRID – globalny komputer  WWW – przewrót w dostępie do informacji (wynalezione w CERN). Jednolity dostęp do informacji bez względu na miejsce na Ziemi.  GRID – jednolity dostęp do zasobów obliczeniowych. GRID widziany przez każdego użytkownika jako jeden wielki komputer. Dobra platforma współpracy dla dużych projektów.  Wspólne narzędzia i dane, dostęp do mocy obliczeniowej. Analogia z siecią elektryczna (także w przypadku opłat za pobraną moc obliczeniowa)  Pierwszą udaną inicjatywą na dużą skalę były obliczenia w ramach projektu SETI (Search for Extra-Terrestrial Intelligence)  Każdy posiadacz PC mógł udostępnić moc obliczeniowa np. w nocy i uruchomić program analizujący sygnały przychodzące z kosmosu.  Projekt zaoszczędził wiele milionów $

P. Golonka24 Ogólnoświatowa sieć GRID  EGEE jest największym ogólnoświatowym projektem GRID Obecnie ponad 80 tys procesorów 300 ośrodków naukowych w 50 krajach na całym świecie użytkowników 100 tys zadań wykonywanych jednocześnie 15 PB przestrzeni dyskowej  Koordynatorem projektu jest CERN  Fizyka cząstek jest głównym użytkownikiem (największe potrzeby)

P. Golonka25 Univ. A Lab. C Univ. B Lab. A Univ. C Lab. B Univ. D Tier 2 Niemcy Tier 1 USA UK Francja Włochy Taipei? CERN Tier 1 Japonia Struktura hierarchiczna (Multi Tier) Tier 0 Tier 3 (Departament)

P. Golonka26 Struktura hierarchiczna (Multi Tier)

P. Golonka27 GTS 1,6 Gb/s GDAŃSK POZNAŃ ZIELONA GÓRA KATOWICE KRAKÓW LUBLIN WARSZAWA BYDGOSZCZ TORUŃ CZĘSTOCHOWA BIAŁYSTOK OLSZTYN RZESZÓW Bielsko-Biała GÉANT Gb/s KOSZALIN SZCZECIN WROCŁAW ŁÓDŹ KIELCE PUŁAWY OPOLE RADOM BASNET 34 Mb/s CESNET, SANET GÉANT / TELIA 2x2,5 Gb/s DFN 10 Gb/s Gorzów MAN 10 Gb/s (1 lambda) 2 x 10 Gb/s 1 Gb/s CBDF 10 Gb/s PIONIER’S FIBERS Polska infrastruktura WLCG Tier1 FZK Karlsruhe Tier2 PCSS Poznań Tier2 ICM Warszawa Tier2 ACK Cyfronet Kraków

P. Golonka28 Więcej informacji...    Real-Time grid monitor:

P. Golonka29 Technologie: farmy PC  Początkowo CERN zdecydował zakupić komputery w formie zwykłych PC dostępnych w sklepach.  W międzyczasie technologie RACK i BLADE osiągnęły konkurencyjne ceny.  Obecnie w dużych ośrodkach wygrywają technologie specjalistyczne RACK i BLADE Hala w CERN przygotowana do montażu PC w szafach RACK PC typu RACK i BLADE Pierwsze klastry w CERN w standardowej technologii. Serwery typu “rack”w centrum komputerowym CERN

P. Golonka30 Technologie - c.d.  O(10000) procesorów (rdzeni) Kilka procesorów w komputerze, kilka rdzeni w procesorze, wirtualizacja...  Ultra-szybkie połączenia sieciowe 1, 10Gb Ethernet Fiber Channel  Składowanie danych: taśmy np. robot: Sun StorageTek SL8500  Do 300 tys taśm, 500 GB każda  Do 2048 napędów o prędkości 100MB/s  System operacyjny: CERN Scientific Linux

P. Golonka31 CERN openlab Partnerstwo z czołowymi firmami informatycznymi: Najnowsze procesory i technologie sieciowe Bazy danych Automatyka przemysłowa Bezpieczeństwo

P. Golonka32 WWW:Tim Berners-Lee, ! CERNET: 1984 (first European TCP/IP network) World Wide Web, europejski Internet / /

P. Golonka33 Podsumowanie  Eksperymenty na LHC dostarczają ogromnej ilości danych.  Przypadki których szukamy zdarzają się bardzo rzadko, ~1 na 100 mln.  Jedynie dzięki komputerom udaje się zebrać, przetworzyć i analizować dane.  CERN stymuluje rozwój nowych technologii informatycznych (WWW, GRID)