• Diák 2 – 9 : Mi az a CERN?• általánosságban CERN-ről
• Diák 10 – 19: Mi az az LHC?• Az LHC és kihívásai az adat és a CPU nézőpontjából
• Diák 20 – 36: A Grid• A GRID általánosságban
• Diák 37 – 50: Grid @ CERN• grid projektek CERN-ben (EDG, DataTAG, LCG, Grace, Mammogrid, Openlab)
Rövid video klipek:• CERN 2 percben• Az LHC szimuláció• A Grid
Áttekintés
• CERN a világ legnagyobb részecskefizika központja
• A részecskefizika szól:- az elemi részecskékről, melyekből az Univerzum
minden anyaga áll - elemi erőkről melyek az anyagot összetartják
• A részecskefizika:- speciális eszközöket igényel az új részecskék
megalkotásához és tanulmányozásához
Mi az a CERN? CERN-t képviseli:-~ 2500 személyzeti tudós (fizikusok, mérnökök, …)- Kb. 6500 látogató tudós (a világ részecskefizikusainak fele)
500 egyetemről érkeznek,
80 nemzetet képviselve.
Mont Blanc, 4810 m
Geneva belvárosa
CERN Telephelye
Mi az a CERN?
A részecskefizika speciális eszközei:
• GYORSÍTÓK, hatalmas gépek, melyek fel tudják gyorsítani a részecskéket nagyon magas energiaszintre, mielőtt a többi részecskével összeütköznének
• DETEKTOROK, masszív berendezések, melyek regisztrálják a kapott részecskéket a felgyorsított részecskeütközések esetén
• A fizikusok egymásnak ütköztetik a részecskéket, hogy:- azonosíthassák komponenseiket
- új részecskéket hozzanak létre - felfedjék a közöttük létrejövő interakciók
természetét- létrehozzanak egy ahhoz hasonló környezetet,
amilyen az Univerzumunk keletkezésekor létezett
• Miért? Hogy megválaszolhassunk alapvető kérdéseket, íme: Hogyan keletkezett, indult a Világegyetem? Mi az eredeti esszencia? Milyen az antianyag természete?
Mi az a CERN?
Mi az a CERN?
CERN 2 perces videóban
A World Wide Web itt került kifejlesztésre, a világ fizikusai közötti információmegosztás javítására és
gyorsítására!
Mi az a CERN?
• CERN sok fontos felfedezést tett, de a jelenlegi megértésünk a Világegyetemről még mindig hiányos!
• A Magas Energiájú ütközések kulcsfontosságuak a későbbi sűrűbb részecskék felfedezéséhez (E=mc2)
• Az egyik részecske a teoretikusok jóslata szerint megfoghatatlan marad: ez a Higgs bozon
Mi az a CERN?
• Hogy megválaszoljuk a még mindig nyitva álló kérdéseket, CERN megépíti a Large Hadron Collider-t (LHC)
• Az LHC lesz a legerőteljesebb berendezés ami valaha épült az elemi részecskék tanulmányozására
• Ha a Higgs bozon létezik, az LHC valószínűleg meg fogja találni
Mi az a CERN?
• Az LHC protonsugarakat fog ütköztetni 14 TeV-os energiaszinten.
• A legfrissebb szuper-vezető technológiákat alkalmazva,kb – 3000C-on fog működni, épphogy az abszolút nulla felett.
• A 27 km-es körméretével, ez a gyorsító lesz a legnagyobb szupervezető berendezés a világon.
Mi az az LHC? Az LHC várható
beüzemelése 2007
Négy kísérlet történik ‘katedrális méretű detektorokkal’: ALICEATLASCMSLHCb
Gyorsítók, detektorok, LHC…?
• Egy részecskeütközés = egy esemény
• A fizikusok célja az előállított részecskék megszámlálása, nyomonkövetése és jellemzése, valamint a folyamat teljes rekonstruálása.
• A sávok között jelenlévő “speciális alakzatok” az érdekes interakciók megtörténtét jelzik.
Az egyik útja a Higgs bozon megtalálásának: Olyan jellemző sérült mintázatok találása, melyek 4 müont adnak
Az LHC Adatkihívása
Indulva ezzel az eseménnyel…
Ezt a „jelet” keressük
Szelektivás: 1 in 1013
Olyan, mintha egy embert keresnénk világpopulációk ezreiben!
Vagy egyetlen tűt 20 millió szénakazalban!
Az LHC Adatkihívása
LHC adat
• 40 millió ütközés másodpercenként
• Szűrés után, 100 érdekelt ütközés másodpercenként• Egy Megabájtnyi digitalizált adat tartozik minden ütközéshez = 0.1 Gigabájt/sec-os adatfelvételi ráta• 1010 ütközés kerül rögzítésre évente = 10 Petabájtnyi adat évente
CMS LHCb ATLAS ALICE
1 Megabyte (1MB)Egy digitális fotó
1 Gigabyte (1GB) = 1000MBEgy DVD film
1 Terabyte (1TB)= 1000GBA világ éves könyvvezetése
1 Petabyte (1PB)= 1000TBAz LHC kísérletek éves produktuma
1 Exabyte (1EB)= 1000 PBA világ éves információ többlete
LHC adat
Az LHC adat kb. 20 millió CD-nek felel meg évente!
Concorde(15 Km)
Ballon(30 Km)
CD halom 1 évnyi LHC adattal!(~ 20 Km)
Mt. Blanc(4.8 Km)
Hol fogják tárolni az összes kísérleti adatot?
LHC feldolgozás
• Szimuláció: az elmélettel és a detektor jellemzőinek felmérésével kezdődik, majd annak kiszámításával, hogy a detektornak mit kellene látnia
• Rekonstrukció: a detektor jeleit fizikai tulajdonságokká alakítjuk (energák, részecsketöltés, ..)
• Analízis: Hasonló tulajdonságú ütközések megtalálása, komplex algoritmusok használata a fizika kiterjesztésére…
LHC feldolgozás
Az LHC adatelemzés közelítőleg 100,000 mai leggyorsabb PC processzorral ekvivalens feldolgozóerőt
igényel!Hol fognak találni ekkora teljesítményt a
kísérletek számára?
Számítástechnika CERN-ben
• Magas-áteresztőképességű számítástechnika, a megbízható “commodity” technológián alapulva• Több mint 1000 dupla processzorú PC • Több mint 1 Petabyte adat lemezen és szalagokon
Távolról sem elegendő!
Számítástechnikai háttér az LHC mögött
• Probléma: CERN egyedül csak egy részét tudja nyújtani a szükséges erőforrásoknak
• Megoldás: Számítástechnikai központok, melyek elkülönültek voltak a múltban, be kellene hogy
kapcsolódjanak, egyesítve a világ részecskefizikusainak erőforrásait!
Európa: 267 intézet4603 felhasználó
Egyéb helyeken: 208 intézet1632 felhasználó
Számítástechnikai háttér az LHC számára: egy probléma?
A Grid: egy lehetséges megoldás!
Mi az a Grid?
• A World Wide Web közvetlen hozzáférést biztosít olyan információhoz, mely gépek millióin került tárolásra különböző földrajzi helyeken
• A Grid viszont egy aktuálisan felbukkanó infrastruktúra, mely közvetlen hozzáférést biztosít a gépi feldolgozóerőhöz és az adattároló kapacitáshoz is, mely megosztva helyezkedik el a Földön.
• A Grid megnevezés Ian Foster és Carl Kesselman nevéhez fűződik (Grid biblia “A Grid: Egy új számítástechnikai infrastruktúra tervrajza”).
• A Grid nevét az elektromos tápfeszültség hálózat analógiája miatt kapta: férjen hozzá a gépi erőforráshoz anélkül, hogy azon aggódna, honnan érkezik, mint egy kenyérpirító az elektromos áramhoz.• Az eszme már jelen van egy ideje, különböző nevek alatt (szétosztott számítógépfelhasználás, metaszámítástechnika, …).
•Ezúttal a technológia olyan helyzetbe került, hogy megvalósíthassa ezt az álmot globális méretekben.
Mi az a Grid?
• A Grid egy előrehaladott szoftvertechnológiára támaszkodik, ez a middleware, mely biztosítja a közvetlen kommunikációt különböző számítógépek között, melyek a világ különböző pontjain vannak
Hogyan fog működni?
• A Grid keresőmotorja nemcsak az adatot fogja megtalálni amire a tudósoknak szükségük van, hanem az adatfeldolgozó technikát és gépi erőt is, a kivitelezéshez
• Szétosztja a számítási feladatot bárhová a világban, ahol szabad kapacitás van, és küldi az eredményt a tudósnak
Hogyan fog működni?A GRID middleware:• Megtalálja a megfelelő helyeket a tudós „munkájának” (számítási feladat) futtatásához
• Optimizálja a szétosztott erőforrások használatát
• Megszervezi a tudományos adatokhoz való hatékony hozzáférést
• Elvégzi a különböző telephelyek hitelesítését, ahol a tudósok dolgozni fognak
• Érintkezik a helyi hitelesítő és erőforrás-elosztó intézkedésekkel
• Futtatja a munkákat
• Megfigyeli a folyamatokat
• Helyreállítja a problémákat
… és ….
Értesíti Önt a munka elkészültéről, és átküldi az eredményt!
Mik a kihívások?
Adatmegosztás megvalósítása tudósok ezrei között, többszörös érdeklődéssel
A nagy számítógépközpontok összekapcsolása, nemcsak a PC-ket
Biztosítani kell minden adat hozzáférhetőségét, mindenkor
Gyors növekedés szükséges, a megbízhatóság évtizedekig való fenntartásával
Kezelnie kell a különböző központok különböző menedzsment stratégiáit
Az adatbiztonság nyújtása: több van mérlegen, mint a puszta pénz!
Futnia kell 2007-re
Előnyök a Tudomány javára
• Hatékonyabb és közvetlenebb együttműködés a különböző közösségek között, mind a tudományosakat, mind a kereskedelmieket tekintve
• Nagy méretű alkalmazások futtatása gépek ezrein egyszerre, az alkalmazások széles skálájára érvényben
• Tiszta hozzáférés a szétosztott erőforrásokhoz az Ön asztali gépéről, vagy még a mobiltelefonjáról is
• Az “e-Science” kifejezés ezek kinyilvánítására született
Grid projektek a világban
•NASA Információs Teljesítmény Grid•DOE Tudományos Grid•NSF Nemzeti Virtuális Obszervatórium•NSF GriPhyN•DOE Részecskefizika adat Grid•NSF TeraGrid•DOE ASCI Grid•DOE Földrajzi Rendszerek Grid•DARPA CoABS Grid•NEESGrid•DOH BIRN•NSF iVDGL
•UK e-Science Grid•Netherlands – VLAM, PolderGrid•Germany – UNICORE, Grid javaslat•France – Grid alapítás jováhagyása•Italy – INFN Grid•Eire – Grid javaslatok•Switzerland - Hálózat/Grid javaslat•Hungary – DemoGrid, Grid javaslat•Norway, Sweden - NorduGrid
•DataGrid (CERN, ...)•EuroGrid (Unicore)•DataTag (CERN,…)•Asztrofizikai Virtuális Obszervatórium•GRIP (Globus/Unicore)•GRIA (Ipari alkalmazások)•GridLab (Cactus Toolkit)•CrossGrid (Infrastrukturális Komponesek)•EGSO (Szoláris Fizika)
Grid Tudományos Alkalmazások
• Orvostudományi/Egészségügyi (leképezés, diagnózis és kezelés )
• Bioinformatika (az emberi génállomány és a genetikai betegségek tanulmányozása)
• Nanotechnológia (új anyagok tervezése molekuláris méretekből kindulva)
• Mérnöki tervezés (tervezés optimalizáció, szimuláció, kudarcanalízis és távoli eszközök irányítása)
• Természeti Erőforrások és Környezet (időjárás előrejelzés, Földkutatás, modellezésÉs komplex rendszerek prognózisa)
Orvostudományi/EgészségügyiAlkalmazások
“A Grid lehetővé teszi a képanyagok nagy kollekcióinak használatát új, dinamikus módokon, az orvosi diagnózist beleértve.”
“A 3D-s orvosi képanyagok használatának lehetősége lesz a kulcs a kórtani és sebészeti tervezések diagnózisaihoz”
“A Grid engedélyezi a szabványosított, szétosztott mammográfia erőforrás használatát a diagnosztikus bizalom javításában”
Quotes from: http://gridoutreach.org.uk
• Digitális képarchívumok
• Együttműködő virtuális környezetek
• On-line klinikai konferenciák
Bioinformatika
“Minden alkalommal, amikor egy génállományt besorolnak, az eredményt összehasonlítják egyéb génekkel, többféleképpen. Minden kód 3.5 billió pár vegyületből áll…”
• A genetikus információ komplex felszabaduló mintázatainak megfogása, egy embrió determinálása és kifejlesztése•A genetikus interakciók megértése, melyek az életforma fejlődési folyamatainak alapját adják, a betegségekét és az evolúcióét.
Nanotechnológia
“A Grid magában hordozza az adatok olyan mértékű tárolásának és elemzésének lehetőségét, amely támogatja az új anyagok teljes sorának olcsó és gyors szintézisét.”
Quotes from: http://gridoutreach.org.uk
• Új, jobb anyagok
• Hozzásegít a gyógyszerkutatáshoz, az agrárkemikáliákhoz, az élelmiszer előállításhoz, az új katalizátorok, fémek, polimerek, szerves és szervetlen anyagok gyorsabb, olcsóbb felfedezéséhez
Természeti Erőforrások/Környezet
“A heterogén adatbázisok föderációi kiterjeszthetők a Griden keresztül, olyan globális komplex kérdéskörök megoldása érdekében, mint amilyen a biodiverzitás.”
Quotes from: http://gridoutreach.org.uk
• Földrengések előrejelzése és modellezése
• Éghajlati változások tanulmányozása és időjárás előrejelzés
• Légszennyezés kontrollálása
• Gazdaságszociológiai növekedés tervezés, pénzügyi modellezés, teljesítmény optimalizáció
A Grid előfutárai
• SETI@home: szabad PC feldolgozóerő megosztása a rádiójelek elemzéséhez
• Napster: adatmegosztás (zene) számítógépek között
• Entropia DCGrid: kereskedelmi megoldás a munkaállomások megosztására egy vállalaton belül
A különség:CERN Gridje gépi erőforrásokat fog kombinálni nagy számítógépközpontokban, melyek kizárólagos felszerelést és kifinomult middleware-t igényelnek az erőforrások megfigyeléséhez és allokációjához
SETI@home: egy Grid őstípus
>1 millió évnyi gépi feldolgozó időintervallum
>3.5 millióan töltötték le a képernyőkímélőt
>30 Teraflopos ráta (ASCI Fehér = 12 Teraflop)
Lerakta a háziipar alapjaitXpulsar@home, Genome@home, Folding@home, evolutionary@home, FightAIDS@home, SARS@home...
És letett a valós ipartEntropia, United Devices, Popular Power...
Nagy korlátozások:Csak a „zavarbaejtően párhuzamos” problémákra megfelelőA Ciklikus öblítés a jóhiszeműségre számít
Hasznos melléktermék SETI@home-tól
Ki fogja használni a Grid-eket?
• Számítástechnikai tudósok & mérnökök: komplex struktúrák nagy méretű modellezése
• Kísérleti tudósok: nagy adatcsomagok tárolása és elemzése
• Kollaborációk: nagy méretű, több intézetet magába foglaló projektek
• Cégek: globális vállalatok és ipari parnterkapcsolatok
• Környezetvédők: klíma megfigyelés és modellezés
• Oktatás & Képzés: virtuális tantermek és laboratóriumok
Grid @ CERNA Grid egy megoldás az LHC számítástechnika igényeire
CERN érintett sok Grid fejlesztési törekvésben világszerte
Grid @ CERN
• CERN projektek:LHC Computing Grid (LCG)
• EC finanszírozott projektek CERN vezetésével:European DataGrid (EDG) + others
• Ipar által finanszírozott projektek:CERN openlab a DataGrid alkalmazásaihoz
LHC Computing Grid (LCG)
Küldetés: • Grid felvonultatási projekt, egy működő Grid telepítésének céljával az LHC kísérletek támogatására, a detektorokból jövő adatok gyűjtésében és elemzésében
Stratégia:• A részt vevő több tucat intézet több ezer számítógépének integrálása globális mértékben egy egységes gépi erőforrássá
• Arra a szoftverre épülve, mely előrehaladott grid technológia fejlesztési projekteken kerül kivitelezésre, Európában és az Egyesült Államokban
LHC Computing Grid (LCG)
Részt vevők:
• Több mint 150 fizikus, számítástechnikai tudós és mérnök a partner kutatóintézetekből a világ minden tájáról
Idővonal:• 2002: kezdő projekt
• 2003: a szolgáltatás megkezdődik (Sept)
• 2002 - 2005: az LHC számítástechnikai környezetének előkészítése és felvonultatása
• 2006 – 2008: az LHC számítástechnikai kiszolgálás beszerzése, felépítése és működtetése
European DataGrid (EDG)
Küldetés: • A szükséges middleware kifejlesztése a Grid tesztágyon való futásához, Európa számítógépközpontjain
Kulcs tulajdonságok:• A legnagyobb szoftverfejlesztési projekt, amit az EU valaha is finanszírozott (9.8 millió euró)
• Három éves időszak a fejlesztésekre és a demókra (2001-2003)
• Három alkalmazási terület: Atomfizika, Földkutatás és Genetikai feltárás
European DataGrid (EDG)
Részt vevők: • 21 partner, több mint 150 programozó kutató és tudományos intézetekből, és ipari vállalatokból egyaránt
Állapot:• Tesztágy hozzávetőlegesen 1000 CPU-val, 15 telephelyen
• A middleware számos javított verziója (a végleges változat 2003-ban jött ki)
• A szoftver számos komponense integrálásra került az LCG-be
• A szoftvert partner projektekben is felhasználták: DataTAG, CROSSGRID
EGEE: Enabling Grids for e-Science in Europe
Küldetés: • 24/7 Grid kiszolgálás kézbesítése az európai tudomány felé; a Grid midleware termelésre való újratervezése és megerősítése; “piaci” Grid megoldások különböző tudományos közösségeknek
• Az első nemzetközi multitudományos produkciós Grid lehetőség
Kulcs tulajdonságok:• 100 millió euró/4 év
• >400 szoftvermérnök + kiszolgáló személyzet
• 70 európai partner
Egy produkciós szolgáltató GRID-hez való hozzáférés megváltoztatja a tudomány előrehaladását, és sokminden történt még Európában
Egy genetikus egy konferencián, megihletve attól amit hallott, képes lesz egy komplex
biomolekuláris szimulációt indítani mobiltelefonjáról.
Mérnökhalgatók csoportjai képesek lesznek a Grid használatával a legfrissebb 3D-s tervezőprogramokat futtatni laptpjaikon.
Egy tudósokból álló nemzetközi hálózat képes lesz modellezni a Duna új áradását valós időben, az európai központok meteorológiai és geológiai adatait felhasználva.
Az EGEE Jövőkép
Küldetés:• Transzantlantikus Grid kommunikációs hálózati megoldások kifejlesztése.
Állapot:• Friss adatátviteli sebességrekord: 1 TeraBájtnyi adatot vitt át egy óra alatt SLAC és CERN között (egyenértékű 200 DVD filmmel vagy egy CD-vel 2.3 másodpercenként).
DataTAG
GRACE
Háttér:• A mai keresőmotorok rendkívül központosítottak. Ahhoz hogy indexeljenek egy dokumentumot, le kell tölteniük, fel kell dolgozniuk és ellátni az indexszel – mindezt egy központi helyen.
Küldetés:• Egy decentralizált keresőmotor kifejlesztése, mely az információ dinamikus kategorizációját is nyújtja. Grid technológiát használva, és szemantikai eszközöket.
MammoGrid
Háttér:• A mammográfia segítségével felállított korai diagnózis javítja a prognózist, DE a begyűjtésnél a minőségirányítás, és a hatékony adatmenedzsment életbevágó.
Küldetés:
• Egy bemutató nyújtása a járványtani használathoz, minőségirányítás és a számítógéppel támogatott érzékelési algoritmusok kiértékelése.
Állapot:
• Egy olyan Grid-engedélyezett mammográfiai adatletét felépítése a kutatás és képzés kiszolgálása érdekében, mely elég nagy statisztikai mintákat tartalmaz.
CERN openlab a DataGrid alkalmazásainak
Küldetés: • Tesztágy az élenjáró Grid hardverek és szoftverek részére
• Ipari konzorcium a Grid-hez kapcsolódó közös érdeklődésnek örvendő technológiákért
• Kiképzőterep az új generáció mérnökeinek, hogy a Grid-ről tanulhassanak
Partnerek:• CERN• ENTERASYS• HP• IBM• INTEL
CERN openlab a DataGrid alkalmazásainak
CERN nyílt klaszter: • Egy ultramagas teljesítményű számítógépi klaszter felépítése • A DataGrid-hez való kapcsolása és a teljesítmény tesztelése• Az LHC számára hasznos jövőbeni technológiák lehetőségeinek kiértékelése
Diák Program:• diákcsoportok kézzelfogható tapasztalatokat szerezhetnek a legfrissebb Grid hardver és szoftvertechnológiákkal
• megnézhetik, hogyan fejleszti CERN partnereivel a Grid technológiát a különböző tudományos és ipari célokra
• külső laboratóriumlátogatások és speciális beszélgetések meghívások alapján
Grid @ CERN
The Grid Movie
Top Related