M ožnosti vizualizace dat a informací v medicíně

21
Možnosti vizualizace dat a informací v medicíně Lenka Lhotská [email protected] http://gerstner.felk.cvut.cz České vysoké učení technické v Praze Fakulta elektrotechnická

description

České vysoké učení technické v Praze Fakulta elektrotechnická. M ožnosti vizualizace dat a informací v medicíně. Lenka Lhotská [email protected] http://gerstner.felk.cvut.cz. Vizuální vnímání a porozumění. nejd ů le ž it ě jší prost ř ed e k poznávání a porozum ě ní sv ě tu - PowerPoint PPT Presentation

Transcript of M ožnosti vizualizace dat a informací v medicíně

Page 1: M ožnosti vizualizace dat a informací v medicíně

Možnosti vizualizace dat a informací v medicíně

Lenka Lhotská

[email protected]

http://gerstner.felk.cvut.cz

České vysoké učení technické v PrazeFakulta elektrotechnická

Page 2: M ožnosti vizualizace dat a informací v medicíně

Vizuální vnímání a porozumění

• nejdůležitější prostředek poznávání a porozumění světu

• schopnost vidět vzory ve věcech

• spojit části do smysluplného celku

• zkušenost

• schopnost odvozovat význam z oddělených a různorodých elementů

Page 3: M ožnosti vizualizace dat a informací v medicíně

Vizualizace

• Integrace výzkumných aktivit člověka s výpočetní silou počítačů

• Zpřístupnění dat, výpočtů a výsledků• Porovnání a verifikace výsledků

Page 4: M ožnosti vizualizace dat a informací v medicíně

Nástroje pro vizualizaci dat

• Cíl – snížit informační zatížení

• Inteligentní abstrakce

• Vizualizace zajímavých příznaků

• Zobrazení složitých vztahů mezi daty

Page 5: M ožnosti vizualizace dat a informací v medicíně

Vizualizace lékařských dat

• Využití obrazové informace – MRI, PET, CT • Grafické zobrazení dat a informací jiného než

obrazového charakteru (jednorozměrné signály, numerická data, apod.)

Page 6: M ožnosti vizualizace dat a informací v medicíně

Analýza a úprava jednotlivých atributů I.

• Zpráva o stavu proměnných – typ (spojitá X diskrétní)– rozsah definičního oboru (počet použitých hodnot)– rozsah a frekvence výskytů (histogram)– typ rozdělení a jeho statistické charakteristiky

• Upozornit na – osamělé mimořádné hodnoty (outliers)– téměř konstantní atributy (možné vynechat)– nevyplněná datová pole– znečištění dat

• data neodpovídají deklarovanému formátu• hodnoty neodpovídají deklarované množině

Page 7: M ožnosti vizualizace dat a informací v medicíně

Analýza a úprava jednotlivých atributů II.

Příklady úprav• Náhrada chybějících údajů - provádí se tak, aby zůstala zachována hodnota

směrodatné odchylky uvažovaného atributu• Úprava rozsahu hodnot atributů pomocí logistické transformace (velmi důležité v

každé metodě, která počítá se vzdáleností objektů - např. CBR, nejbližší sousedi, shlukování)

g (x) = (1 + e –a - bx) –1

0

0.2

0.4

0.6

0.8

1

-6 -4 -2 0 2 4 6

x

g(x

)

a=0, b=1 a=0, b=2 a=0, b=4

Page 8: M ožnosti vizualizace dat a informací v medicíně

Analýza a úprava jednotlivých atributů III.

• Monotónní atributy – představují obvykle jednoznačnou identifikaci pro uvažované objekty, např. pořadové číslo měření, číslo bankovního účtu. Rostou bez omezení a při tom jejich přímá hodnota jako taková nemá pro vytvoření modelu význam.

• Řady – tvořené hodnotami veličin, které jsou pravidelně měřeny a zaznamenávány (např. EKG, burzovní koeficienty). Vždy jsou vztaženy k jediné monotónní veličině, která slouží jako index.– často jako index slouží čas -> časová řada– Prostředky k analýze:

• Fourierova analýza• Vlnková (wavelet) transformace umožňuje získání

časově-frekvenčního popisu signálu

Page 9: M ožnosti vizualizace dat a informací v medicíně

Úpravy a analýza dat ve stav.prostoru I.

Příklady úprav• Snížení dimenze

– vynecháním• konstantních atributů• atributů řídce obsazených• atributů s duplicitní informací (rok narození X věk, apod.)

– sloučením• atributů řídce obsazených – z několika řídce obsazených atributů je možné

zřetězením vytvořit jeden nový (PVP - present value pattern)

• Zvýšení dimenze – obohacení doplněním údajů z jiných zdrojů (např. meteorologická měření,

demografické údaje, apod.)– rozšíření

– přidání odvozených atributů (např. pohlaví z rodného čísla, apod.)– „otočení“ dat (reverse pivoting) - nový atribut an+1 přebírá údaj z objektu

následujícího. Pro každý objekt i platí an+1(i) = an(i+1).

Page 10: M ožnosti vizualizace dat a informací v medicíně

Úpravy a analýza dat ve stav.prostoru II.

Příklady úprav• Agregace dat - použití metod datových skladů. údaje o více objektech obsažené

na několika řádcích jsou vztaženy k jedinému obecnějšímu objektu (tvoří tedy v novém souboru jedinou řádku).

• Vizualizace – např. umístění datového souboru ve stavovém prostoru úlohy, přirozené shluky, nepravidelné deformace,...

• Statistické přístupy snižování dimenze– podmíněná entropie– CHAID (Chi-square Automatic Interaction Detector)– hledání hlavních komponent (návrh vhodné lin. kombinace)

• Využití neuronových sítí - Řídce propojená autoasociativní neuronová síť (Sparcely Connected Autoasociative Neural Net: SCANN)

Page 11: M ožnosti vizualizace dat a informací v medicíně

SumatraTT

Page 12: M ožnosti vizualizace dat a informací v medicíně

Sumatra TT – rozptylový diagram

Page 13: M ožnosti vizualizace dat a informací v medicíně

Sumatra TT – grafy vybraných proměnných

Page 14: M ožnosti vizualizace dat a informací v medicíně

Sumatra TT – histogram

Page 15: M ožnosti vizualizace dat a informací v medicíně

Sumatra TT – histogram

Page 16: M ožnosti vizualizace dat a informací v medicíně

Sumatra TT – rozhodovací strom

Page 17: M ožnosti vizualizace dat a informací v medicíně

Sumatra TT – rozptylová matice

Page 18: M ožnosti vizualizace dat a informací v medicíně

Sumatra TT

Page 19: M ožnosti vizualizace dat a informací v medicíně

Sumatra TT – vztahy mezi atributy

Page 20: M ožnosti vizualizace dat a informací v medicíně

Další možnosti zobrazení

• Frekvenční spektrum• Výkonové spektrum• Spektrální kulisy• Mapy

• Interaktivní zobrazení – mapa + průběh signálu

• Tyto možnosti budou prezentovány v dalších příspěvcích v konkrétních aplikacích.

Page 21: M ožnosti vizualizace dat a informací v medicíně

Závěr

• medicína – velké objemy dat• větší počet přístrojů přímo propojených s počítači -

více vstupních dat pro vyhodnocování• efektivní vyhodnocování velkého objemu dat• často neznámé explicitní relace mezi daty - obtížná

interpretace - nástroje dobývání znalostí• integrace s vizualizačními nástroji – podpora

rychlejšího porozumění složitým, velkým a dynamicky rostoucím souborům dat