Post on 06-Apr-2015
Forschungsschwerpunkt Biomedizinische Semantik
Stefan SchulzMUG-IMI, 2.3.2011
Grundannahmen
• Informationen in medizinischer Praxis und klinischer Wissenschaft werden kommuniziert:– vor allem anderen: in freitextlicher Form– strukturiert, aber mit proprietären Attributen / Werten (z.B. Archimed)– strukturiert mit standardisierten Werten– strukturiert mit numerischen Werten– als Biosignale
• Symbole (Zeichen) haben Bedeutungen– Symbole repräsentieren Denkeinheiten (Begriffe)– Zumeist Korrelate zu Objekten einer realen Welt– Interpretation des Benutzerkontextes fundamental
Ziel: Semantische Interoperabilität
Kommunikation ohne Bedeutungsverlust / -verzerrung: Vielfältige Probleme: • A1 möchte alle Patienten mit Magenulkus (K25) zählen,
aber A2 hat auch die Patienten mit Verdacht auf Magenulkus mit ICD-10:K25 kodiert.
• Magenulkus ist eine nicht kodierte Nebendiagnose. Freitextsuche nach „Magenulkus“ findet nicht Texte mit „Magenulcus“
• Suche auch erfolgreich bei Arztbriefen mit – „Magenulkus“in der Familienanamnese steht– „Der Patient bekam Omeprazol zur Prophylaxe eines Magenulkus
• Gastroskopieberichte mit „keine Ulzera“, „Ulzera können nicht ausgeschlossesn werden“
– Negation erkannt?– Magenulkus ausgeschlossen?
• Was ist mit „Stressulcus im Corpusbereich“ ? – Verarbeitung auf lexikalischer, semantischer und ontologischer Ebene
• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe
• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase
• Theorie der Realität- Kategorien- Axiome
• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus
• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger
Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“
Semantik findet auf mehreren Ebenen statt
• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe
• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase
• Theorie der Realität- Kategorien- Axiome
• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus
• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger
Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“
Terminologie Ontologie
Epistemologie
Semantik findet auf mehreren Ebenen statt
• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe
• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase
• Theorie der Realität- Kategorien- Axiome
• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus
• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger
Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“
Terminologie Ontologie
Epistemologie
Semantik findet auf mehreren Ebenen statt
Wortfragment-basierte
Dokumenten-indexierung
• Identifikation kleinster bedeutungstragender Elemente der Medizinsprache: Wortfragmente („subwords“)
• Gruppierung bedeutungstragender Wortfragmente • Erstellung eines Subword-Thesaurus• Nachweis des Vorteils bei sprachinternem und
sprachübergreifenden Dokumentenretrieval
• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe
• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….}
„krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase
• Theorie der Realität- Kategorien- Axiome
• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa= Mukosa + lokalisiert in =1 Magenkorpus
• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger
Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“
Terminologie Ontologie
Epistemologie
Indexierung durch Wortfragmente
abdominadenomakutanalysantibiotausmassbasisbiologblutchirurgchronidarmdatendiagnosteingriffempfindlichentzuendepidemiologexpressfamilifapfeinheredithinsichtlichhnpccimmunindikiortitiskarzinklinkolitiskolon
kombinkrankkrohnlymphmodalmolekulmultinonoperation ordnosispankreaspankreatperitonpolypprojektprophylaktpunktresektschwerpunktstellsuppressthematherapueber ulzerversuszeitzielzytzytokin
Indexierungdurch Subwort – Synonymklassen-IDs
qxxqkyyxyqwxyyxqkxzzkqyzyyzqkqkkqkkyqkqzzkyzxqkqqxqxkzqkqxkzkqxqqkkzzkqzyzqyyzyzkkzyxqkzqqyqqqkqxxzxqkzxkqqqqyyyzxkzxqkkkqkzzqkqqzkzyzqkqzzzqqzzyyyyyqkkqyzqqqkqzzkqkyzyyqqkkkkxyzqkzxqkyzkkzqxyqqkqkz
zzyqkkyzxqkzyzzqyzyyzqkqzkqkyzzkqzzkyzqkqqqxxkzyqqxkzxqqkxxqzkqzqzyyyzykykzyqkxzqqqzqkqkqzzxqkyyxkqqqyyyyzxkzxqkkqqkzzqqkzkzqkyqkqzzzqqzzyyqqkzqkqyzqqqqzzkkkyzykqqkkkyqxyzqkqqkqkqy
{entzuend; itis}
{pankreas; pankreat; bauchspeicheldrues}
{periton; bauchfell}
Evaluation
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
Recall
Prec
isio
n
Deutsch – Deutsch – Wortindex
Deutsch – Deutsch – Subwort- Synonymklassen
0,5
0,55
0,6
0,65
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
Recall
Prec
isio
n
Englisch – Englisch – Wortbasierter Index
Deutsch – Englisch – Subwort- Synonymklassen
Deutsch – Englisch – Automatische Anfrageübersetzung
0,5
0,55
0,6
0,65Szenario 1 Szenario 2
• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe
• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase
• Theorie der Realität- Kategorien- Axiome
• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus
• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger
Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“
Terminologie Ontologie
Epistemologie
Semantik findet auf mehreren Ebenen statt
Erstellen von Domänenontologien
• BioTop: – Festlegung fixer Kategorien und Relationen für die
Repräsentation grundlegender biomedizinischer Terme– Axiomatische Fixierung von „Grundwahrheiten“, die in der
medizinischen Wissenschaft und Praxis unumstritten sind und als „Trivialwissen“ wissensbasierten Anwendungen zur Verfügung gestellt werden
– Verwendung des Semantic-Web-Standards OWL
• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe
• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….}
„krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase
• Theorie der Realität- Kategorien- Axiome
• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa= Mukosa + lokalisiert in =1 Magenkorpus
• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger
Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“
Terminologie Ontologie
Epistemologie
BioTop: Beispiel
nach Klassifikation:
Einsatz von BioTop
• Als Top-Level-Ontologie in verschiedenen Projekten:– DebugIT (EU): institutionenübergreifende Identifikation von
Patientenrisiken: semantische Queries (z.B. bei welchen Patienten wurde die Medikation auf Grund eines Antibiogramms geändert)
– NTDO: Strukturierung von Wissen über vernachlässigte tropische Erkrankungenz.B. Welcher Erreger kann in welcher geographischen Region durch welches Insekt übertragen werden
– Ontologie medizinischer Lernziele (Informationsobjekte!)
• Als Exempel für „Good Practice Ontology Design“– BioTop beschränkt stark die „Freiheit“ des Ontologieentwicklers– Derzeit zusätzliche Ontology Design Patterns in Arbeit– Empirische Studie zu Ontologiedesign mit Versuchspersonen geplant
Sicherung der Qualität von
Domänenontologien (I)
• SNOMED CT– Riesige, zunehmend ontologiebasierte internationale
Terminologie für die Beschreibung der Inhalte elektronischer Krankenakten
– Mitglied im Content Committee der IHTSDO und im IHTSDO-WHO-Beirat
• Aufgaben: Erstellung von Modellierungsrichtlinien, Formulierung von Übersetzungsrichtlinien, Sicherung ontologischer Korrektheit
• Harmonisierung SNOMED – WHO-Klassifikationen, z.B. bei der Erstellung von ICD-11
• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe
• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….}
„krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase
• Theorie der Realität- Kategorien- Axiome
• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa= Mukosa + lokalisiert in =1 Magenkorpus
• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger
Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“
Terminologie Ontologie
Epistemologie
Sicherung der Qualität von
Domänenontologien (II)
• OBO (Open Biomedical Ontologies) Foundry– Mitwirkung bei der Erstellung von Modellierungsprinzipien– Qualitätschecks anhand von Stichproben:
Chordin isoform 1 unmodified form subclassOf Chordin isoform 1 and lacks_modification
some Post-translational protein modification
Ureter_Small_Cell_Carcinoma subclassOf Disease_May_Have_Finding some Pain
• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe
• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….}
„krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase
• Theorie der Realität- Kategorien- Axiome
• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa= Mukosa + lokalisiert in =1 Magenkorpus
• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger
Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“
Terminologie Ontologie
Epistemologie
• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe
• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….} „krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase
• Theorie der Realität- Kategorien- Axiome
• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus
• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger
Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“
Terminologie Ontologie
Epistemologie
Semantik findet auf mehreren Ebenen statt
• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe
• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….}
„krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase
• Theorie der Realität- Kategorien- Axiome
• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus
• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger
Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“
Terminologie Ontologie
Epistemologie
Ontologien und Terminologien im klinischen Kontext
• Beispiel: automatische Kodierung von Inhalten der elektronischen Patientenakte mittels SNOMED CT
• Quelle: Entlassberichte aus Krankenhaus in Brasilien (portugiesisch)
• Ziel SNOMED CT (spanisch, englisch)• Methode: NLP-Pipeline mit verschiedenen
Verarbeitungsschritten, u.a. morphosemantische Indexierung
sentencedetecting
spellchecking
acronymexpansion
NErecognition
POStagging
NPextraction
contextdetection
morpho-semanticabstraction
SCT - EN
SCT - SP
subsetcreation
morpho-semanticabstraction
MID-Representation
SNOMED CT
MID-Representation
Term candidates
Gold standard (kappa = 0.89)
Ergebnisse
Number of tokens (MIDs) Correct Mappings2 66%3 71%4 80%5 89%6 79%7 80%8 75%9 45%10 25%
Total 78 %
FehleranalyseCategory % Description
Extraction of NPs 20
MorphoSaurusmapping 24
no mapping (1/3) false mapping (2/3)
false context 3660 % negation40% other contexts
spelling problems 4
acronym problems 1
other errors 15
Kontext 1
death
acute abdomen
CTabdomen
aortic aneurysm
aneurysm-ectomy
vascular prosthesis
systemicinfection
multiple organ failure
vasoactive drug
hemodialysis
Patient admitted with acute abdomen. Abdominal CT: leaking abdominal aortic aneurism. Emergency aneurysmectomy with prosthesis. Postoperative evolution with systemic inflammatory response syndrome, multiple organ failure and hemodynamic instability. Despite application of vasoactive drugs, volume replacement and hemodialysis, the patient's condition worsened evolving to death.
death
death
Ontologie, z.B. SNOMED CT
Kontext 2
incisionalhernia herniorrhaphy
operation room
liver transplant
operation
• exists • doesn’t exist• reference to a
plan
operation
• reference to a suspendedplan
• exists • referenceto a plan
• NOT referringto the samepatient
• reference to a new plan
• not yet executed
Patient with incisional hernia admitted for herniorrhaphy, but operation was suspended because operation room was urgently needed for liver transplant. Discharged with orientation and rescheduled operation.
Ontologie, z.B. SNOMED CT
Automatisches vs. Manuelles Kodieren
Quality
Volume
fair motivation
low motivation
high motivationenough time
Automatisches vs. Manuelles Kodieren
Quality
Volume
fair motivation
low motivation
high motivationenough time ?
• Theorie der sprachlichen Zeichen- Synonymie, Homonymie- Oberbegriffe, Unterbegriffe
• z.B.: {„ulcus“, „ulkus“, „ulzer*“, „ulcer*“, „geschwür“, ….}
„krebs“: Krankheit oder Tier„blase“ : Harnblase oder Brandblase
• Theorie der Realität- Kategorien- Axiome
• z.B. materielles Objekt vs. Funktionvs. Prozess vs. QualitätKorpusmukosa = Mukosa + lokalisiert in =1 Magenkorpus
• Theorie des Wissens• Nichtwissen, unsicheres Wissen• Kontexte • z.B „Verdacht auf Magengeschwür“, „Ulcus ausgeschlossen“, „Bei langfristiger
Einnahme von Aspirin besteht das Risiko eines Magengeschwürs“
Terminologie Ontologie
Epistemologie
Beantragte / geplanteProjekte
• Eingereicht:– EU – NoE SemanticHealthNet: Harmonisierung semantischer EHR –
Standards– CEHRTAIN (IP): Prototyp sprachübergreifender EHR-Interoperabilität– RealEH: Semantische Aufarbeitung der elektronischen Krankenakte
zur Sekundärnutzung
• In Vorbereitung (gemeinsam mit JR + Averbis): Ö-Bridge und EU-SME – Antrag zu EHR – Retrieval + Summarization
• In Vorbereitung (gemeinsam mit Averbis + IHTSDO): Terminology Services / Cloud Computing
Auf purl.org/steschu Links zu Präsentationen und Publikationen