Fact Extraction from Wikipedia

13

Cutting Long Stories Short Fact Extraction from Wikipedia Marco Fossati fossati@spaziodati.eu Poznan, 25th June 2015

Upload
marco-fossati
Category

Technology
view
204
download
4

TAGS:

Embed Size (px):

Transcript of Fact Extraction from Wikipedia

Page 1: Fact Extraction from Wikipedia

Cutting Long Stories Short

Fact Extraction from Wikipedia

Marco Fossati [email protected]

Poznan, 25th June 2015

mailto:[email protected]

Page 2: Fact Extraction from Wikipedia

What?A Google Summer of Code Project for DBpedia

Page 3: Fact Extraction from Wikipedia

What?

Teaching Machines to Read

Natural Language

Page 4: Fact Extraction from Wikipedia

Why?Text Contains a Huge Amount of Knowledge

Page 5: Fact Extraction from Wikipedia

Why?

DBpedia Focuses on Semi-structured Data

Discovery of New Relations

Automatic Knowledge Base Population

Page 6: Fact Extraction from Wikipedia

How?

Machine Learning +

Lexical Semantics

Page 7: Fact Extraction from Wikipedia

How?

Poland victory World Cup 2014

“Poland won the World Cup in 2014”

Page 8: Fact Extraction from Wikipedia

Approach

1. Lexical Units

1.1.Extraction via POS Tagging

1.2.Statistical Ranking

2. Frame Database (FrameNet, Kicktionary)

The Data-driven Way

Page 9: Fact Extraction from Wikipedia

Approach

3. Frame + Frame Elements Classification

Unsupervised, Rule-based

Supervised

4. Crowdsourced Training Set Construction

5. RDF Serialization

The Data-driven Way

Page 10: Fact Extraction from Wikipedia

Crowdsourcing the AnnotationLabel words with Frame Elements

Page 11: Fact Extraction from Wikipedia

Use Case

Soccer Domain

Widely Represented (223.000 articles)

Lots of Semi-structured Data

Italian Wikipedia

Page 12: Fact Extraction from Wikipedia

Wanna contribute?

https://github.com/dbpedia/fact-extractor

https://github.com/dbpedia/fact-extractor

Page 13: Fact Extraction from Wikipedia

That’s all Folks!

Marco Fossati [email protected]

mailto:[email protected]

International Technology Alliance In Network & Information Sciences International Technology Alliance In Network & Information Sciences Fact Extraction.

International Technology Alliance In Network & Information Sciences International Technology Alliance In Network & Information Sciences Fact Extraction.

Using Wikipedia to Bootstrap Open Information Extractionhomes.cs.washington.edu/~weld/papers/weld-sigmod-rec08.pdf · Using Wikipedia to Bootstrap Open Information Extraction Daniel

Using Wikipedia to Bootstrap Open Information Extractionhomes.cs.washington.edu/~weld/papers/weld-sigmod-rec08.pdf · Using Wikipedia to Bootstrap Open Information Extraction Daniel

Wikipedia: redazione delle voci e scrittura collaborativaeventipa.formez.it/sites/default/files/allegati_eventi/Wikipedia... · I PILASTRI Wikipedia è un'enciclopedia Wikipedia ha

Wikipedia: redazione delle voci e scrittura collaborativaeventipa.formez.it/sites/default/files/allegati_eventi/Wikipedia... · I PILASTRI Wikipedia è un'enciclopedia Wikipedia ha

Feature Extraction for Recognizing MODI CharactersLipi.html [2] Modi alphabet-Wikipedia, the free encyclopedia.html [3] “Recognition of numerals of modi script using morphological

Feature Extraction for Recognizing MODI CharactersLipi.html [2] Modi alphabet-Wikipedia, the free encyclopedia.html [3] “Recognition of numerals of modi script using morphological

Fact Extraction (ideograph)

Fact Extraction (ideograph)

Content About Wikipedia About Wikipedia How to assess Wikipedia??? How to assess Wikipedia??? GOOGLE SEARCH – WIKIPEDIA GOOGLE SEARCH – WIKIPEDIA.

Content About Wikipedia About Wikipedia How to assess Wikipedia??? How to assess Wikipedia??? GOOGLE SEARCH – WIKIPEDIA GOOGLE SEARCH – WIKIPEDIA.

Wikipedia and Higher Education: Teaching with Wikipedia

Wikipedia and Higher Education: Teaching with Wikipedia

FEVER: a large-scale dataset for Fact Extraction and ...

FEVER: a large-scale dataset for Fact Extraction and ...

Information Extraction from Wikipedia: Moving Down the Long Tail Fei Wu, Raphael Hoffmann, Daniel S. Weld Department of Computer Science & Engineering.

Information Extraction from Wikipedia: Moving Down the Long Tail Fei Wu, Raphael Hoffmann, Daniel S. Weld Department of Computer Science & Engineering.

Dentistry - mx1.frankshospitalworkshop.commx1.frankshospitalworkshop.com/.../dental_units/wikipedia/Dentistry.pdf · Dentistry 2 (extraction of teeth), as well as performing examinations,

Dentistry - mx1.frankshospitalworkshop.commx1.frankshospitalworkshop.com/.../dental_units/wikipedia/Dentistry.pdf · Dentistry 2 (extraction of teeth), as well as performing examinations,

Doing wikipedia when you're not editing wikipedia

Doing wikipedia when you're not editing wikipedia

1stReading - uni-leipzig.deAutomatic Extraction of Semantic Relations from Wikipedia thediﬀerencesbetweenCandC.Asanexample,considerthefollowingWikipedia deﬁnitionofbicycle: Abicycle,oftencalledabike,isahuman-powered,pedal-driven,single-track

1stReading - uni-leipzig.deAutomatic Extraction of Semantic Relations from Wikipedia thediﬀerencesbetweenCandC.Asanexample,considerthefollowingWikipedia deﬁnitionofbicycle: Abicycle,oftencalledabike,isahuman-powered,pedal-driven,single-track

E cient Extraction and Query Benchmarking of Wikipedia Datajens-lehmann.org/files/2013/thesis_morsey.pdf · E cient Extraction and Query Benchmarking of Wikipedia Data Der Fakult

E cient Extraction and Query Benchmarking of Wikipedia Datajens-lehmann.org/files/2013/thesis_morsey.pdf · E cient Extraction and Query Benchmarking of Wikipedia Data Der Fakult

Malicious JavaScript Detection by Features Extraction · Malicious JavaScript Detection by Features Extraction 67 fact, change frequently the IP addresses espe-ciallywhentheyareblacklisted.

Malicious JavaScript Detection by Features Extraction · Malicious JavaScript Detection by Features Extraction 67 fact, change frequently the IP addresses espe-ciallywhentheyareblacklisted.

LOD2 Deliverable D3.1.1: Report on Knowledge Extraction ...jens-lehmann.org/files/2011/lod2_deliverable_3.1.1.pdf · Wikipedia article Sebastian Hellmann 0.9 2011-02-20 Finished Chapter

LOD2 Deliverable D3.1.1: Report on Knowledge Extraction ...jens-lehmann.org/files/2011/lod2_deliverable_3.1.1.pdf · Wikipedia article Sebastian Hellmann 0.9 2011-02-20 Finished Chapter

Natural Language Inference for Fact-checking in Wikipedia

Natural Language Inference for Fact-checking in Wikipedia

Structural, Transitive and Latent Models for Biographic Fact Extractionngarera/publications/biographyEACL09.pdf · Structural, Transitive and Latent Models for Biographic Fact Extraction

Structural, Transitive and Latent Models for Biographic Fact Extractionngarera/publications/biographyEACL09.pdf · Structural, Transitive and Latent Models for Biographic Fact Extraction

Improving First Order Temporal Fact Extraction with ... · Improving First Order Temporal Fact Extraction with Unreliable Data Bingfeng Luo 1, Yansong Feng1*, Zheng Wang2, and Dongyan

Improving First Order Temporal Fact Extraction with ... · Improving First Order Temporal Fact Extraction with Unreliable Data Bingfeng Luo 1, Yansong Feng1*, Zheng Wang2, and Dongyan

Fine-Grained Geographical Relation Extraction from Wikipedia

Fine-Grained Geographical Relation Extraction from Wikipedia

International Technology Alliance Programme: Fact Extraction using a Controlled Natural Language

International Technology Alliance Programme: Fact Extraction using a Controlled Natural Language

Languages

Pages

Legal

Copyright © 2022 FDOCUMENTS