WEB & MEDIA ... Enrichment ¢â‚¬¢ Personalized Semantic Search...

download WEB & MEDIA ... Enrichment ¢â‚¬¢ Personalized Semantic Search ¢â‚¬¢ Mobile Museum & City Tours ¢â‚¬¢ Interactive

of 75

  • date post

    30-May-2020
  • Category

    Documents

  • view

    0
  • download

    0

Embed Size (px)

Transcript of WEB & MEDIA ... Enrichment ¢â‚¬¢ Personalized Semantic Search...

  • WEB & MEDIA GROUP TOPICS FOR MSC PROJECTS

  • Jacco van Ossenbruggen

    Johan Oomen

    Guus Schreiber

    Tobias Kuhn

    Lora Aroyo Victor de Boer

    Jan Wielemaker Valentina Maccatrozzo

    Davide Ceolin

    Anton Eliens

    Antske Fokkens

    Martine de Vos

    Antoine Isaac

    Chris Welty

    Benjamin Timmerman

    s

    Oana Inel

    Anca Dumitrache

    Dena Tahvildar

    i

    Xander Wilcke

    Ronald Siebes

  • http:/ / wm.cs.vu.nl/

    http://wm.cs.vu.nl/

  • http:/ / wm.cs.vu.nl/

    http://wm.cs.vu.nl/

  • • Social Sciences • Communication Sciences • Languages • History

    Above Water Systems

    WE WORK WITH ….

  • MSC PROJECTS THEMES

    Data, Analysis & Visualization

    Cultural Heritage, Web & Visitors

    Collection & Metadata Enrichment

    Future TV & Web

    Crowdsourcing & Social Web

    Interactive Mobile & Web Apps

  • • experimenting • exploring & analytics • to be driven by curiosity • pragmatics-oriented approaches • creative working spirit • having fun • general 'hacker' attitude … then these are the right projects for you

    IF YOU LIKE ….

  • CULTURAL HERITAGE, THEIR VISITORS & THE WEB INTERACTIVE INTERFACES

    PROJECTS

  • • Museum, Libraries, Archives Collection Enrichment

    • Personalized Semantic Search • Mobile Museum & City Tours • Interactive Multitouch Applications • Innovative Interactive User Interfaces • Games with a purpose • Crowdsourcing for Video & Image Tagging • and much more ....

    CULTURAL HERITAGE, THEIR VISITORS & THE WEB, UIS

  • - Het Netwerk Oorlogsbronnen (NOB) wil samen bouwen aan een verbeterde digitale toegang tot de Nederlandse collectie over de Tweede Wereldoorlog

    - collecties van circa 400 instellingen digitaal (beter) bruikbaar en vindbaar te maken & ontwikkelen van een digitale basisdiensten die helpen relevante informatie over de Tweede Wereldoorlog te vinden. Dit zijn (semantisch) gestructureerde informatievoorzieningen en innovatieve digitale diensten om digitale bronnen toegankelijk te maken op gebied van “Wie”, “Wat”, “Wanneer” en “Waar”.

    - NOB is een samenwerkingsverband van erfgoedinstellingen met WO2- collecties, gefaciliteerd door het NIOD Instituut voor Oorlogs-, Holocaust- en Genocidestudies. www.oorlogsbronnen.nl

  • Tekst mining

    • De portal van het Netwerk Oorlogsbronnen bevat op dit moment 10 miljoen digitale objecten. De komende jaren zal dit aantal enorm groeien. De meeste objecten zijn beperkt gemetadateerd. De metadata is bovendien vaak ongestructureerd. Of de relevante informatie voor gebruikers en onderzoekers is als lopende tekst in beschrijvingsvelden opgenomen.

    • In veel gevallen zijn kranten en archieven full text geautomatiseerd. Zonder enige structuur.

    • Wij zijn op zoek naar geautomatiseerde mogelijkheden om met behulp van namen, plaatsen en inhoudelijke trefwoorden te herkennen in teksten en gematchte bronnen te markeren.

    • Doel van deze stage is het terrein van geautomatiseerde matching te verkennen en bij voorkeur een werkende oplossing (tool, applicatie…) op te leveren.

  • Personenportal Het NOB werkt samen met een aantal archieven, musea en herinneringscentra aan het ontwikkelen van een Personenportal. In deze personenportal worden personen/individuen vastgelegd (vanuit namenlijsten, archieven, persoonsdossiers enzovoorts) met relevante biografische gegevens en verwijzingen naar (digitale) bronnen. Doel van de portal is dat mensen vanuit 1 portal kunnen zien in welke transporten of kampen familieleden hebben gezeten. Of welke Nederlanders waar gevochten hebben (zowel in het Nederlands leger, als in het verzet als aan Duitse zijde enzovoorts).

    Voor de personenportal zoeken wij: Stagiair RDF modelling semantisch structureren van persoonsgegevens Doel van deze stage is het ontwikkelen van een Linked Open Semantisch model voor vastlegging van personen. - Op dit moment zijn er heel verschillende, vaak lokaal ontwikkelde datamodellen voor

    persoonsgegevens. - De gegevens uit verschillende bronnen dienen via Linked, Open, Interoperabele

    structuren samengebracht en gedeeld te worden. Stagiair retrieving en matching personen uit semi gestructureerde bronnen Doel van deze stage is het ontwikkelen van methodes en sripts om uit semi gestructureerde bronnen - personen te identificeren en geautomatiseerd te voorspellen of verschillende

    verwijzingen dezelfde persoon betreffen

  • Webanalyse De website oorlogsbronnen.nl ondergaat momenteel een transformatie. We maken de website meer netwerk-georienteerd. Een van de doelstellingen is daarnaast om webanalyses uit te voeren. Naast een aanpassing in de interface wordt die functionaliteit ook meegenomen (met name wat betreft de portal). De website is het centrale platform van NOB en we zijn benieuwd wie ons wanneer en naar welke tevredenheid bezoekt, en niet onbelangrijk: onze bronnen gebruikt! We zoeken een stagiair die kundig is in het maken van webanalyses, in het speciaal van portalen. Van de website oorlogsbronnen.nl in het algemeen denken we aan informatie als: - Bezoekersaantallen en –profielen (geografische standplaats) en verder gedrag (paginabezoek,

    duur van bezoek, van waar binnenkomst oorlogsbronnen.nl – vindbaarheid via Google speelt hiermee samen - , etc.) uitgewerkt.

    Over het gebruik van de portal willen we graag weten: - Zoekopdrachten in portal: welke termen zijn ingevoerd (percentages)? Welke resultaten bij

    zoekopdrachten? Verder doorklikgedrag. - Gebruik van filters in portal: Algemeen gebruik maar ook in welke fase van de zoekopdracht

    worden deze gebruikt? Daarnaast: Aanbevelingen voor de uitvoer van een structurele webanalyse. Doel is om met name resultaten uit de portal-analyse te gebruiken voor verbetering. Door bijvoorbeeld veelgebruikte zoektermen op te nemen in de WO2-thesaurus.

  • ENRICHING MUSEUM COLLECTIONS

    http:/ / chip.win.tue.nl/

    http://chip.win.tue.nl/

  • CONTROCURATOR Crowds and Machines for Modeling and Discovering Controversy

    Summarization of high profile and catastrophic events in broadcast news & social media: • How to combine machine learning and crowd

    annotations to improve on the identification of salient sub- events?

    • How to present and visualize narrative results and

    timelines of events to help media professionals create news stories?

  • oana.inel@vu.nl

    http:/ / dive.beeldengeluid.nl collaboration with Sound & Vision

    Contextualizing information in videos • identify meaningful information/keywords (events, keywords, entities) in videos

    (content, synopsis, subtitles) • plot the keywords in the timeline of the video

    Ranking events in videos based on • identifying the main event and its sub-events • relevance and/or salience to the video • event enrichment with participating entities such as people, location and other concepts

    mailto:lora.aroyo@vu.nl http://agora.cs.vu.nl/demo/

  • http:/ / dive.beeldengeluid.nl

    REPRESENTING HISTORICAL NARRATIVES

    (Media) historians find and collect data and media online (for example with the DIVE tool). They collect these into proto-narratives, but when they are publishing it, they write it down in non-interactive formats. ● How can we develop richer Linked Media Narratives instead of boring

    old papers? ● What is a good ontology for media narratives (nanopublications?) ● Can we generate nice-looking web publications out of these narratives?

    http://agora.cs.vu.nl/demo/

  • lora.aroyo@vu.nl

    http:/ / crowdtruth.org/ collaboration with IBM

    Crowdsourcing Experiments for UI Design for Templates • perform comparative evaluation of different design choices • defining optimal template designs for different tasks How can you capture data ambiguity? • is ambiguity related to template design or to disagreement between annotators?

    mailto:lora.aroyo@vu.nl http://crowdtruth.org/

  • Crowdsourcing Games for Art Annotations

  • Reasoning and representation of Dance

    Different representations for Dance and expressive movement exist (for example Labanotation). However, there is a disconnect between the low-level representations and higher-level creative reasoning. ● Investigate opportunities for semantic

    represtations of Dance / creative movement

    ● Explore possibilities for machine learning

    and other techniques for semi-automatic choreography

  • DATA ENRICHMENT FOR MUSEUM, LIBRARIES, ARCHIVES & TV

    PROJECTS

  • ANALYSIS OF THE EUROPEANA SOCIAL MEDIA PRESENCE

    • Interested in business information analysis? • Want to explore what is the influence of social

    media on visibility, business relations, etc?

    • Want to know how to provide effective and efficient strategies with Social Media, based on user log analysis?