Näin teet onnistuneen yhteisörahoituskampanjan nollabudjetilla
Miten teet journalistista metadata-annotoijan 30 sekunnissa
-
Upload
micke-hindsberg -
Category
Technology
-
view
203 -
download
1
description
Transcript of Miten teet journalistista metadata-annotoijan 30 sekunnissa
Journalistisen verkkosisällön
puoliautomaattinen sisällönkuvailu
Mikael Hindsberg, konseptisuunnittelija svenska.yle.fi @mickhinds | [email protected]
22.11.2013
Mikael Hindsberg, konseptisuunnittelija svenska.yle.fi @mickhinds | [email protected]
22.11.2013
Miten teet journalistista metadata-annotoijan 30
sekunnissa
Mikael Hindsberg, konseptisuunnittelija svenska.yle.fi @mickhinds | [email protected]
22.11.2013
Miten teet journalistista metadata-annotoijan 30
sekunnissa
Tästä lähdettiin - 2010
Tämä tehtiin 2011-2012
Uusi siältöajattelu“JUST NU!”
Uusi alustaDrupal 7
UusiorganisaatioDESK+
Totalfail :(
Epic
Win!
Jokainen sivu on etusivu
Metadata korvasi menut.
Kävijäliikenne
EtusivuHakukoneetSuositukset
Suositukset syy annotointiin
Svenska.yle.fi:n Onki-moduuli
Linked Data Finlandhttp://www.ldf.fi/
• Drupal 7• Onki moduuli
• https://drupal.org/node/1604784
• ARPA • http://www.seco.tkk.fi/services/arpa/
• KOKO • http://onki.fi/sv/browser/overview/koko
Demo:http://www.youtube.com/watch?v=3PX2_U50UTs
Lue lisää kehitysblogissamme: http://utveckling.ylebloggen.fi/tag/metadata/
ARPA
ARPA on verkkopalvelu automaattiselle tekstiannotaatiolle.http://www.seco.tkk.fi/services/arpa/
Suunnitelmissa siirtää osaksi Kansalliskirjaston Finto (Onki)-projektia, mahdollisesti 2015.
• MAUI https://code.google.com/p/maui-indexer/ • Maui automatically identifies main topics in text documents.
• Snowball http://snowball.tartarus.org/ • Snowball is a small string processing language designed for
creating stemming algorithms for use in Information Retrieval
• Omorfi https://code.google.com/p/omorfi/ • Open morphology for Finnish
• Connexor sv-sdg http://bit.ly/1h2wweN • sv-fdg analyses Swedish text according to a functional
dependency grammar
Metadatalla maailmalle
Google-hyötyä
Yle.fi
Svenska.yle.fi
(Syksy 2012)
Google-hyötyä
Konepellin alla
ARPA toiminnassa
ARPA
ARPA vs. journalisti annotoijana
ARPA:
• Skadestånd• Ägande• Marknad• Telefonförsäljning• Ask• Problem• Köpare• Kinesiska• Rykten
Journalisti:
• Försäljning• Aktier• Ägare• Mobiltelefoner• Mobiltelefonsystem• Bolagsstämmor
Onko ARPA:sta enemmän hyötyä vai haittaa?!
Haitat:
• Ei ole älykäs • Virheellisiä
ehdotuksia• Harhaanjohtavia
ehdotuksia• Ei löydä relevantteja
ehdotuksia• Ei osaa ehdottaa
leipätekstistä puuttuvia asiasanoja
• Antaa illuusion hyvästä asiasanoituksesta
• Hidastaa työnkulkua
Hyödyt:
• Nopeuttaa työnkulkua
• Antaa yleiskatsauksen käytössä olevista asiasnoista
• Antaa inspiraatiota ja assosiaatioita manuaaliseen annotaatioon
ARPA vastaanotto
Annotoito artikkelisi asiasanoilla?
AinaUseimmitenJoskusEi koskaan
ARPA vastaanotto
Käytätkö annotointiin ARPAa?
AinaUseimmitenJoskusEi koskaan
ARPA vastaanotto
Mitä tehdä ARPA:lle?
Pidä sell-aisenaanJatkokehitäEi väliäOta pois käytöstä
ARPA vastaanotto
Kouluarvosana:
6,5
FREEBASE-moduuli
Drupal 7+Freebase (API)
https://www.freebase.com/
Code sandbox:
https://drupal.org/sandbox/jaysire/2095551
• Ei ARPA-toiminnallisuutta• Toimijoita, paikkoja, tapahtumia, medioita
(kirjoja, musiikkia, elokuvia)• Rajattu pois yleiset asiasanat• Loistava valikoima asiasanoja (40M +)• Laatu hyvä, joskin epätasainen
ONKI + FREEBASE
Täydentävät hyvin toisiaan
• ONKI/FINTO antaa • Laatua• Suomalaista kontekstia • Tukea• Yhteistyötä
• FREEBASE antaa• Massaa• Kansainvälistä linkitystä• Aktiivisen yhteisön
Kiitos! Kysymyksiä?
Mikael ’Micke’ Hindsberg
twitter.com/mickhinds [email protected]
http://svenska.yle.fi http://utveckling.ylebloggen.fi
www.slideshare.net/mickhinds
By: aglet http://www.flickr.com/people/aglet/ CC BY-SA http://creativecommons.org/licenses/by-nc-sa/2.0/