Klantgericht informatie opsporen en rapporterenwebzoek.pbworks.com/f/bronnen-utrecht.pdf · via...

Een aangepaste cursus voor Landelijk Kennisinstituut Cultuureducatie en Amateurkunst

Eric Sieverts november 2015

Klantgericht informatie

opsporen en rapporteren

discoverybronnen in het informatielandschap

programma 9 november

"discovery"

het informatielandschap

bronnen en zoeksystemen op internet

zoektechnieken voor gestructureerde zoeksystemen en

voor webzoekmachines

zoekstrategieën

2

programma 30 november

"delivery"

Q&A n.a.v. 9 november

aan documenten zelf komen

attenderingsdiensten en -technieken

nabewerken, bewaren en verspreiden van gevonden

informatie en documenten

3

het informatielandschap

primaire, secundaire en tertiaire informatiebronnen

hoeveel is er?

soorten bronnen en hun zoekingangen

1. boeken en (wetenschappelijke) artikelen

2. nieuws

3. oude informatie

4. blogs, feeds

5. twitter, facebook, social

6. beeld & geluid

7. naslag

8. data

gespecialiseerd versus algemeen

4

primaire informatie(bronnen)("de informatie zelf")

artikelenuit kranten

uit tijdschriften

uit vakbladen

uit wetenschappelijke tijdschriften

boeken

preprints van artikelen

rapporten

projectbeschrijvingen

productinformatie

bedrijfsgegevens

oktrooien

standaarden

encyclopedieën

discussies

........

5

secundaire informatiebronnen(verzamelde en -vaak- gestandaardiseerde gegevens

over/uit primaire informatie en daarnaar verwijzend)

onderwerpsbibliografieën

bibliografische databases

bibliotheekcatalogi

onderwerpsgidsen / startpagina's / subject guides / resource guides op het

web

platforms voor delen van informatie (zoals Mendeley, CiteULike, ZEEF, ....)

vakgerichte weblogs

online directories (adresboeken)

databanken met feitelijke gegevens (bedrijfsgegevens,

materiaaleigenschappen, ...)

vaak ook wat meer secundair dan primair zijn:

"annual reviews"

overzichtsartikelen

encyclopedieën

6

https://www.mendeley.com/

http://www.citeulike.org/

https://zeef.com/

"tertiaire" informatiebronnen(verzamelingen van verwijzingen naar secundaire informatie)

bibliografieën van bibliografieën (bijv.: "Bibliographic Index")

database-guides; bijvoorbeeld:

"Gale Directory of Databases"

gids van web-databases & onderwerp-specifieke zoekmachines;

bijvoorbeeld:

Search Engines Directory

overzichten van vakgerichte "resource guides" (onderwerpsgidsen)

www virtual library

internet public library [na juni 2015 niet meer geüpdate]

startnederland.nl

........ er zijn helaas geen redelijk volledige,

up-to-date overzichten meer van

dit soort diensten op het web

7

http://www.worldcat.org/title/bibliographic-index-plus/oclc/427782584

http://www.gale.cengage.com/pdf/facts/gdofdatabase.pdf

http://www.searchengineguide.com/searchengines.html

http://vlib.org/

http://www.ipl.org/

http://www.startnederland.nl/

voorbeelden

voorbeeld wetenschap voorbeeld web

primaire bronnen wetenschappelijk artikel in

Journal of Psychiatry &

Neuroscience

[artikel]

web-site voor product

"Chief architect" (CAD software

voor architecten)

secundaire bronnen uit database PubMed

uit database PsycInfo

"The CAD WWW Virtual

Library" onderwerpsgids /

resource guide voor Computer

Aided Design

"tertiaire" bronnen [beschrijving Psycinfo uit

Gale Directory of Online

Databases]

WWW Virtual Library subject

resource guides

startnederland.nl startpagina's

verzamelplek

doorzoekbare

bronnen

betaalde diensten als Ovid,

LexisNexis, Ebsco, Dialog

universiteitsbibliotheken

[deels alleen ter plekke]

Google Scholar [niet alle

resultaten gratis]

web-zoekmachines

algemene web-directories

gespecialiseerde zoeksites

8

http://jpn.ca/

http://jpn.ca/wp-content/uploads/2014/04/37-6-399.pdf

http://www.chiefarch.com/

http://www.ncbi.nlm.nih.gov/pubmed/22640702

http://webzoek.pbworks.com/f/schizo.htm

http://www.caddprimer.com/library/

http://webzoek.pbworks.com/f/psyc.htm

http://vlib.org/

http://www.startnederland.nl/

http://scholar.google.com/

wat kwantitatieve gegevens

Google / Yahoo / Bing (?) > 500 miljard webpagina's, PDF's, PPT's enz.

LexisNexis (host) 5 miljard full-text artikelen en andere

database-records

Dialog (host) 4 miljard database-records

Scopus (database) 50 miljoen database-records

Pubmed (database) 24 miljoen database-records

OpenDirectory 5 miljoen websites

internet databases(volgens "Complete Planet" anno 2007)

70.000 allerlei types databases en

"specialty" zoekmachines

online databases(volgens "Gale-directory")

25.000 allerlei types databases

9

diverse schattingen:

ca. 500 miljard

geïndexeerde pagina's

zie:

Eric Sieverts. Van Lycos tot Google

in: NRC 9 februari 2013, special

"Slimmer zoeken op internet"

http://sieverts.pbworks.com/f/

NRC_Lycos_Google.pdf

hoeveel?Google in 2014:

6x1013 URLs (60 biljoen)

10

zoekmachines: dekking

Google kent 60.000.000.000.000 URL's (dus webpagina's)daarvan zijn er ~500.000.000.000 (??) geïndexeerd (<1%)veel zijn namelijk doublures en rankspamgeen harde cijfers te vinden over doorzoekbare aantallen ook niet over verhouding tussen de zoekmachinesmijn indruk: Google, Bing en Yahoo

vergelijkbaar in grootteGoogle nu ~10x zo groot als kleinere

dekking ongelijkmatig

verschil in actualiteit

verschil in dekking verschil in ranking (vaak zeer weinig overlap bij eerste 10)

NB:gemelde resultaataantallen zeer onbetrouwbaar

11

dit handige vergelijkingstooltje

werkt helaas niet meer

12

wat vind je niet?

recente webpagina’s/wijzigingen

bij zoekmachine nog niet bekende pagina's

deel "real-time" web

lange pagina’s met gezochte term alleen onderaan (?)

dynamisch gegenereerde pagina’s (soms)

informatie in databases

pagina’s met toegangsrestricties

verdwenen pagina’s (maar: cache van zoekmachines en

Wayback Machine archive.org)

wat kun je ook nog proberen? >>

13

http://archive.org/

meer webzoekmachines dan Google

probeer naast Google eens:Bing (microsoft, groot)

Yahoo! (content=Bing, groot)

DuckDuckGo (verzekert privacy, geen personalisatie, tamelijk klein)

Exalead (frans, tamelijk klein, veel geavanceerde functies)

Gigablast ("groene" zoekmachine, tamelijk klein, paar unieke functies)

Ask (tamelijk klein, weinig unieks meer)

MillionShort (resultaten van miljoen / 100.000 / ... top sites weggelaten)

in US hebben die samen nog 30% marktaandeel; in NL maar 3%

Yandex (Russische zoekmachine)

Baidu (Chinese zoekmachine)

Naver, Daum (Koreaanse zoekmachines)

in eigen land hebben die groter marktaandeel dan Google

15

http://www.google.com/

http://www.bing.com/

http://search.yahoo.com/

http://duckduckgo.com/

http://www.exalead.com/search/

http://gigablast.com/

http://www.ask.com/?o=312&l=dir

http://millionshort.com/

http://www.yandex.com/

http://www.baidu.com/

http://www.naver.com/

http://www.daum.net/

bijlagen

16

zie "Zicht op de veelheid aan bronnen op internet"

voor informatie over octrooien, digitale colleges,

rapporten, bedrijfsgegevens, projecten, kaarten,

etc.

(http://sieverts.pbworks.com/f/internetbronnen.pdf)

zie lijst aanklikbare URL's van hier genoemde

systemen op

http://webzoek.pbworks.com/resources-plus

zie voor de hele cursus ook het materiaal op

http://ericonline.pbworks.com/f/online1.htm

en vervolgpagina's

http://sieverts.pbworks.com/f/internetbronnen.pdf

http://sieverts.pbworks.com/f/internetbronnen.pdf

http://webzoek.pbworks.com/resources-plus

http://ericonline.pbworks.com/f/online1.htm

informatiebronnen en hun zoekingangen (de zoektools)

welke verdere Googles (en Bing’s) zijn er allemaal?

(image-, blog-, video-, news-, book-, scholar-, groups-search,

maar meeste ook geïntegreerd in gewone Google)

kun je met die Googles alles vinden?

welke alternatieven zijn er voor die Googles?

zie bijv. trovando.it http://www.trovando.it/

of wiinkz http://www.wiinkz.com/

alternatieven voor het diepe (en betaalde) web

17

http://www.trovando.it/

http://www.wiinkz.com/

1. boeken & (wetenschappelijke) artikelen

boekenGoogle Books

Hathitrust Digital Library (open book scan project)

Delpher (gedigitaliseerde boeken -en kranten- van de KB en NL-univ.)

Internet Archive (gedigitaliseerde boeken, niet full-text te doorzoeken)

Amazon (ook reviews, inhoud, boek-boek citaties)

Worldcat (catalogus van 10.000 bibliotheken met postcode-functie)

Librarything (catalogus van 58.000.000 boeken van 1.000.000 bezitters)

GoodReads (reviews, recommandatie, vrienden, ...)

Picarta

Bibliotheek.nl

DOAB (directory of open access books)

Open Textbook Library (open access leerboeken)

enz.

artikelen (e.d.)

enz.

18

http://books.google.com/

http://www.hathitrust.org/

http://www.delpher.nl/

https://archive.org/details/texts

http://www.amazon.com/exec/obidos/tg/browse/-/283155/ref=tab_b_b_3/103-8572427-8813412

http://www.worldcat.org/

http://www.librarything.com/

http://www.goodreads.com/

http://www.picarta.nl/

http://zoeken.bibliotheek.nl/

http://www.doabooks.org/doab

https://open.umn.edu/opentextbooks/

boeken: Google Books

van kaft tot kaft gescand (en doorzoekbaar!)

sterk voor ontdekken van niet-hoofdinhoud van boeken

vaak beperkt doorbladerbaar

(no preview / snippet view / limited preview / full preview)

content via uitgevers en via grote bibliotheken

probleem met copyrighted materiaal uit bibliotheken

vergeleken met Amazon search inside: meer oud, minder recent

ook ‘My Library’ optie vb

> 30 miljoen boeken (+ nu ook enkele ‘magazines’)

NL-boeken niet alleen uit Gent en KB, ook uit US/UK

metadata op about-this-book-pagina

bibliotheken linken vanuit catalogus (bijv. Picarta)

interessante woordfrequentie-analyses met ngram viewer

19

http://www.google.com/books?hl=en&uid=2211035229203718974

https://books.google.com/ngrams

20

https://www.google.com/search?num=100&hl=en&authuser=0&tbm=bks&q=gershwin+Rialto+Ripples&oq=gershwin+Rialto+Ripples&gs_l=serp.3...429114.432387.0.433813.10.8.0.2.2.0.66.442.8.8.0...0.0...1c.1.5.serp.torAHX2BdK8

https://www.google.com/search?num=100&hl=en&authuser=0&tbm=bks&q=gershwin+Rialto+Ripples&oq=gershwin+Rialto+Ripples&gs_l=serp.3...429114.432387.0.433813.10.8.0.2.2.0.66.442.8.8.0...0.0...1c.1.5.serp.torAHX2BdK8


boeken

artikelen (e.d.)

Google Scholar (wetenschappelijke artikelen, rapporten, proefschriften, ...)

Microsoft Academic (wetenschappelijke artikelen, ...)

RefSeek, Virtual LRC (wetenschappelijke artikelen en webpagina's)

sEURch / UvA-library / MIT / UGA, ... (universitaire "discovery tools")

ScienceDirect (artikelen van Elsevier)

BASE / OAIster (uit academische repositories / Open Access)

Paperity (aggregator van Open Access artikelen - nog in opbouw)

NARCIS (40.000 proefschriften, 600.000 publicaties [veel artikelen] uit NL)

DOAJ (artikelen in Open Access tijdschriften)

SciELO (Spaans/Portugees-talige wetenschappelijke artikelen)

Magportal (ook -Engelstalige- publiekstijdschriften)

DeepDyve (wetenschappelijke artikelen "ter inzage")

enz.

enz.

24

http://scholar.google.com/

http://academic.research.microsoft.com/

http://www.refseek.com/

http://www.virtuallrc.com/

http://www.eur.nl/ub/nederlands/zoeken/seurch/

http://lib.uva.nl/primo_library/libweb/action/search.do?vid=UVA

http://eds.a.ebscohost.com/eds/search/basic?sid=1d27f50b-a05e-449b-a713-0ae02b086eb0@sessionmgr4004&vid=2&hid=4110

http://eds.a.ebscohost.com/eds/search/basic?sid=54366052-2874-47c7-a2fa-31ab7eada57b@sessionmgr4001&vid=2&hid=4110

http://www.sciencedirect.com/

http://www.base-search.net/

http://oaister.worldcat.org/

http://paperity.org/

http://www.narcis.info/index

http://www.doaj.org/doaj?func=searchArticles

http://www.scielo.org/php/index.php?lang=en

http://www.magportal.com/

http://deepdyve.com/

wetenschap: Google Scholar

> 100 miljoen wetenschappelijke publicaties

verschil full record en aanwezigheid als ‘citation’

verschil full-text links en bibliografische links

concurrent voor Web of Science, Scopus, Picarta, BASE,

OAIster, DOAJ, Ingenta

gericht geïndexeerd in vele bronnen (uitgevers, abstract-

databases, universiteiten, repositories, ...)

met citaties!

aantallen citaties mede gebruikt voor ranking(waardoor recente publicaties relatief laag scoren)

....>>

25

wetenschap: Google Scholar

....

advanced search beperkt, nog veel fouten door computer-

generated metadata

van zoekresultaat naar volledige tekst vaak een probleem

(niet aanwezig, alleen tegen betaling)

soms veel versies van artikel (waaronder wel gratis)

wel zichtbaar welke artikelen gratis versie hebben

Google Scholar library programme koppelt aan eigen

bibliotheekbezit: links naar eigen toegangen / link-resolver

geen info over bronnen, updates

26

## citaties/

aangehaald

open access

abonnement univ. utrecht

als dit artikel interessant is,

dan deze 23 recentere waarschijnlijk ook

27

http://scholar.google.com/scholar?q=gershwin+summertime++&btnG=&hl=en&as_sdt=0,5

http://scholar.google.com/scholar?q=gershwin+summertime++&btnG=&hl=en&as_sdt=0,5

werkt vaak

niet goed

29


boeken

artikelen (e.d.) vakspecifiek zoeken (gratis zoekingangen; soms alleen de metadata)

geneeskunde: Pubmed (bibliografisch),

PLoS-one (open-access tijdschrift - full-text)

economie: RepEc (repository)

wiskunde, informatica: CiteSeer (repository)

onderwijs: ERIC (bibliografisch)

(hoge energie-) fysica: SPIRES-HEP (bibliografisch),

ArXiv (full-text preprint server)

bibliotheekwetenschap: LISTA (bibliografisch)

humanities (vooral): JURN (deels full-text)

filosofie: International Philosophical Bibliography

transport: TRID (bibliografisch)

enz.

30

http://www.ncbi.nlm.nih.gov/entrez/query.fcgi

http://www.plos.org/

http://ideas.repec.org/

http://citeseerx.ist.psu.edu/

http://www.eric.ed.gov/

http://inspirehep.net/

http://arxiv.org/

http://www.libraryresearch.com/

http://www.jurn.org/

http://pob.peeters-leuven.be/

http://trid.trb.org/

2. nieuws, kranten, tijdschriften

Google News, Yahoo News, Bing News, ...

BBC , CNN , CBSnews , e.d.

nu.nl

€ LexisNexis, € Factiva

sites van kranten en tijdschriftenoverzicht Engelstalig wereldwijd: world-newspapers.com

overzicht Nederlandse kranten: kranten.startnederland.nl

overzicht Nederlandse tijdschriften: tijdschrift.startnederland.nl

Newslink-magazines

....[weblogs & tweets: zie 4 en 5]

[video/tv-nieuws: zie 6]

31

http://news.google.com/

http://news.search.yahoo.com/news

http://www.bing.com/news

http://www.bbc.co.uk/

http://www.cnn.com/

http://www.cbsnews.com/

http://www.nu.nl/

http://www.lexisnexis.com/

http://factiva.com/

http://www.world-newspapers.com/

http://kranten.startnederland.nl/

http://tijdschrift.startnederland.nl/

http://newslink.org/mag.html

gespecialiseerd: Google News

Engelstalig nieuws uit 4500 bronnen

+ aparte versies in andere talen dan Engels:

chinees (1000 bronnen)

duits (700 bronnen)

frans (500 bronnen)

hebreeuws (100 bronnen)

italiaans (250 bronnen)

japans (600 bronnen)

koreaans (550 bronnen)

nederlands (>400 bronnen)

portugees (200 bronnen)

spaans (700 bronnen) [alleen nog zoeken]

enz.

32

3. oud web, oud nieuws, archief

web-archieven

"way-back-machine" op archive.org

(oude versies van websites, terug tot 1996, al 435 miljard pagina's !

ingang niet met zoekwoorden, maar via -oude- url)

UK web archive

Library of Congress web archives

Archipol - webarchief Nederlandse politieke partijen

list of web archiving initiatives

lijst webarchieven (Eric Hennekam)

historische nederlandse kranten (versnipperd aanbod)

historische buitenlandse kranten

LexisNexis

‘echte archieven’

33

https://archive.org/web/

http://www.archive.org/web/web.php

http://www.webarchive.org.uk/ukwa/

http://lcweb2.loc.gov/diglib/lcwa/html/lcwa-home.html

http://www.archipol.nl/

http://en.wikipedia.org/wiki/List_of_Web_archiving_initiatives

http://erichennekam.blogspot.nl/2014/07/webarchieven-op-een-rijtje-weg-is-niet.html

34

http://archive.org/

http://archive.org/

3. oud web, oud nieuws, archief

web-archieven

historische nederlandse kranten (versnipperd aanbod)

Delpher (gedigitaliseerde kranten KB, inclusief Suriname, Nederlandse Antillen en Indonesië - samen met boeken)

landelijke krantendatabank (ook papieren collecties)

Los: Groene Amsterdammer (>1877), Leeuwarder Courant (>1752)

historische buitenlandse kranten

British newspapers 1800-1900

historic American newspapers

€ NY Times archief (Timesmachine)

Google news archive (use "Search Tools" - "Any Time" - "Custom range")

digitized Australian newspapers

internationaal overzicht

€ LexisNexis

‘echte archieven’ via archiefzoeker.nl, archivegrid, ...

36

http://kranten.delpher.nl/nl/index/index?tabjump=1

http://lkd.persmuseum.nl/

http://www.groene.nl/historisch/1877

http://www.archiefleeuwardercourant.nl/index.do

http://newspapers11.bl.uk/blcs/

http://chroniclingamerica.loc.gov/

http://timesmachine.nytimes.com/browser

https://news.google.com/news/advanced_news_search?as_drrb=a

http://trove.nla.gov.au/newspaper

http://icon.crl.edu/

http://www.lexisnexis.com/

http://www.archiefzoeker.nl/

http://beta.worldcat.org/archivegrid/

4. blogs & rss-feeds

Icerocket

Twingly

Google [→ tabblad "News" → search tools → all news → blogs]

Exalead [ >> achteraf inperken op blogs ]

– denk aan verschil tussen ingang op individuele berichten/posts en

ingang op blogs of feeds als geheel

– wie citeert wie?

– filtermogelijkheid op “autoriteit” ?=? belang, kwaliteit, ....

– filter op termen binnen je rss-feedreader

– blogs of onderwerp volgen met blogsalert?

– (#hash)tags

38

http://www.icerocket.com/

http://www.twingly.com/search/

http://www.google.com/

http://www.exalead.com/search/

4. blogs & rss-feeds

zoeken naar RSS feeds (meer dan alleen blogs)

CTRLQ: http://ctrlq.org/rss/

RSS Searchhub: http://www.rsssearchhub.com/

overzicht (op "makeuseof")

voor vinden van feeds van bepaalde bron / website

voor vinden van feeds waarin bepaald onderwerp centraal

staat

39

http://ctrlq.org/rss/

http://www.rsssearchhub.com/

http://www.makeuseof.com/tag/5-rss-feed-search-engines-fresh-content/

Twitter in 140 tekens vaak met verkorte links

vaak met foto- of video-link

vaak met hashtags (#afgesprokentrefwoord)

Twitter als continue informatiebron:volg de "juiste" personen die interessante nieuwtjes, rapporten, artikelen via Twitter delen

zoeken (in 500 miljard tweets)

twitter (ook advanced search)

topsy

snapbird (alle tweets van 1 persoon waarvan je twitternaam kent)

twicsy (foto's op twitter)

...

5. tweets en social search

40

https://twitter.com/search-home

https://twitter.com/search-advanced

http://topsy.com/tweets

http://snapbird.org/

http://twicsy.com/


veel Twitter hulptools

archief van al weer gewiste tweets van politici: politwoops (ook nl)

twubs (bijv. bij congres) :

volg in real-time alles met bepaalde hashtag en voeg die tag

automatisch toe aan eigen berichten

...

links uit tweets automatisch bewaren als social bookmarks

via packrati.us >> delicious, pinboard, diigo, ...

Facebook "graph-search" voor gestructureerd zoeken

(in Engelstalig interface, maar mogelijkheden recent sterk beperkt)

41

http://politwoops.nl/countries

http://politwoops.nl/

http://twubs.com/

http://packrati.us/

Facebook Graph Search

alles wat gebruikers registreren,

wordt gestructureerd opgeslagen

in Facebook's graph (met

gestandaardiseerde betekenis),

waardoor ook gestructureerd

gezocht kan worden (mits “taal”

ingesteld op Engels)

42

https://www.facebook.com/search/110761475615126/residents-near/present/171495379612938/likers/106006999431490/likers/intersect/photos-of

https://www.facebook.com/search/110761475615126/residents-near/present/171495379612938/likers/106006999431490/likers/intersect/photos-of

http://graph.tips/


“Real time / social search engines”

social-searcher, socialmention, whostalkin, …

(tweets + blogs + facebook + …)

Google personal results / Google+ ("search plus your world")

Forumdiscussies

omgili, (boardtracker), ...

Google groups (ook oude nieuwgroep-discussies)

voor methoden van onderzoek:

zie adviezen van Henk van Ess in "de digitale detective" (2012)

How to: use social media in newsgathering (2012)

zie ook: 50 Top Tools for Social Media Monitoring (2013)

43

http://www.social-searcher.com/

http://socialmention.com/

http://whostalkin.com/

http://omgili.com/

http://www.boardtracker.com/

http://groups.google.com/

http://www.denieuwereporter.nl/2012/03/de-digitale-detective-spoorzoeken-met-social-media/

http://www.journalism.co.uk/skills/how-to-use-social-media-in-newsgathering/s7/a550556/

http://socialmediatoday.com/pamdyer/1458746/50-top-tools-social-media-monitoring-analytics-and-management-2013

6. multimedia

imagesGoogle-image (simpele beeldherkenning; ook foto’s uit Picasa)

Yahoo-image (ook veel foto’s uit Flickr)

Bing-image

Exalead-image

(veel verschillen in zoekresultaten door verschillen in “tekstzoekvelden”)

Flickr (zoekt vooral op tags; ondersteunt “Creative Commons” )

Andere uploadsites: Pbase, Smugsmug, Photobucket, Zoom, Zenfolio

Google, Bing (VS) (search by image),

Tineye (zoekt -bijna- exacte copieën)

speciale sites (beeldbank nationaal archief, wikimedia commons, ...)

geografische ingang (panoramio [via google-maps], google maps [views],

worldc.am [instagram], ...)

video

audio

44

http://images.google.com/

http://images.search.yahoo.com/

http://www.bing.com/images

http://www.exalead.com/image/

http://flickr.com/



http://www.tineye.com/

http://www.gahetna.nl/collectie/afbeeldingen/fotocollectie

http://commons.wikimedia.org/wiki/Main_Page

http://www.panoramio.com/

https://www.google.com/maps/views/

http://worldc.am/

zoeken naar beeld

Content based image retrieval (CBIR)

zoeken op basis van kleuren

zoeken op basis van ruwe schets op beeldscherm

zoeken op basis van voorbeeld afbeelding (reverse search)

al (op andere wijze) gevonden in systeem zelf

waarvan URL bekend is, of geüploade eigen afbeelding

voorbeelden: Google, Tineye, Bing (VS), Retrievr, Pixolution,...

daarmee zoeken naar zelfde / gelijkende / andere formaten

45


http://www.tineye.com/


http://labs.systemone.at/retrievr

http://demo.pixolution.de/

voorbeeld

46

google zoekt meest waarschijnlijke

zoekwoorden / mijn zoekwoorden

om dit plaatje te beschrijven

en combineert die in het

zoekvenster al met het plaatje zelf

... en geeft

"visually similar images"

die meestal helemaal

niet lijken ...

47

6. multimedia

images

videoYouTube (groei: 300 uur/minuut, ook "filters")

Youtube Edu channel

Vimeo (uploads - "serieus" materiaal)

Blinkx (omroepen - 35 miljoen uur video, spraakherkenning?)

VoxaleadNews (spraakherkenning -in 9 talen- ook NL! alleen demo)

Bing-video (niet makkelijk te vinden vanuit basis-scherm)

Google-video (ook video’s uit YouTube; zoekt alleen in metadata)

TV-uitzendingen:

Uitzending gemist (beperkte zoekfunctie)

Beeld & Geluid (doorzoekt metadata; gebruik “uitgebreid zoeken”)

Academia (selectie uit Beeld & Geluid voor hoger onderwijs; betaald)

audioVoxaleadNews (spraakherkenning -in 9 talen- ook NL; alleen demo)

BNR Nieuwsradio (spraakherkenning)

50

http://www.youtube.com/

http://www.youtube.com/edu

http://www.vimeo.com/

http://www.blinkx.com/

http://voxaleadnews.labs.exalead.com/

http://www.bing.com/videos/search

http://video.google.com/

http://www.uitzendinggemist.nl/

http://zoeken.beeldengeluid.nl/internet/index.aspx

http://www.academia.nl/

http://voxaleadnews.labs.exalead.com/

http://audiozoeken.bnr.nl/

zoeken naar geluid

algemene zoekmachinesfilteren op audiobestanden niet mogelijk

wel: zoeken met extensie (bv. mp3) in URL

wel: zoeken met als extra termen wav/mp3/soundbite/audio, bv. dogs barking wav OR mp3

wel: soms werkt "parent directory" mp3 of"index of" mp3 (+ bv. Beatles)

gespecialiseerde geluidszoekmachinesspraakherkenning: Voxalead (voor nieuws)

vooral .wav &.mp3 files: FindSounds

databanken met beschreven geluidenSoundjax, FindSounds, SoundCli.ps, Soungle, ...

historische geluidsarchieven (bv. BBC, British Library)

51 51

http://findsounds.com/

http://soundjax.com/

http://findsounds.com/

http://soundcli.ps/

http://www.soungle.com/

http://sounds.bl.uk/

http://www.findsounds.com/

http://www.findsounds.com/



7. naslag & antwoorden

encyclopedieën e.d.wikipedia

overzicht in Open Directory

internet movie database

vragen & antwoordenQuora

Yahoo-answers

(FAQs: internet FAQ consortium )

woordenboeken, vertaaldiensten e.d.

...

52

http://www.wikipedia.org/

http://dmoz.org/Reference/Encyclopedias/

http://www.imdb.com/

http://www.quora.com/

http://answers.yahoo.com/

http://www.faqs.org/

wikipedia

in >280 talen

levert “wisdom of the crowds” altijd “wisdom”?

goed voor “feitelijke” onderwerpen

veel detailonderwerpen (>20 miljoen lemma’s, >1 miljoen NL)

soms nuttig om relevante eigen publicaties / boeken uit eigen

collectie als referenties aan lemma toe te voegen

toch wel beleid & beheer: stewards, administrators

met Google site-commando kun je alle taalversies tegelijk

doorzoeken: zoekwoord site:wikipedia.org

Qwika: wikipedia metasearch (1158 wiki's in 12 talen, incl.

computer-vertaling)

53

http://meta.wikimedia.org/wiki/List_of_Wikipedias#1_000_000.2B_articles

http://en.wikipedia.org/wiki/Wikipedia:Policies_and_guidelines

http://meta.wikimedia.org/wiki/Stewards

http://en.wikipedia.org/wiki/Wikipedia:Administrators

https://www.google.com/search?q=h1n1+site:wikipedia.org&oq=h1n1

http://www.qwika.com/

7. naslag & antwoorden

encyclopedieën e.d.

vragen & antwoorden

woordenboeken, vertaaldiensten e.d.answers.com (voert een metasearch uit)

Roget thesaurus

Acronymfinder

Bartleby

Mijn Woordenboek synoniemen

Synoniemen.net

Google Translate

overzicht in Open Directory

overzicht in Open Directory Nederlands

...

54

http://www.answers.com/

http://thesaurus.reference.com/

http://www.acronymfinder.com/

http://www.bartleby.com/

http://www.mijnwoordenboek.nl/synoniem.php

http://synoniemen.net/index.php

http://translate.google.com/

http://www.dmoz.org/Reference/Dictionaries/

http://www.dmoz.org/World/Nederlands/Naslag/Woordenboeken/

8. feiten

dataverzamelingen

algemene data-zoekmachines:

knoema zoekmachine voor data, statistieken en visualisaties

quandl datasets uit diverse bronnen

zanran zoekmachine voor data, tabellen, statistieken,

grafieken e.d. uit webpagina's

google tables google tool om naar tabellen te zoeken

zoekmachine voor feiten + berekeningen:

Wolfram Alpha

statistieken

visualisatietool

linked (open) data

wetenschappelijke datasets

55

http://knoema.com/

http://www.quandl.com/

http://www.zanran.com/q/

https://research.google.com/tables

http://www.wolframalpha.com/

dataverzamelingen

algemene data-zoekmachines

zoekmachine voor feiten + berekeningen

statistieken:

statline (Nederland: CBS),

eurostat (Europa),

Undata (Verenigde Naties),

worldbank (wereldwijd)

oecd (wereldwijd)

....

visualisatietool: Google Public Data Explorer

linked (open) data


8. feiten

56

http://statline.cbs.nl/statweb/

http://epp.eurostat.ec.europa.eu/portal/page/portal/eurostat/home/

http://unstats.un.org/unsd/databases.htm

http://search.worldbank.org/data

http://www.oecd-ilibrary.org/economics/oecd-factbook_18147364

https://www.google.com/publicdata/directory

dataverzamelingen

algemene data-zoekmachines


statistieken

visualisatietool

linked (open) data (niet makkelijk bruikbaar voor eindgebruikers):

data.overheid.nl (Nederland),

UK-open-data (UK)

EU-open-data (Europa)

data.gov (US)

open-data-site-finder (wereldwijd overzicht)


8. feiten

57

https://data.overheid.nl/

http://data.gov.uk/

http://open-data.europa.eu/en/data/

http://www.data.gov/

http://dataremixed.com/2013/08/worldwide-open-data-sites/

dataverzamelingenalgemene dataset-zoekmachines ....


statistieken:

visualisatietool

linked (open) data

wetenschappelijke datasets:

DANS dataportal (NL)

Narcis-data (NL)

dataverse-network (algemeen; vooral VS en Europa)

Re3data (data-repositories)

DataBib (datarepositories)

datacite (metasearch)

worldwidescience (metasearch - tabblad "data")

....

8. feiten

58

http://dansdataportal.nl/index.php?go=zoeken.showForm&pagenr=3

http://www.narcis.nl/search/coll/dataset/

http://thedata.org/book/dataverse-networks-around-world

http://service.re3data.org/search/

http://databib.org/

http://search.datacite.org/ui

http://worldwidescience.org/

gespecialiseerde versus algemene zoekingangen

gespecialiseerde:

selectief & vaak “dieper” dan algemene zoekmachine

interne zoekfunctie van individuele site

kant en klare onderwerpsgerichte zoekingangenWorldwidescience (wetenschap algemeen)

Findlaw (rechten USA)

WebMD / Medscape (geneeskunde)

Google-finance (financiële gegevens + nieuws)

Searchgov (metasearch Amerikaanse overheidssites)

.....

homemade met : Google CSE

zelf selecteren welke sites (url’s) in zoekmachine moeten

worden meegenomen

59

http://worldwidescience.org/

http://www.findlaw.com/

http://www.wbmd.com/servicesprofessional.shtml

http://www.medscape.com/home

http://finance.google.com/

http://searchgov.com/

http://www.google.com/coop/cse/

ingangen op diepe web

toegang tot het diepe web

“handmatig” (elke database afzonderlijk doorzoeken)

geen universele overzichten meer beschikbaar

voor "wetenschap" al eerder verzamelzoeksystemen genoemd

“halfautomatisch” (doorzocht via desktop metasearch engine)

copernic-agent (metasearch vanaf eigen PC)

“automatisch” (gegevens uit bepaalde database/bron zitten

ook al -allemaal?- in algemene zoekmachines)

bijv. catalogus UB Wageningen

60

http://www.copernic.com/en/products/agent/index.html

Klantgericht informatie opsporen en rapporterenwebzoek.pbworks.com/f/bronnen-utrecht.pdf · via...

Documents

Transcript of Klantgericht informatie opsporen en rapporterenwebzoek.pbworks.com/f/bronnen-utrecht.pdf · via...