Mikromarc Brukerstyre - Google eller Fagdatabasene? Google ......Foredrag på MIKROMARC brukermøte...
Transcript of Mikromarc Brukerstyre - Google eller Fagdatabasene? Google ......Foredrag på MIKROMARC brukermøte...
1
Hvem vil vinne – Google eller Fagdatabasene?
Foredrag på møte i Folkebibliotek og Fagbibliotek
Bergen 29. September 2011
Hvem vil vinne – Google eller
Bibliotekdatabasene? Foredrag på MIKROMARC brukermøte
for Folkebibliotek og Fagbibliotek
Bergen 28-29. September 2011
[email protected] Foto:Mentz Indergaard
NTNU UB
• Roar Storleer
• tel.: 73 59 51 23
• mob: 918 97 049
• adr.:
• NTNU UB
• Høgskoleringen 1
• 7491 Trondheim
Google feiret 13 år 27. september 2011
DOODLES
15. Sep 2011 «Jeg elsker våren» Hilde Lorenzen, vinneren av Doodle 4 Google 2011
20. Juli 2011 189 år siden Gregor Mendels fødsel
9
Ønsket om lett tilgang til informasjonen medfører at de aller fleste velger «Hamburger»-løsningen
Og den er som regel løsningen 20. Juli 2011 189 år siden Gregor Mendels fødsel
10
KOMPETANSE = KUNNSKAP x FERDIGHET HOLDNING
• Kunnskap er nytteløst uten VISDOM
• VISDOM er å bruke Kunnskap på en god måte -
• Til det beste for menneskene
Informasjons- og Kunnskaps-samfunnet
ORDSPRÅKENE 3.13-20 Kong Salomos Ordspråk, GT
Lykkelig er den som finner VISDOM Det menneske som vinner innsikt Det er bedre å skaffe seg VISDOM enn sølv Den vinning den gir er større enn gull VISDOMMEN er mer verdifull enn perler Av alle dine skatter er ingen som den I sin høyre hånd har den langt liv I sin venstre visdom og ære På VISDOMMENS veier er det herlig å vandre Og alle dens stier fører til fred For alle som griper den er den et livstre Lykkelige er de som holder fast på den Herren grunnla jorden med visdom
12
Slaget står mellom
• Bibliotekdatabaser – BIBSYS Ask – Micromark – Compendex – Scopus – INSPEC – ISI
• Federated search – Primo Central – Summon – Serials Solution
• Google – Google nettsøk – Google Scholar – Google Books
14
Et lite eksempel med tittelsøk på ordet:``tsunami`` i:
• Stavanger bibliotek • BIBSYS • Google Books
• Spørsmål: Bør Mikromarc bibliotek levere data til Google Books?
15
25
Fagdatabasene
• Høy kvalitetsikring – vurdert av fagspesialister
• De fleste ligger i «den skjulte veven» • God oversikt over primærkilder • God struktur – MARC format • Mange feltkoder • Thesaurus – sterk indeksering • Sterke søkemotorer med mange
søkemuligheter • Abstracts • Siteringsbaser (Scopus, WOS) • Bibliometrisk analyse • God tidsdekning • Scholar kan på ingen måte erstatte CA
og Medline • Forfatter – historikk (Scopus)
• Er så mange av dem - tusener • Mange ulike grensesnitt • De fleste – kostbare • Begrenset tekstmengde gir gode
treff
26
Søkemuligheter - FD
• Boolske operatorer – JA oil AND pollution • Paranteser – JA (oil OR petroleum) AND north sea • Trunkering – JA car*, car#, car? ? • Maskering – JA m#n, colo?r • Feltkodesøk – JA TITLE(oil pollution) • Nærhetsoperatorer – JA oil NEAR/1 pollution • Frasesøk – JA «oil pollution» • Naturlig språk – JA uncontrolled blowout in the ocean • Thesaurus – JA oil pollution/de
27
«Tsunami warning»
Database Emnesøk Tittelsøk Emneordssøk SCOPUS 347 83 180 WOS 211 75 Subj Cat ikke søkbar
Subj Area (grov inndel)
COMPENDEX 129 39 EI Main Head 0 treff Ei Subj Head 0 treff
GEOREF 207 121 CT 0 treff INSPEC 102 33 CT 0 treff PRIMO CENTRAL 896 138 Emne: 153 treff GOOGLE 2.760.000 225.000 Har ikke Google Scholar 5.330 566 Har ikke
WOS
COMPENDEX
INSPEC
32
1
2
2
[PDF] from caltech.edu
2
3
3
3
4
42
Samsøk
Metasearch • Parallell search • Integrated search • Cross-db searching • Simultaneous search
Federated search
• Kilde: Wikipedia
Primo Central
45
Hvorfor bruker vi Google?
• Mange tjenester • Rask – hurtig respons • Gir «alltid» treff • Finner ofte tilsynelatende relevante treff på første side • Enkelt brukergrensesnitt • Er gratis
46
Hvordan finner Google nålene?
• GoogleBot er «spideren» som finner fram til relevante nettsider ut fra en sofistikert algoritme
• Begrenser til «vitenskapelig» materiale • Den justeres jevnlig (flere ganger i uka) • Basert på kontinuerlig logging av «brukeradferd» • Lager en stor indeks • Men sier veldig lite om hvordan den arbeider • Er de mest relevante treffene blant de 10 første?
47
Hvor bra for søking? • Flere artikler trenger nødvendigvis ikke å være en
nettside • Mange av artiklene er bak en brannmur • Vet ikke hva vi søker i og hva vi mister • Den store treffmengden (fulltekstindeksering hvis
mulig) • Er de beste artiklene blant de 10 første • Du er overgitt til hva Google definerer som «best»
for deg (personalisering) • Relevansrangering og ikke kronologisk rangering
48
Hvor bra for søking?
• Har filtreringsmulighet, men på grove emnegrupper • Ingen sorteringsmuligheter i treffliste • Hvordan skjer indekseringen av artiklene?
– Lese den? Google kan ikke lese – Indeksere fra thesaurus? Google har IKKE noen
thesaurus eller kontrollert vokabular – har autoindeksering
– Se konteksten? Google kan ikke se konteksten – Menneskelig evaluering? Kun datagenerering
49
Så hva gjør • Samarbeider med flere forlag som lar Google komme bak
sine brannmurer (Elsevier, Springer, ACS, IEEE….) • Modifiserer algoritmen slik at de ekskluderer «ikke-
vitenskapelig» materiale. Den er selvsagt definert av Google • Google «logger» kontinuerlig brukeroppførsel på alle sine
plattformer for å finne den optimale brukeradferd (personalisering)
• Algoritmen tilpasses dette kontinuerlig • Personalisering: Google bestemmer hva som er mest
interessant for oss • Bruker «siteringer» for å finne relevans - «linking» • Benytter de enkelte bibliotekenes lenkeserver for lenking til
fulltekst for «ikke-gratis» tidsskrifter • Lenker til forlag med IP-sjekk som adgangskontroll
50
Hva ikke gjør?
• Gir ikke en liste over primærkildene, men vi vet noe om samarbeidspartnere
• Lager ikke en liste med kontrollert vokabular for indeksering • Bruker ikke standardisert forkortelse for tidsskrift-tittel • Gir ikke en beskrivelse av hva de definerer som
«vitenskapelig» • Gir ikke info om oppdateringsfrekvens • Gir ikke muligheter for kronologisk sortering av trefflisten • Har ikke adgang gjennom alle dører i «den skjulte» veven
Finnes fortsatt lite beskrivelse om hvordan den arbeider!!!
51
Fortsatt beta-versjon?
• Lansert i november 2004, men nå (juli 2011) er beta-versjon stemplet fjernet
• Utvikles i fellesskap med Google Books • Konkurrerer med siteringsbasene SCOPUS og WoS
52
Hva er ? • Google Scholar provides a simple way to broadly search for
scholarly literature. From one place, you can search across many disciplines and sources: articles, theses, books, abstracts and court opinions, from academic publishers, professional societies, online repositories, universities and other web sites. Google Scholar helps you find relevant work across the world of scholarly research.
Features of Google Scholar : • Search diverse sources from one convenient place • Find articles, theses, books, abstracts or court opinions • Locate the complete document through your library or on
the web • Learn about key scholarly literature in any area of research
53
Inneholder • Fulltekst tilgang krever abonnement eller individuell betaling
– hvis ikke det er «open access» • Må inneholde abstracts • Tilgang til materiale stengt pga abonnements-barrierer • Innkluderer peer-reviewed papers, thesis, bøker, preprints,
abstracts, full-text, siteringer osv. • Innkluderer Open URL til lokale bibliotekbeholdninger (eks
BIBSYS) • For NTNU finnes “NTNU” forkortelse utenfor titlene
• Innkluderer siteringer • Men ingen liste over forlag som har åpnet adgang for
GoogleBot
58
Samleoversikt - søkemuligheter
Søkemulighet Fagdatabaser Google Scholar
Boolske operatorer JA OR, +, - Paranteser JA JA Trunkering/maskering JA NEI Nærhetsoperatorer JA NEI, men maskering
av ord med «*» Frasesøk JA JA Naturlig språk JA JA Feltkodesøk JA JA Siteringer JA (SCOPUS og
WOS) JA
Alerts/SDI JA JA (egen tjeneste, Google Alerts)
Eksport JA JA, men virker dårlig «Federated search» JA En database
59
Samleoversikt -
Søkemulighet Fagdatabaser Google Scholar
Kvalitetsvurdert og indeksert av fagspesialist
JA NEI
Publikasjonsliste JA NEI Sorteringsvalg - treffliste
JA NEI
Standard skriveform for forfatter og tidsskrift
JA de fleste NEI
60
Kvantitativ evaluering (pr juli/2011)
• Hvor mange artikler? • Tidsdekning? • Hvor mange siteringer?
44,4 mill ref fra 1823, 70% m/abs 18.500 tidsk.titler 3 mill conf.papers 100% Medline dekning NTNU UB abb hele DB
Ca. 9,2 mill (???) Antall kilder: ????? Tidsdekning:????
46,1 mill fra 1900 Ca 10.000 tidsskr. Titler NTNU UB abb fra 1945
61
Første sammenligning
• Søker på «Tsunami warning» i tittel og hele databasen:
Database Hele basen Tittelsøk
COMPENDEX 133 39
SCOPUS 344 83 WOS 165 56 Proquest Central 16.267 1.804 Primo 896 138
Google Scholar 5.040 451
Google nettsøk 7.560.000 214.000
62
Plukker tilfeldig ut syv referanser (artikler) fra tittelsøk i COMPENDEX (39 treff) innen emnet «Tsunami warning» og sjekker hvorvidt de finnes i Scopus, WOS og Google Scholar
Database Treff Scopus /SciVerse Ref: 1, 2, 3, 4, 5, 6, 7 WOS Ref: 1, 2, 3, 4, 5, 6, 7 Google Scholar Ref: 1, 2, 3, 4 (kun som ref i
annen artikkel), 5, 6, 7 (Åpen)
Resultat (tidsspenn 1974 – 2011)
For flere av referansene peker GS til Scopus eller IEEE som NTNU UB har abb på og derfor får opp komplett ref.
69
Primo Central
70
Lykke til i det viktige arbeidet DU gjør med å rettlede dine brukere
Takk for oppmerksomheten Takk for meg!!