Suchmaschinenforschung an der HAW Hamburg

Suchmaschinenforschung an der HAW Hamburg Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Department Information dirk.lewandowski@haw-hamburg.de

1 | Dirk Lewandowski

Was bekommen Nutzer auf den Suchergebnisseiten zu sehen?

Wie gut sind die Suchergebnisse?

Wie können wir erkennen, was ein Nutzer mit seiner Suchanfrage meint?

Agenda

Einleitung: Forschungsbereiche und Methoden

Agenda

Suchmaschinenmarkt: Deutschland 2011

(Webhits, 2011)

Die Qualität von Suchmaschinen kann nur durch eine Kombination unterschiedlicher Faktoren gemessen werden.

•  Qualität des Index –  Größe des Datenbestands, Abdeckung des Web –  Abdeckung bestimmter Bereiche (Sprachräume, Länder) –  Überschneidungen der Indices –  Aktualität des Datenbestands

•  Qualität der Suchresultate –  Retrievaleffektivität –  Zuverlässigkeit der Suchergebnisse –  Zufriedenheit der Nutzer –  Überschneidungen der (Top-)Ergebnisse

•  Qualität der Suchfunktionen

•  Nutzerfreundlichkeit + Benutzerführung –  Aufbau der Trefferseiten

(Lewandowski & Höchstötter 2007; ergänzt)

Methoden

Search

Relevanztest

Online-Umfrage

Physiologische Untersuchung

Logfile-Analyse Heuristische Evaluation

Eye-Tracking

Usability-Test

Aktuelle Projekte im Bereich Suche

•  Forschungsprojekte •  Qualität von Web-Suchmaschinen (laufend bis 2011) •  Forschungsprojekt „Wissenschaftssuchmaschinen“ (seit WS 2008/09) •  Query Understanding (seit 2010) •  Search Experience (ab 2011)

 Wir wollen den Suchprozess sowohl aus system- als auch aus nutzerzentrierter Perspektive verstehen und aus diesem Verständnis Empfehlungen für die Verbesserung von Suchsystemen ableiten.

Aktuelle Projekte im Bereich Suche

•  Lehrprojekte – Verbesserung der Musiksuche (WS2010/11; Musicload) – Lokale Suchmaschinen: Eye-Tracking und Usability (WS 2009/10,

Projektpartner T-Online) – Einbindung von Frage-Antwort-Diensten in die Web-Suche (WS2007/08,

Projektpartner Lycos Europe)

•  Abgeschlossene Entwicklungsprojekte (mit MA-Studierenden) •  Suchanfragenklassifikation (in Zusammenarbeit mit T-Online) •  Produktsuche (mit Otto) •  Universal-Search-Konzept für die T-Online-Portalsuche

Abschlussarbeiten (Auswahl)

•  Vergleichende Analyse und szenariobasierte Usability Tests zur Evaluation der Gebrauchstauglichkeit neu gestarteter Suchmaschinen

•  Vergleich der Eyetracking-Systeme von Tobii und Interactive Minds unter besonderer Betrachtung der Auswertung bei dynamischen Webseiten-Elementen

•  Empirische Analyse von emotionalen Reaktionen im Prozess der Informationssuche im Web

•  Die Qualität von Retrievalergebnissen im Vergleich – Google Book Search und der OPAC einer wissenschaftlichen Bibliothek

•  Zur Struktur der Trefferbeschreibungen in Web-Suchmaschinen und deren Beurteilung durch den Nutzer

•  Optimierung der Suche von Nachrichten-Inhalten am Beispiel von Stern.de •  Untersuchung zum Nutzerverhalten auf der Website SPIEGEL Wissen

Agenda

(Eyetracking-Studie HAW-Hamburg 2010)

Eye-Tracking

•  x

Anzeigen

Nachrichten

Bilder

Videos

Blogbeiträge

Empirische Untersuchung zur Präsentation der Treffer auf den Ergebnisseiten

•  Methode •  Suchanfragen-Stichprobe zufällig ausgewählt aus

•  Top-Suchanfragen (pop) •  Seltenen Suchanfragen (rare)

•  Stichprobe von 2x 1099 Suchanfragen

•  Automatische Anfragen an die Suchmaschinen Ask, Bing, Google, Yahoo.

•  Extraktion der auf den Ergebnisseiten präsentierten Elementen („screen scraping“).

(Lewandowski & Höchstötter; in Arbeit)

Verteilung der Ergebnistypen innerhalb der ersten Ergebnisseiten

(Höchstötter und Lewandowski; in Arbeit)

Aus welchen Quellen kommen die Ergebnisse?

Beispiel Google

Charakteristika der Treffermengen

•  Wie häufig tauchen Wikipedia-Treffer* in den Top10 auf?

(Lewandowski & Höchstötter; in Arbeit)

Ask Bing Google Yahoo Populäre Suchanfragen

12,8% 91,5% 58,3% 46,4%

Rare Suchanfragen

12,6% 43,0% 22,4% 22,5%

* Nur deutsche Wikipedia-Treffer

Welcher Anteil der Ergebnisse (Top 10) hat einen kommerziellen Hintergrund?

Agenda

Was soll eigentlich gemessen werden?

•  Relevanz der Ergebnisse •  Durchschnittliche Bewertung der Suchergebnisse (Systemseite) •  Bewertung jedes einzelnen gefundenen Treffers hinsichtlich seiner Eignung zur

Beantwortung der Suchanfrage. •  Ergebnisse mehrerer Suchmaschinen können gemischt werden; Herkunft der

Treffer kann verschleiert werden.

•  Zufriedenheit der Nutzer mit einem Suchprozess •  Durchschnittliche Bewertung der Suchprozesse (Nutzerseite) •  Bewertung jeder einzelnen Suchsession. •  Jeder Nutzer kann nur eine Suchmaschine bewerten; Kenntnis der Suchmaschine.

•  Wissenszuwachs •  Durchschnittliche Bewertung dessen, „was hängen geblieben ist“ (Nutzerseite) •  Bewertung des Wissenszuwachses nach einer Suchsession. •  Jeder Nutzer kann nur eine Suchmaschine bewerten; Kenntnis der Suchmaschine.

Entscheidungen beim Design klassischer Retrievaltests

1. Welche Suchmaschine(n)?

2. Wie viele Suchanfragen? 3. Welche Suchanfragen? 4. Wie viele Ergebnisse pro Suchanfrage?

5. Wie viele Juroren? 6. Welche Juroren(gruppen)? 7. Wie viele Juroren je Suchanfrage?

8. Wie sollen Dokumente bewertet werden (Skalen)? 9. Sollen Dokumentbeschreibungen berücksichtigt werden?

10.  Mit welchen Kennzahlen soll gemessen werden?

Precision-Recall-Graph (binär)

Welches Nutzerverhalten kann in Retrievaltests abgebildet werden?

•  Query-response paradigm •  Annahme: Nutzer gibt Suchanfrage ein, prüft dann das Ergebnis. •  Statisch; „systemorientiert“ „Klassische“ Retrievaltests (Abfrage der „objektiven“ Trefferqualität)

•  Interaktives Retrieval •  Annahme:

•  Recherche findet in mehreren Schritten statt. •  Bei der Recherche handelt es sich um einen „Dialog“ zwischen Nutzer und

System. •  Dynamisch, „nutzerorientiert“ Nutzerstudien (Abfrage der Zufriedenheit der Nutzer)

Tools: RAT & Search Logger

•  RAT (Relevance Assessment Tool) •  Werkzeug zum Design und zur Durchführung klassischer Retrievaltests •  Baukastenprinzip beim Testdesign •  Automatische Abfrage der Treffer der bekannten Suchmaschinen

•  Search Logger (Entwicklung der Uni Tartu, Estland) •  Werkzeug zum Protokollieren von Browserinteraktionen •  Task-basiert

•  Ziel 2011: Zusammenführung der beiden Tools, um interaktives IR in Suchmaschinen evaluieren zu können.

Agenda

Drei Anfragetypen

Anfragetypen nach Broder (2002)

•  Informational (informationsorientiert) – Nutzer möchte sich zu einem Thema informieren. – Ziel sind mehrere Dokumente.

•  Navigational (navigationsorientiert) – Ziel ist es, eine bestimmte Seite (wieder) zu finden. – Typisch: Suche nach Homepage („Daimler Chrysler“). – Ziel ist i.d.R. ein Dokument.

•  Transactional (transaktionsorientiert) – Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden

soll. – Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei.

Navigationsorientierte Suchanfragen anhand von Klicks bestimmen

Transaktionsorientierte Suchanfragen anhand der Klicks bestimmen

Hätten Sie‘s verstanden?

•  bbl •  vatikan •  stockbrot •  motonetix •  nedcom •  fußball •  drehscheibe •  frauentausch •  seelenfarben •  kachelmannwetter •  osterei •  wie ich •  wow

Suchanfragen im Kontext

Agenda

•  Im Themenbereich Suchmaschinen gibt es vielfältige Fragen.

•  Nur die Informationswissenschaft bietet •  das nötige breite Methodenspektrum •  Mischung aus technischem + sozial- und gesellschaftswissenschaftlichem Know-

•  Und zuletzt: Die Berufsaussichten in diesem Themenbereich sind sehr gut!

Vielen Dank für Ihre Aufmerksamkeit.

www.bui.haw-hamburg.de/lewandowski.html

Aktuelles Buch: Handbuch Internet-Suchmaschinen 2

E-Mail: dirk.lewandowski@haw-hamburg.de

Suchmaschinenforschung an der HAW Hamburg

Technology

Transcript of Suchmaschinenforschung an der HAW Hamburg

Bachelorarbeit - HAW Hamburg

Next Generation Food - HAW Startseite: HAW Hamburg · Next Generation Food Ernährungstrends Ernährung zur Selbstoptimierung bissweise Consulting Dr. S. Lichtenstein Hamburg, 15.

Datenbankarchivierung Vortrag an HAW - Hamburg 2002 Mykola Birger.

Diplomarbeit - HAW Hamburg

Bachelorthesis - HAW Hamburg

Projekt zur Umsetzung der DGUV Vorschrift 2 an der HAW …...• Erfassungsphase, in der die HAW Hamburg Daten mit Hilfe eines gemeinsam entwickelten Erhebungsbogens sammelt • Plausibilisierungsphase,

Hochschule für Angewandte Wissenschaften · PDF fileFakultätsmanagement an der HAW Hamburg Dr. Petra Seling-Biehusen Hochschule für Angewandte Wissenschaften Hamburg Geschäftsführerin

Modulhandbuch der Masterstudiengänge Fahrzeugbau und ... · Modulhandbuch für die Master‐Studiengänge HAW Hamburg Department Fahrzeugtechnik und Flugzeugbau 4 Pflichtmodule der

Filiz Bachelorarbeit Final - HAW Hamburg

Forschungs- und Entwicklungsprojekte an der HAW Hamburg · 7 FORSCHUNGS- UND ENTWICKLUNGSPROJEKTE AN DER HAW HAMBURG 2003/2004 Vorwort Liebe Forscherinnen, liebe Forscher, liebe Kolleginnen

impetus - HAW Hamburg

Dokumentenserverhosting der SUB-Hamburg - …...Konzeption und Realisierung einer hybriden App auf Basis moderner Webtechnologien Bachelorarbeit an der HAW Hamburg Vorgelegt von: Richard

Modulbeschreibungen - HAW Startseite: HAW Hamburg · Modulhandbuch Bachelor „Logistik / Technische Betriebswirtschaftslehre“ Modulbeschreibungen Studiengang Bachelor „Logistik

HAW 75Jahre F+F deu VS V5 · neue Abteilung an den Technischen Staatslehranstalten zu Hamburg, eine der Vorläufer der HAW Hamburg, gegründet. Ingenieure für den Luftfahrtstandort

PRAXISORIENTIERT STUDIEREN AN DER HAW … · HAW Hamburg Fakultät DMI Modecampus Armgartstraße HAW Hamburg Fakultät DMI Kunst- und Mediencampus Hamburg HAW Hamburg Fakultäten

Vorlesungseinheit „Wörterbücher“ - HAW Hamburg...1 Vorlesungseinheit „Wörterbücher“ Im Rahmen der Vorlesungsveranstaltung „Informationsaufbereitung“ Thomas Schütz,

Master thesis - HAW Startseite: HAW Hamburg · Zusammenfassung Peter Lorenzen Thema der Master thesis Das Wärmenetz als Speicher im Smart Grid: Betriebsführung eines Wärmenetzes

am 8. November 2018 an der HAW Hamburg · Vize-Präsidentin der HAW Hamburg 10:10 Uhr Prof. Dr. Louis Henri Seukwa, HAW Hamburg Globale Ungleichheit – Flucht – Bildung Anmerkungen

Indien Impressionen (Februar 2016) - HAW Hamburg...Indien Impressionen Zwei Wochen Unterrichten an einer Privatuni in Indien, Konferenz, zuhause bei einem Doktoranden der HAW Hamburg,

Gesundheit und Ernährung - haw-hamburg.de · 43 Die gesellschaftliche und individuelle Auseinandersetzung mit Gesundheit und Ernährung bildet sich an der HAW Hamburg über den gleichnamigen