Пошукові машини та пошук інформації

14
ПОШУКОВІ МАШИНИ ТА ПОШУК ІНФОРМАЦІЇ Василенко Євген datastory.org.ua [email protected]

Transcript of Пошукові машини та пошук інформації

Page 1: Пошукові машини та пошук інформації

ПОШУКОВІ МАШИНИТА

ПОШУК ІНФОРМАЦІЇ

Василенко Євген[email protected]

Page 2: Пошукові машини та пошук інформації

Топологія веб-простору2

Модель «Bow Tie»(краватка-метелик)

досліджено біля 200 млн. веб-сторінок та більше 3 млрд. веб-посилань:

1) центральне ядро — 28% сторінок

2) «вихідні» (первинні) веб-сторінки — 22%

3) «кінцеві» веб-сторінки — 22%

4) «відростки» - 22%

5) «острови» - 10%

Page 3: Пошукові машини та пошук інформації

Засоби пошуку інформації

●пошукові машини - індексація всього доступного (або заданого) інтернет-простору

●веб-каталоги та портали відкритих даних — розподіл сайтів за тематичними категоріями

●довідкові ресурси — енциклопедії, довідники, сервіси он-лайн перекладів

●локальні пошукові програми — окремі програми, плагіни для браузерів та ін.

3

Page 4: Пошукові машини та пошук інформації

Якість інформаційного пошуку

●релевантність — відповідність результата пошуку поданому запиту

●пертинентність — відповідність результата пошуку реальній інформаційній потребі користувача

●інформаційний шум — результати пошуку, які не відповідають запиту, але потрапили до переліка відповідей

4

Page 5: Пошукові машини та пошук інформації

Пошукові машини загального призначення5

Назва Сайт Мова інтерфейсу

Розробник

Google www.google.com багатомовний Google Inc.

Bing www.bing.com багатомовний Microsoft Corp.

Yahoo! www.yahoo.com англійська Yahoo!

Яндекс www.yandex.ua багатомовний Яндекс

Page 6: Пошукові машини та пошук інформації

Функції розширеного пошуку6

Page 7: Пошукові машини та пошук інформації

Сервіси для метапошуку7

Назва Сайт Мова інтерфейсу

Розробник

Yippy www.yippy.com англійська Yippy Inc.

Nigma www.nigma.ru російська «Интеллектуальная поисковая система Нигма.РФ»

Dogpile www.dogpile.com англійська InfoSpace, LLC

Metabot www.metabot.ru російська, англійська

Ixquick www.ixquick.com багатомовний Ixquick

Page 8: Пошукові машини та пошук інформації

Рекомендаційні сервіси8

Назва Сайт Мова інтерфейсу

Напрямок

LiveLib www.livelib.ru російська література

Имхонет www.imhonet.ru російська універсальне рекомендування

Last.fm www.last.fm англійська музика

Jinni www.jinni.com англійська кінематограф

Page 9: Пошукові машини та пошук інформації

Пошук наукового контенту9

Назва Сайт Мова інтерфейсу

Розробник

BASE www.base-search.net англійська, німецька, українська та ін.

бібліотека Білефельдського університету (Німеччина)

ScenceDirect (Scirus)

www.sciencedirect.com англійська Elsevier

Академія Google (Google Scolar)

scholar.google.com.ua багатомовний Google Inc.

Page 10: Пошукові машини та пошук інформації

Пошук відео, програмного забезпеченнята прихованого контенту

10

Назва Сайт Мова інтерфейсу

Напрямок

Google Відео www.google.com/videohp багатомовний відео

Яндекс Відео www.yandex.ua/video/ багатомовний відео

SoftSearch wwww.softsearch.ru російська програмне забезпечення

Qweas www.qweas.com англійська програмне забезпечення

FileSearch www.filesearch.ru російська файли та каталоги (FTP)

RSS Micro www.rssmicro.com англійська RSS-стрічки

Page 11: Пошукові машини та пошук інформації

Оператор Виконання ЗначенняDefine: Define:термін визначення заданого слова, отримане із

мережевих енциклопедій

Info: Info:адреса_сайта дані про сайт, якими володіє Google

Cache: Cache:адреса_сторінки копія веб-сторінки, що була збережена при індексуванні

Related: Related:адреса_сайта знаходить інші сайти зі схожими заголовками та ключовими словами

Movie: Movie:назва_фільму інформація про фільм (залежить від географічного розташування користувача)

Site: Site:адреса_сайта.домен обмежує пошук вказаним сайтом

Allintext: Allintext:слово обмежує пошук тільки текстовим наповненням сторінок

Inanchor: Inanchor:текст пошук у тексті посилань

Inurl: Inurl:текст пошук в адресах посилань

Link: Link:адреса_сторінки перелік сторінок, що мають посилання на вказану сторінку

Filetype: Слово для пошуку Filetype:формат обмежує пошук заданим форматом файла

Numrange: Ключове слово Numrange:дата1-дата2

пошук ключового слова разом із часовими рамками

Пошукові оператори Google11

Page 12: Пошукові машини та пошук інформації

Портали даних:datahub.io

12

Page 13: Пошукові машини та пошук інформації

Портали даних:data.gov.ua

13

Page 14: Пошукові машини та пошук інформації

14

ДЯКУЮ ЗАУВАГУ!