hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수...
Transcript of hseung@samsung - krnet.or.krBD%C2%C7%F6%B… · 단어별 검색엔진 • 검색능력의 변수...
도:l. o 웹검색엔진
1997. 7. 2.
승현석
삼성전자 기술총괄 소프트웨어센타
1 KRNET'97
소개
·정보
·정보검
·정보검색멘진
• 웹 정보의 특성
웹 정보검색시 고려사항
-
밝
, l
빼
n
μ
• 가치가있는자료
가공된자료
확실성을제거 혹은감소
l 분석과 확인작업을 거친 첩보
무엇인가? 정보란
•
” l T ’
짜
’‘ι:o.'~ 무엇인가? 정보검색이란
」-」
차Z
처。 르를
과 보
이l 정
련 한
일 요
피르
• 정보 수집, 분석, 재가공까지의
l 개인이나조직이 의사결정에
일련의과정 듬끼L-른 。{투긍 .A. 0 I 느: ;터 며
n -1 c크 C<:크 | λ.A L- C> ' • 최소한의 비용으로 최대의 수집이목표
” m
빼
“ ”
- 54 -
--해야흉~ ;'
” m
빼
.... ’--
• 사용자의 질의에 관련된 정보의 존재 여부와 그 위치를알려 줌
• 질의한 정보 그 자체를 알려주는 것은 아님
주식시세, 신문기사, 도서목록 등을 조회하는 단순한 자료검색멘진과는 E
정보검색엔진이.란?
트르A게 --11 C ) 정보의 웹
최종적으로 결론지을 방법 없음
정보의 우수성을 판단하기 어려움
l 정보의 다양성
·정보수집의 신속성
• 멀티미디어 정보
• 체계적이지 못함
·서비스가혼잡
• 신뢰성이 취약
·존재 여부
·찾아낸
” l
빼
야 μ
웹 정보검색시 고려사항 :-- iAO*' I
정보의 위치를곧바로찾는것 보다해당정보를 제공할 만한 전문 검색멘진을 찾는다
큰개념에서 시작하여 세부적인 내용으로찾아 들어간다
‘못찾는것’과‘원래 없는것’에 대한경계를신중히
결정한다
상용 데이타베이스, 각종 인쇄물, 도서관 목록등을 검색멘진과 혼합하여 사용하는 것이 바람직
-
밝 뻐
애
웹 검색어|찌。| 이해
·검색방법
l 검색분야
l 검색목적
·검색 수행자
-
밝 빼
- 56 -
검새박법에 따F 밴류
l 주제별 검색맨진
l 단어별 검색멘진
• 메타검색맨진
• 통합검색맨진
뺨켠j
주제별 검색엔진 Rl(;J .... ‘
• 각 정보를 주제별로 정리하여 사용자로 하여금 단계별로 선택해 들어가 결국 최종 정보에 도달할 수 있도록구성된 검색맨진
l 일명: 디렉토리 서비스, 분류 서비스
• 여I : - 해 외 : Yahoo, Galaxy, VWVVVVirtual Library
- 국내: 애니서치, 코씨크, 심마니, 정보탐정, Zoom, Zip
” l
째
n “ 1 I
- 57
주제별 검색엔진 """'. A :1
• Browsing어| 춧점을 두고 있다
• 정보검색의 출발점으로 많이 이용
• 수작업으로 정보를 분류
• 특정 분야만을 전문적으로 분류한검색멘진들이 속출 - 여1: Internet Sleuth
” I ” m
빼
주제별 검색엔진
l 장점 - 찾고자하는정보에 대한사전지식 없이도찾기 용이함
- 해당분야에 관련된 정보들을 한눈에 파악하기 용이함
- 키워드로는찾기 힘든큼지막한정보들을찾는데 편리함
- 키워드로 표현하기에는 너무 일반적이거나 애매할 경우 그 위력을밭휘
η
I -
인 째
- 58
<<.saJM:‘l ‘ 검색엔진 주제별
드~^1 L...!I=그
- 사람이 분류할 수 있는 데에는 한계가 존재
- 새롭게 올라오고갱신되는정보를사람이 일일히 이를 확인하고분류할수없음
- 한번 잘못된 분류를 따라가면 정보를 제대로 찾지 못함
- 분류의 객관성을 보장하기 힘듬
•
l m
째
1
ι
-
""""""" 검색엔진 단어별
나타난단어를 • 해당 정보를 지칭하는 혹은 그 정보에 입력하여 검색하는 검색멘진
• 일명: 키워드 검색멘진, 서치엔진
• 여 I : - 해 외 : AltaVista , Excite , Hotbot, Infoseek, Lycos - 국내: 애니서치, 유니파인더, 웹글라이더, 까치네, 심마니, 정보탐정, 아이봇
-
밝
타 째
M
59 -
검색엔진 단어별
• Searching어| 춧점을 두고 있다
대개 색인 데이타베이스를 구축, 검색속도를 향상시키고 있음
• 질의 연산자 - A and B
- AorB
- A not B
- “A B" (phrase 검 색 )
민
T ’ 빠
u n
I
녀
검색엔진 단어별
l 장점 - 원하는 정보툴 빠르게 찾을 수 있음
- 세부적인 정보를 찾는데 용이
- 자료 수집, 색인 구축 등의 과정이 자동화
- 방대한자료검색 가능
단점 - 올바른키워드를사용하지 않을경우검색이 않되거나 너무 많은 정보가검색될 수 있음
- 관련 정보를검색하기 어려움
- 요약정보의 품질이 낮음
” l
빼
애
I
- 60 -
단어별 검색엔진
• 검색능력의 변수 -색인자료건수
- 색인 갱신 주기
- 검색 기법
어느 한검색멘진의 속도나 자료가 많다고 하여 그 검색멘진만을사용하게 된다면 다양한정보를접할 수 있는 기회를 스스로 저버리게 됨
η
I 번 째
메타검색엔진
• 하나의 웹 페이지에서 여러 검색멘진에 대한질의 인터페이스를제공
• 일명: 다모아형 검색멘진 AII-in-one 검색멘진
l 이용하고자 하는 검색 멘진을 고르고 검색 키워드
입력
• 정확하게는 검색멘진이 아니고 하나의 거대한 HTML 검색 Form 임
• 여I : - 해오1: CUSI, w3 서치엔진, AII-ln-One 서치페이지
” m
빼
애
-
-61 -
메타검색엔진
·장접 - 한곳에서 여러 검색맨진을 활용할수 있음
- HTML로 되어 있어 설치가용이
드~:처 L......!t:그
- 한번에 한개의 검색맨진에서만검색 가능
- 검색맨진의 양식, 질의 문법, 주소 등이 바뀐 경우 검색오류밭생
• 발전된 형태 - 자바스크립트틀 이용 키워드를 한번만 입력 (예: 찾고파)
- 검색엔진을 주제별로 정리 (예: 구골)
” l M n 3 -
•
통합검색엔진 A1t1UiH 5 ::z
• 여러 검색엔진의 검색결과를 통합하여 보여줌
• 일명: 정보검색 에이전트, 메타검색멘진
• 자체 색인 데이타베이스가 없음
• 여I : - 해 외 : Insane Search, OnRamp, MetaCrawler, Savvy
Search
- 국내: 미스 다찾니
n u ‘ ‘ -
” m M
- 62 -
통합검색엔진 r
iUCr720'
·장점 - 한 번의 검색으로 많은 검색엔진에서 정보를 얻을 수 있음
• 단점 - 속도가느림
- 다른 검색맨진의 성능에 좌우됨
킨
” l
빼
검색분야에 따른
• 일반검색멘진
·전문검색멘진
‘
-
밝 빼
경
I
-63-
일반검색엔진
• 특정한 분야에 편협되지 않고 전세계에 올라 온 자료를검색 가능케 함
l 주제별로 자료를 정리해 놓았거나 키워드로·검색
• 전세계에 걸쳐 분산된 자료를 검색하게 되므로 정보의 질이나 수준을 보장받을 수 없음
• 정보의 다양성, 신속성이 관건
l m m T
• M m
M 1 J
‘ ‘ I
....".’‘a 검색엔진 A:케 프프 I • ,.
정 분야에 대한 전문 검색멘진
• 일반검색멘진에서 검색하기 어려운 정보 검색 가능
자체 서버에 올라오는 정보들만 검색해주는
검색멘진
• 고품질의 정보를 손쉽게 찾을 수 있음
새로운미디어검색 가능
정보의 완정성, 정확성이 관건
•
” ’
빼
” ”
- 64 -
전문검색엔진 R훌" .. I
• 여I : - 기 업 : Yello Page, BigBook, SalesLeadsUSA
- 뉴스: NewsPage, NewsTracker
- 쇼 핑 : Price Watch, Computer ESP
- 영 호~: Internet Movie Database (IMDB)
- 지 리 : MapQuest, Xerox Parc Map Viewer
- 영 상: Image Suπer, WebSeer
정
I l m T
짜
검색목적에 따른 류
l 단순검색
- Hit Search
• 전략적 검색
- Strategic Search
-
께
빼
t
ι
- 65 -
;겨 AH E그 I
특정 한 하나의 자료를 찾아내 는 Hit Search
1 회성 검색
주로일반검색멘진을활용
A
T』단
민 빼
l 정보사냥
낀
I
fUW_“ 검색 전략적
호L도요 E르 C그
• 종합적 산업정보 획득과분석을위한검색
• 온라인 시장조사
• 다른 조직보다 경쟁적 우위에
• 장기성 검색 l 포괄적 검색
·검색 보다는분석에 더
오르는데
큰비중을둔다
” m
빠
m m 왜
I
- 66 -
검색 수행자에 따른 류
RU", '
·직접 검색
·대리검색
영
I ” l
빼
대리검색 κ·
• 검색맨진의 종류와 숫자가 다양해짐
• 정보검색의 시발접인 검색맨진의 선택에서부터 난관에 부딪힘
l 해결책: - 정보검색 대행업체
- 정보검색 에이전트
빼 - 67 -
정보검색 대행업체 RRJA I
l 고객이 요청한정보를 여러 매체 및 검색멘진 등을
활용하여 검색을 수행, 그 결과를 보고해 줌
l 개인보다는 주로 기업에서 활용
• 시장 조사, 기술 동향, 논문 검색, 각종 인쇄물 검색
• 검색 기간: 단기성, 장기성
l 상용 데이타베이스를 많이 이용
• 여I : - 해외: 야후의 목록, answers.com - 국내: 장미디어 인터랙티브, 인터넷과컴퓨터
민
’ ’ 야
애
인
정보검색 에이전트
• 사용자를 대신하여 네트워크상의 많은 정보를 검색하고 그 결과를 정리, 보고해주는 전자비서
정보검색 대행업체에서 근무하는 정보검색사의 역할을소프트웨어로구현
l 아직은초보적인 수준
l 차세대 검색도구로 각광받을 것으로 전망
-” m M
영
I
- 68
정보검색 에이전트 RR3A1li :'
• 여I : - 통합검색엔진
- Bargainbot Search Agent
- BargainFinder Agent
- Jango
- MX BookFinder
” ’
빼
원
성공적인 검색엔진의 필수요소
펀리한사용자인터페이스
방대한정보량
l 빠른검색속도
l 데이타베이스의 갱신 주기
• 각종검색 옵션
.찾고자하는정보 르고정확하게 찾아주어야함
” s ” m M
69 -
성공적인 정보사냥꾼의 필수요건
IiLO~ -1 -, 각검색맨진들의 장단점
• 빠른검색환경 구축 호k5포 E크 〈그 분야별 전문검색멘진
키워드추출능력배양 •
파악 초i트르 며IA내 7'1 드a λ1 -1--듀| 〈그 11 ~ c그 E르 E르 L..! -, '-' 1 정보의
” m
째
냄
성공적인 정보검색사의 필수요건
• 정보 분석 및 가공 능력 배양
• 전문 검색멘진의 존재 및 위치 파악 능력
l 전문 검색맨진에 대한 리스트를 분야별로 정리, 이를 지속적으로유지 관리
유료데이타베이스활용
각종인쇄물활용
” m
빼
t
ω
-70-
로 」
켜 르
• 검색멘진의 폭발적인 증가
• 검색맨진의 선택이 정보검색의 성공여부를 판가
l 정보 분석 및 가공 능력의 중요성
• 정보검색 에이전트의 보편화
” 이
I ” m
빼
소
주 · 고
참
O' •••• ~
RkJ.CC1 I
• 일반검색엔진 (해외) - Alta Vista (www.altavista.digital.com)
- Excite (www.excite.com)
- Galaxy (galaxy.tradewave.com)
- Hotbot (www.hotbot. com)
- Infoseek (www.infoseek.com)
- Lycos (www.lycos.com)
- WNW Virtual Library (www.w3.org/pub/DataSources/bySubjecUOverview.html)
- Yahoo (www.yahoo.com)
•
l m
빼
끼
참7 ̂ ιk .-1 l 일반검색맨진 (국내)
- 애 니 서 치 (WWN. anysearch. com)
- 유니 파인 더 (WWN.unifinder.com)
- 웹 글라이 더 (WWN.infoglider. com)
- 쿄씨 크 (kor-seek. chungnam. ac. kr)
- 까치 네 (WWN.kachi. com)
- 심 마니 (simmany.hnc.net)
- 정보탑정 (idetect. kotel. co. kr)
- 아이 봇 (ib야.iworld. net)
- Zoom (zoom.cyso.net)
- Zip (WWN.zip.org)
” m
빼
소
즈
l 고
참
Rk>s ...... “
• 메타검색엔진 - CUSI (WWN.nexor.co.uklsusi/cusi.html) - V\β 서 치 멘 진 (CUiWWN. unige.ch/meta-index. html)
- AII-I n-One 서 치 페 이 지 (WWN.albany. netlallinone/)
- 찾고파 (web.sec.samsung. co. kη-대ee/)
- 구골 (WWN.jmi. co. kηlibrary/googol/)
• 통합검색엔진 - Mamma (WWN.mamma.com)
- OnRamp (search.onramp.net)
- MetaCrawler (WWN.metacrawler.com)
- Savvy Search {guaraldi. cs.colostate.edu:200이
- 미 스 다찾니 (WWN.mochanni.com)
때
I ” m
빼
- 72-
λ소
4 ,흐주}
고
참
ur.t:IJtA I
• 전문검색맨진 - Yello Page (www.yellow.com)
- BigBook (www.bigbook.com)
- SalesLeadsUSA (www.abii.com)
- NewsPage (www.newspage.com)
- NewsTracker (nt. excite.com)
- Price Watch (www.pricewatch.com)
- Computer ESP (www.uvision.com)
- Internet Movie Oatabase (www.imdb.com)
- MapQuest (www.mapquest. com)
- Xerox Parc Map Viewer (pubweb.parc.xerox.com/map)
- Image Surfer (ipix.yahoo.com)
- WebSeer (webseer. cs.uchicago.edu)
” m M 이
I
소
주 · 고
참
-κ·
• 정보검색 대행업체 - 야후의 목록
(www.yahoo.com/Business_and_Economy/Companiesllnformationllnformati。
n_Brokers/)
- answers.com (www.answers.com)
- 장미디어 인터랙티브 (www.jmi. co.kr)
- 인터넷과 킴퓨터 (www.innco.co.kr)
• 쇼핑 에이전트 - Bargainbot Search Agent (www.ece.curtin .edu.au/-saounb/bargainbotl)
- BargainFinder Agent (bf.csta r. ac.com/bf/)
- Jango (www껴ngo . com)
- MX BookFinder (www.mx.orglbookfinder/)
” m
빼
g R
% I
까