Новые возможности поиска в SharePoint 2013

Post on 05-Dec-2014

4.649 views 5 download

description

 

Transcript of Новые возможности поиска в SharePoint 2013

SharePoint 2013новые возможности поиска

Виталий Жуков

Новый поискСравнение компонентов поиска до и после SharePoint 2013

Компоненты до SharePoint 2013

SharePoint 2003 SearchРасширенные SQL-запросы к полнотекстовому индексу SQL Server

SharePoint 2007 SearchПоявился обработчик запросов, что позволило управлять поиском

Search Server 2008Расширение для SharePoint 2007

SharePoint 2010 Search (Foundation, Server)Search Server 2010 (Express)FAST Search Server 2010

Компоненты SharePoint 2013

SharePoint 2013 Foundation SearchSharePoint 2013 Server Search

Standard EditionEnterprise Edition

Прощай FAST?

Прощай FAST?

От FAST 2010 осталисьIndex componentQuery EngineAnalytics Processing ComponentCrawl component

НовыеContent Processing ComponentQuery Processing Component

SharePoint ServerUI

Новая архитектураКомпоненты поиск SharePoint 2013 и их особенности

Логическая архитектура поиска

Crawl Component

Недокраулер. Отвечает только за получение контента,

подлежащего индексации

Set-SPEnterpriseSearchService -PerformanceLevel

Список контента, подлежащего скачиванию, определяет Admin

Component

Каждый компонент имеет доступ ко всем crawler-БД

Больше нельзя создавать правила распределения узлов, теперь

этим занимается SharePoint

Content Processing Component

Новые обработчики (Format Handler вместо iFilter)

На обработку передаются только свойства

индексируемого файла

Старый Content Enrichment заменен новым на основе WCF

Новый Content Enrichment может иметь условия на запуск

Analytics Processing Component

Состоит из двух частей:

Поисковая аналитика (проиндексированное содержимое, поисковые запросы,

использование результатов поиска)

Аналитика использования сайтов SharePoint (просмотр элементов, переход по

ссылкам, использование навигации)

Берет данные из многих источников (ресурсоемкий)

Некоторые данные реплицируются в индексе (через Content Processing

Component)

APC может использовать несколько экземпляров БД (Link DB, Analytics

Reporting DB)

Index Component

Content Processing пишет, Query читает

Реплики используются не только для

отказоустойчивости

При перестроении индекса ни его наполнение, ни

его чтение недоступны

Реплики синхронизируются по расписанию

Query Processing Component

Первичная обработка поискового запроса

синонимы

проверка правописания

стемминг

Пост-обработка результатов поиска

объединение результатов из нескольких компонентов индекса

удаление дубликатов из результатов поиска

Administration Component

Хранит информацию о:

Топологии

Правилах запросов и краулинга

Схеме поиска (Crawled, Managed properties)

Источники контента

Расписания обхода контента

Отслеживает состояние компонентов поиска

ACL перенесены в индекс

Может быть развернут на нескольких серверах

Процессы поиска

MSSearch.exe

Crawl Component

NodeRunner.exe

Search Admin

Analytic Processing

Index

Content Processing

Query Processing

На каждый компонент поиска (кроме

Crawl) на сервере запускается процесс

noderunner.exe

MSSearch - Windows-служба

Search Host Controller – Windows-служба,

отслеживающая работу компонентов

поиска (процессы noderunner.exe)

Primary Host Controller

Master Data Repository

Secondary Host Controller(s)

Новые возможностиОбзор возможностей поиска в SharePoint 2013 OTB

Подсказки поиска

Персонализированный поиск

HTML/JS rich rendering

Социальный поиск

Callouts, preview

Thesaurus

Не более 100.000 синонимов, иначе словарь будет игнорироваться

Начиная с CU August 2013 синонимы могут быть на разных языках

Spell checking

Слово считается написанным правильно, если его написание встречается

более чем в 1000 (по умолчанию, можно менять) разных документах.

ExtensibilityМеханизмы расширения поиска в SharePoint 2013

REST API

Взамен существующей службы search.asmx

Доступна по адресу http://server/_api/search (алиас для

http://server/_vti_bin/client.svc/search)

Ranking model

Использование линейных моделей и основанных на

нейронных сетях

Комбинирование разных типов моделей

Query rules

Три уровня иерархии

Приложение поиска

Коллекция сайтов

Сайт

Определяется тремя показателями:

Condition – когда применять правило?

Action – что необходимо сделать?

Publishing – когда применяется правило?

Display templates, Result Types

Использование HTML-шаблонов и .js файлов для рендеринга

Control templates – определяет шаблон результатов поиска (список,

пейджинг, слайды)

Item template – определяет шаблон элемента

Определение типов результатов

Создание правил определения типа на основе свойств элемента

Указание шаблона отображения, используемого для отображения

типа в результатах поиска

Спасибо за вниманиеSkype: zhukovvitalyEmail: vzhukov@live.ruBlog: http://blog.vitalyzhukov.ru