Открытый код Томита-парсера. Виктор Бочаров

12

description

Открытый код Томита-парсера. Виктор Бочаров

Transcript of Открытый код Томита-парсера. Виктор Бочаров

Page 1: Открытый код Томита-парсера. Виктор Бочаров
Page 2: Открытый код Томита-парсера. Виктор Бочаров

Томита-парсер

Виктор Бочаров

Page 3: Открытый код Томита-парсера. Виктор Бочаров

Томита-парсер

›  Инструмент для извлечения структурированных данных из текста

›  Контекстно-свободные грамматики

›  Поддержка русского языка

›  Свободно доступен с исходниками

›  Документация

Page 4: Открытый код Томита-парсера. Виктор Бочаров

Томита-парсер: аналоги

›  JAPE (Java Annotation Patterns Engine)

›  AGFL (Affix Grammars Over a Finite Lattice)

›  LSPL (LexicoSyntactic Pattern Language)

›  AIRE (Artificial Intelligence Information Retrieval Engine)

Page 5: Открытый код Томита-парсера. Виктор Бочаров
Page 6: Открытый код Томита-парсера. Виктор Бочаров
Page 7: Открытый код Томита-парсера. Виктор Бочаров
Page 8: Открытый код Томита-парсера. Виктор Бочаров

Томита-парсер вне Яндекса

│  Законодательство РФ ›  Изменения в текстах законов (Apps4Russia 2013)

›  Извлечение определений (AINL 2014) │  Художественная литература

›  Отношения между персонажами (Диалог 2014) │  Описания товаров │  Отзывы

Page 9: Открытый код Томита-парсера. Виктор Бочаров

«Гордость и предубеждение» Джейн Остин

Page 10: Открытый код Томита-парсера. Виктор Бочаров

«Собака Баскервилей» Артур Конан Дойл

Page 11: Открытый код Томита-парсера. Виктор Бочаров

«Легенды и мифы Древней Греции» Николай Кун

Page 12: Открытый код Томита-парсера. Виктор Бочаров

Контакты

[email protected]

http://api.yandex.ru/tomita

http://github.com/yandex/tomita-parser

Виктор Бочаров

разработчик