Natural Language Understanding Reading Group (NLU/RG) Kick-off Meeting
-
Upload
konstantin-sokolov -
Category
Documents
-
view
288 -
download
2
Transcript of Natural Language Understanding Reading Group (NLU/RG) Kick-off Meeting
NLU/RG
Константин Соколов
Mathlingvo, СПбГУ, i-Free
Санкт-Петербург, 2013
Пара слов о себе
• Mathlingvo• i-Free Innovations• AINL 2012-2013• СПбГУ• @vtqveant
1
Откуда NLU/RG
• R&D в i-Free Innovations
2
Зачем NLU/RG
• максимально быстро выйти на актуальные проблемы• больше вширь, чем вглубь• одному не разобраться
3
Формат NLU/RG
• Reading Group• чтобы было у кого спросить, если чего сам не понимаешь• ...и рассказать, если знаешь
4
Что такое NLU
• курс в Стенфорде (CS 224U, http://www.stanford.edu/class/cs224u)• несколько учебников ([Allen, Natural Language Understanding, 1994],
[Blackburn, Bos. Representation and Inference for Natural Language, 2006])• что-то вроде NLP• что-то про семантику• гораздо менее понятно, что вообще значит ”понимание” винженерном контексте
5
Что такое актуальное в NLU
• не (обязательно) недавнее• не (обязательно) модное• не (обязательно) революционное• даже не (обязательно) успешное
6
Что такое актуальное в NLU
• пример из прошлого: неевклидова геометрия (”идеиносятся в воздухе”)
• актуальное - это когда ”время пришло”
7
State of the Art в NLP
Прорывы последнего времени:
• Representation Learning• Manifold Learning• Deep Learning• &c.
8
State of the Art в NLP
Почему это модно?
• хорошо работает• можно считать на компьютерах• Big Data• бизнес видит ценность (?)• отвечают (или обещают ответить) на проблему, которая”носится в воздухе”
9
Актуальные проблемы в NLP
• Norvig on Chomsky (http://norvig.com/chomsky.html)• статистические методы vs. ”олдскульная” лингвистика• Возможен ли синтез? Имеет ли он смысл?
10
Программа NLU/RG
Принципы при составлении программы:
• актуальное (не модное, не недавнее, не революционное)• двигаться вширь• просить помощи• искать приложения в конкретных задачах (в научных ипромышленных)
Изначально рассчитывалась на год при еженедельных встречах.
11
Обзор программы
Обзор программы
http://nlu-rg.ru/files/nlu-rg-program.pdf
13
Обзор программы
Основные линии:
• лингвистическая• логическая• инженерная• актуальные проблемы• матметоды
14
Обзор программы
Лингвистическая линия:
• предоставить краткое введение в формальную семантику• закрыть пробелы• ввести основную терминологию• понять проблематику• познакомиться с историческим контекстом• узнать несколько имен
15
Обзор программы
Логическая линия:
• узнать об основных подходах к моделированию семантикиестественных языков
• сформировать четкое представление о сущностисемантики через обращение к теории моделей
• последовательно рассмотреть ряд конструкций,предлагавшихся для моделирования семантики
16
Обзор программы
Инженерная линия:
• рассмотреть ряд практических методов и реализаций изобласти (логического) программирования
• приложение (формальной) семантики к програмированию,обработке и представлению данных
• приложение (логического) программирования к обработкеестественного языка
17
Обзор программы
Актуальные проблемы:
• познакомиться с идеей нахождения представления данныхв структурном (символьном, алгебраическом) виде спомощью машинного обучения.
18
Обзор программы
Матметоды: от понятия множества со структурой к теориитопосов и HoTT.
• где смыкаются логика и геометрия• где встречаются порядок структур и аморфность данных• где одновременно присутствуют высокая сложность ивысокая абстрактность (В. Воеводский)
19
Административное
• порядок встреч: раз в две недели, СПбГПУ• регламент: 1,5 часа, обоснование темы, доклады,обсуждение
• гугл-группа: [email protected]• сайт: http://nlu-rg.ru• wiki, репозитории
20
Слово аудитории
• кто откуда• кто с чем из указанного знаком• кто с чем готов помочь другим разобраться• кто готов программировать и чего хотел бы
21
Спасибо!