Общая презентация Speereo (ЗАО "Титан - информационный...
-
Upload
daniil-ishchenko -
Category
Technology
-
view
178 -
download
4
Transcript of Общая презентация Speereo (ЗАО "Титан - информационный...
Speereo Software
Распознавание слитной речи для всех.
План
О компании
Продукты
Технология
Команда
О компании
Специализация
Распознавание слитной речи.
Построение речевых интерфейсов.
Консультирование.
Области применения
B2C
Носимые устройства и мобильные платформы.
Автомобильные системы.
Управление электроникой и умными домами.
B2B
Системы колл-центров и управления производственными процессами.
История
1998 г. – основание компании.
2002 г. – мобильные приложения с распознаванием речи выходят на мировой рынок.
2002 – 2011 гг. – технология и приложения Speereo распространяются миллионными тиражами и получают признание пользователей, а также отраслевые награды и поощрение партнеров и производителей.
2012 г. – запущен проект SPEAKY: универсальный речевой пульт для управления домом.
Речь – наиболее естественный способ человеческого общения.
Управление сложной техникой голосовыми командами естественно и желанно.
Продукты
Речевой пульт SPEAKY
Управление любой домашней электроникой и системами умных домов.
Собственные команды пользователей.
Обработка списков команд в режиме реального времени.
Мобильные программы
Speereo Voice Translator / Speereo Voice Organizer / Speereo Voice Launcher / Speereo Voice Reader
Первое мобильное приложение с распознаванием речи в мире.
Множественные отраслевые призы и признание экспертов.
Миллионы копий в мире.
Речевой браузер VSurf
Преобразование текстовых ссылок в речевые команды.
Управление контентом на медиа-порталах.
Речевой автомобильный интерфейс
Уникальные математические алгоритмы для работы в движущихся автомобилях.
Технология протестирована и одобрена к использованию компаниями Камаз, Brabus, Toyota, General Motors.
Интерфейс для бойца
Разработана и представлена концепция гибридного аудио-видео-тактильного интерфейса бойца армии РФ.
Технология
Распознавание речи Speereo
Русский, английский языки.
Работа в облаке.
Работа без связи с интернетом (на клиенте).
Высокая шумоустойчивость.
Неограниченный словарь.
Оптимальное ресурсопотребление.
Общая структура системы Speereo
Первичная обработка Декодер
Словарь
Речь
ШумМодель языка
Фонетические модели
Результат распознавания
Модель окружающей среды
Первичная обработка
• Система признаков, 41 коэффициент
• Оценка параметров окружающей среды
• Специальные алгоритмы по определению типа микрофона и устранению искажений канала передачи
• Специальные алгоритмы для устойчивой работы системы в автомобиле
Декодер
• Непрерывные скрытые марковские модели (точность повышается)
• Дискретные скрытые марковские модели(увеличивается скорость работы)
• Для английского языка 63 модели, которые включают 2446 компоненты
• Параметры моделей определяются статистически
• Высоко оптимизированный алгоритм декодера для работы в реальном времени
Точность распознавания Speereo
Тест 1: Распознавание длинных фраз
Условия: 600 фраз. Язык английский.
Точность распознавания – 99.9%.
Тест 2: Распознавание коротких слов
Условия: числовой словарь (включая невнятно произнесенные слова), 11 уникальных слов.
Английский: уровень распознавания – 99.2%.
Русский: уровень распознавания – 98.5%.
Шумоустойчивость
Тест 3: точность распознавания в зависимости от окружающих шумов:
SNR (dB) 0 5 10 15 20 >50
Точность
(%) 98,2 98,4 98,3 98,6 98,7 99,2
Распознавание в автомобиле
Тест 4: длинные фразы в шумной среде
Условия: 600 фраз. Среда – движущаяся машина с открытыми окнами.
Язык английский.
Уровень распознавания – 97,6%.
Минимальные требования
Минимальные требования по памяти 1-2 MB.
Система распознавания речи Speereo работает с процессорами, производительностью от 100 MIPS.
Поддержка широкого класса процессоров (SHx, TMPR39XX, NEC VR4122, MIPS, ARM, x86 и т.д.).
Модели распознавания
На сегодняшний день реализовано две модели:
▪ Распознавание фраз со словами, известными SSЕ – включенными в словарь.
▪ Распознавание фраз с неизвестными SSЕ словами (имена, пр.). В этом случае неизвестные слова автоматически транскрибируются.
Простота использования технологии
Чтобы внедрить речевой интерфейс Speereo, необходимо всего три шага:
1.Инициализация системы распознавания речи Speereo.
2.Определение списка речевых команд.
3.Определение реакции ПО на список речевых команд.
Дополнительные элементы
▪ Управление микрофоном и динамиком.
▪ Возможность работы с несколькими программами одновременно.
▪ Возможность записывать звук и голос с немедленным сжатием сигнала.
▪ Возможность проигрывания звука обратно пользователю.
▪ Возможность выбора определения момента произнесения команды (постоянное слежение или запуск по нажатию кнопки).
Команда
Олег Малеев, к.т.н., CTOИсследования и разработка – руководство.
Даниил Ищенко, CMOРазвитие бизнеса.
Константин Ламин, CEOИдеология, общее руководство.