

Модератор: immortal
Хм.. Даже не знаю..hc2hunter писал(а): ↑Пт мар 27, 2020 10:29 amИ еще вот вам демонстрашка движка Kaldi.
Попробуйте.
Она просто отображает слова, которые удается распознать. Оцените, какая чувствительность, как реагирует на телевизор и т.п.
Пока никакого ключевого слова нет, просто показывает все что слышит.
Настроек у Калди вообще никаких нет, поэтому вот как она слышит - так это и будет работать в нашем приложении, если туда эту поделку затащить.
______________________________________________
Скачать .apk (~90Мб) файл обновлен 27.03.2020 в 10:28
Такие вещи делаются шаблонами. В том шаблоне, который отрабатывает на переключи канал, выставляется контекст на какое-то не очень большое время и вызывается ask('Переключила канал',3); (например) Алиса проговорит что она переключила канал и перейдёт в режим прослушки.kostyaer писал(а): ↑Сб мар 28, 2020 1:17 amМысль появилась.
А если сделать несколько ключевых фраз. Запускать на одну команду и на более долгое время для нескольких.. Сделал переключение каналов на телеке, но каждый раз произносить ключевую фразу перед командой не удобно, так бы- Алиса переключи канал... Следующий.. Следующий... В гугле вроде сейчас можно адаптировать распознавание только на свой голос и по идее не должно срабатывает на фоновые голоса.. Да и не только для телека такой подход был бы удобен..
Спасибо за подсказку, я только на днях добрался до шаблонов) ещё не освоил. Буду изучать. Но у меня сразу возникает вопрос - каким образом приложение будет слушать остальные команды без ключевой фразы, оно ведь сразу переходит в режим ожидания. Или мажор отправляет запрос приложению на распознавание?fandaymon писал(а): ↑Сб мар 28, 2020 3:13 amТакие вещи делаются шаблонами. В том шаблоне, который отрабатывает на переключи канал, выставляется контекст на какое-то не очень большое время и вызывается ask('Переключила канал',3); (например) Алиса проговорит что она переключила канал и перейдёт в режим прослушки.kostyaer писал(а): ↑Сб мар 28, 2020 1:17 amМысль появилась.
А если сделать несколько ключевых фраз. Запускать на одну команду и на более долгое время для нескольких.. Сделал переключение каналов на телеке, но каждый раз произносить ключевую фразу перед командой не удобно, так бы- Алиса переключи канал... Следующий.. Следующий... В гугле вроде сейчас можно адаптировать распознавание только на свой голос и по идее не должно срабатывает на фоновые голоса.. Да и не только для телека такой подход был бы удобен..
Для того чтобы отработала команда следующий, добавляется Шаблон следующий в контексте Переключи канал, который переключает канал и снова вызывает ask
А нет выбора источника записи? В телефонах вроде не один микрофон установлен. Или на аппаратном уровне в зависимости от режима микширование происходит..?
ask вместо say говорит терминалу - проговори фразу и слушай ответkostyaer писал(а): ↑Сб мар 28, 2020 3:39 amСпасибо за подсказку, я только на днях добрался до шаблонов) ещё не освоил. Буду изучать. Но у меня сразу возникает вопрос - каким образом приложение будет слушать остальные команды без ключевой фразы, оно ведь сразу переходит в режим ожидания. Или мажор отправляет запрос приложению на распознавание?