Простое голосовое управление системой

Профиль Connect · Сообщение **sergejey** » Вт сен 23, 2014 11:30 am

dmw писал(а):Вот неплохая интересная статья по использованию движка Pocketsphinx:
Сверхбыстрое распознавание речи без серверов на реальном примере
К нам нельзя прикрутить?

Можно попросить человека

Если заинтересуется, то поможет.

Amarok · Сообщение **Amarok** » Вт сен 23, 2014 11:49 am

А может хабро-юзеры спросят?

Dark_Veter · Сообщение **Dark_Veter** » Пт сен 26, 2014 2:35 pm

Есть проект https://play.google.com/store/apps/deta ... iassistant, который как я понял как раз использует Pocketsphinx для распознования. Есть возможность голосовой активации и создания собственных сценариев. Думал как привязать к Алисе, но не нашел возможности отправлять get запросы через нее. Можно попробовать открывать браузер, потом закрывать при получении команды, но это не очень удобно. На 4pda пишут, что есть интеграция с таскером, может через него получится сделать.

Профиль Connect · Сообщение **sergejey** » Пт сен 26, 2014 3:01 pm

Dark_Veter писал(а):Есть проект https://play.google.com/store/apps/deta ... iassistant, который как я понял как раз использует Pocketsphinx для распознования. Есть возможность голосовой активации и создания собственных сценариев. Думал как привязать к Алисе, но не нашел возможности отправлять get запросы через нее. Можно попробовать открывать браузер, потом закрывать при получении команды, но это не очень удобно. На 4pda пишут, что есть интеграция с таскером, может через него получится сделать.

Если я правильно понял, то pocketsphinx используется только для распознания фразы-активации, остальное через гугл. С таскером интеграция заявлена и если так, то передавать команды Алисе труда не составит.

PAV · Сообщение **PAV** » Вт сен 30, 2014 9:49 am

А кстати, если у нас есть хабражители - поделитесь приглашением;), а то чего-то ни одна статья не прокатила.

Bagir · Сообщение **Bagir** » Вс окт 12, 2014 12:17 am

Ivan писал(а):Что если использовать этот софт для распознание ключевой фразы "Алиса" а потом включать запись и отправку на распознание в google
http://www.opennet.ru/opennews/art.shtml?num=35731
Если поставить чувствительный микрофон. Получится управление без кнопки активации

Тоже сильно заинтересовался темой. Я так понял, что с гугловским распознаванием подружиться вроде бы можно
http://habrahabr.ru/post/133869/
http://habrahabr.ru/post/117234/
А дальше, как сейчас с синтезом, можно будет также сделать выбор, куда слать файл на распознавание: в гугл или локальную прогу. Но в лубом случае нужна ключевая фраза-активатор. Использование телефонов и гарнитур дело интересное, но все же есть большое желание использовать микрофон. Есть какие результаты? Так то вроде бы не сложно локально распознать ключевое слово какой либо прогой, а дальше запустить свое приложение, которое запишет файл до тишины, отправит в гугл, и передаст МД текст.

Bagir · Сообщение **Bagir** » Вс окт 12, 2014 9:37 pm

не обратил бы даже внимания, но вот же как, тоже Алиса http://sky.proglise.info/ Но в программе увы нет возможности отправить текст get запросом.
У коллег на ab-log.ru появилась тоже такая тема http://ab-log.ru/smart-house/speech/speech-recognition Думаю стоит попробовать.

Bagir · Сообщение **Bagir** » Пн окт 13, 2014 11:00 pm

Еще раз просмотрел всю тему, а заодно и тему на http://ab-log.ru/forum/viewtopic.php?f=1&t=17 Надо будет там тоже это написать. Решений и вариантов перебрали массу, но лично мне с утра еще было вообще не понятно что выбрать и как можно сделать. Перерыв кучу пыльной инфы, пока что я выделил следующие два перспективных варианта:

Приложение на телефоне. Сюда же входят варианты гарнитуры, умных часов и т.п.
Плюсы:
- Мобильность.
- Не нужно проводов.
- Всегда короткая дистанция до микрофона.
Минусы:
- Надо его включать, иначе до свидания батарейка.
- Должен быть всегда рядом.
Микрофоны сервера. Будь их несколько в разных звуковых картах, или разных мини компьютерах в удаленных комнатах.
Плюсы:
- Нужно просто сказать.
- Видим где была сказана команда.
Минусы:
- Цена хороших микрофонов.
- Прокладка проводов.
- Не увести далеко от сервера.

Нет смысла спорить чего лучше. Варианты на столько разные, что лично я хочу получить их оба. Но если и дальше продолжать вести обсуждение всего и сразу в одной ветке - будет такая же каша в которой трудно понять что и от куда. Предлагаю сделать так: Отдельная ветка на конкретный вариант. Топикстартер должен будет взять на себя оформление первого поста ветки, пополняя его ссылками и новыми решениями из дальнейшего обсуждения.
Мне более интересен вариант с микрофонами. Его обсуждение прошу продолжить в этой ветке http://smartliving.ru/forum/viewtopic.php?f=5&t=1856
По итогам обсуждения в ее первом сообщении будет собрана вся инфа с примером.

Простое голосовое управление системой

Re: Простое голосовое управление системой

Re: Простое голосовое управление системой

Re: Простое голосовое управление системой

Re: Простое голосовое управление системой

Re: Простое голосовое управление системой

Re: Простое голосовое управление системой

Re: Простое голосовое управление системой

Re: Простое голосовое управление системой