Простое голосовое управление системой

Использование системы в различных ситуациях, вопросы программирования сценариев.

Модератор: immortal

Аватара пользователя
sergejey
Site Admin
Сообщения: 4286
Зарегистрирован: Пн сен 05, 2011 6:48 pm
Откуда: Минск, Беларусь
Благодарил (а): 76 раз
Поблагодарили: 1559 раз
Контактная информация:

Re: Простое голосовое управление системой

Сообщение sergejey » Вт сен 23, 2014 11:30 am

dmw писал(а):Вот неплохая интересная статья по использованию движка Pocketsphinx:
Сверхбыстрое распознавание речи без серверов на реальном примере
К нам нельзя прикрутить?
Можно попросить человека :) Если заинтересуется, то поможет.

Сергей Джейгало, разработчик MajorDoMo
Идеи, ошибки -- за предложениями по исправлению и развитию слежу только здесь!
Профиль Connect -- информация, сотрудничество, услуги
Аватара пользователя
Amarok
Сообщения: 1427
Зарегистрирован: Пт дек 14, 2012 12:24 pm
Откуда: Россия, Нижняя Тура
Благодарил (а): 460 раз
Поблагодарили: 126 раз
Контактная информация:

Re: Простое голосовое управление системой

Сообщение Amarok » Вт сен 23, 2014 11:49 am

А может хабро-юзеры спросят?
Моя Алиска живёт на Proxmox в Debian 12
Dark_Veter
Сообщения: 295
Зарегистрирован: Вт апр 23, 2013 5:16 pm
Откуда: Брянск
Благодарил (а): 18 раз
Поблагодарили: 94 раза

Re: Простое голосовое управление системой

Сообщение Dark_Veter » Пт сен 26, 2014 2:35 pm

Есть проект https://play.google.com/store/apps/deta ... iassistant, который как я понял как раз использует Pocketsphinx для распознования. Есть возможность голосовой активации и создания собственных сценариев. Думал как привязать к Алисе, но не нашел возможности отправлять get запросы через нее. Можно попробовать открывать браузер, потом закрывать при получении команды, но это не очень удобно. На 4pda пишут, что есть интеграция с таскером, может через него получится сделать.
Debian GNU/Linux 7.9 (wheezy), версия 0.9.0b, Connect
Аватара пользователя
sergejey
Site Admin
Сообщения: 4286
Зарегистрирован: Пн сен 05, 2011 6:48 pm
Откуда: Минск, Беларусь
Благодарил (а): 76 раз
Поблагодарили: 1559 раз
Контактная информация:

Re: Простое голосовое управление системой

Сообщение sergejey » Пт сен 26, 2014 3:01 pm

Dark_Veter писал(а):Есть проект https://play.google.com/store/apps/deta ... iassistant, который как я понял как раз использует Pocketsphinx для распознования. Есть возможность голосовой активации и создания собственных сценариев. Думал как привязать к Алисе, но не нашел возможности отправлять get запросы через нее. Можно попробовать открывать браузер, потом закрывать при получении команды, но это не очень удобно. На 4pda пишут, что есть интеграция с таскером, может через него получится сделать.
Если я правильно понял, то pocketsphinx используется только для распознания фразы-активации, остальное через гугл. С таскером интеграция заявлена и если так, то передавать команды Алисе труда не составит.

Сергей Джейгало, разработчик MajorDoMo
Идеи, ошибки -- за предложениями по исправлению и развитию слежу только здесь!
Профиль Connect -- информация, сотрудничество, услуги
PAV
Сообщения: 968
Зарегистрирован: Пт дек 06, 2013 11:30 am
Откуда: Москва
Благодарил (а): 71 раз
Поблагодарили: 95 раз

Re: Простое голосовое управление системой

Сообщение PAV » Вт сен 30, 2014 9:49 am

А кстати, если у нас есть хабражители - поделитесь приглашением;), а то чего-то ни одна статья не прокатила.
Аватара пользователя
Bagir
Сообщения: 1615
Зарегистрирован: Вт сен 17, 2013 6:46 pm
Откуда: Ярославская область город Углич
Благодарил (а): 212 раз
Поблагодарили: 375 раз

Re: Простое голосовое управление системой

Сообщение Bagir » Вс окт 12, 2014 12:17 am

Ivan писал(а):Что если использовать этот софт для распознание ключевой фразы "Алиса" а потом включать запись и отправку на распознание в google
http://www.opennet.ru/opennews/art.shtml?num=35731
Если поставить чувствительный микрофон. Получится управление без кнопки активации
Тоже сильно заинтересовался темой. Я так понял, что с гугловским распознаванием подружиться вроде бы можно
http://habrahabr.ru/post/133869/
http://habrahabr.ru/post/117234/
А дальше, как сейчас с синтезом, можно будет также сделать выбор, куда слать файл на распознавание: в гугл или локальную прогу. Но в лубом случае нужна ключевая фраза-активатор. Использование телефонов и гарнитур дело интересное, но все же есть большое желание использовать микрофон. Есть какие результаты? Так то вроде бы не сложно локально распознать ключевое слово какой либо прогой, а дальше запустить свое приложение, которое запишет файл до тишины, отправит в гугл, и передаст МД текст.
Windows 10, HTTP, MegaD, Z-Wave, 1-Wire, CONNECT
Аватара пользователя
Bagir
Сообщения: 1615
Зарегистрирован: Вт сен 17, 2013 6:46 pm
Откуда: Ярославская область город Углич
Благодарил (а): 212 раз
Поблагодарили: 375 раз

Re: Простое голосовое управление системой

Сообщение Bagir » Вс окт 12, 2014 9:37 pm

не обратил бы даже внимания, но вот же как, тоже Алиса http://sky.proglise.info/ Но в программе увы нет возможности отправить текст get запросом.
У коллег на ab-log.ru появилась тоже такая тема http://ab-log.ru/smart-house/speech/speech-recognition Думаю стоит попробовать.
Windows 10, HTTP, MegaD, Z-Wave, 1-Wire, CONNECT
Аватара пользователя
Bagir
Сообщения: 1615
Зарегистрирован: Вт сен 17, 2013 6:46 pm
Откуда: Ярославская область город Углич
Благодарил (а): 212 раз
Поблагодарили: 375 раз

Re: Простое голосовое управление системой

Сообщение Bagir » Пн окт 13, 2014 11:00 pm

Еще раз просмотрел всю тему, а заодно и тему на http://ab-log.ru/forum/viewtopic.php?f=1&t=17 Надо будет там тоже это написать. Решений и вариантов перебрали массу, но лично мне с утра еще было вообще не понятно что выбрать и как можно сделать. Перерыв кучу пыльной инфы, пока что я выделил следующие два перспективных варианта:
  • Приложение на телефоне. Сюда же входят варианты гарнитуры, умных часов и т.п.
    Плюсы:
    • Мобильность.
    • Не нужно проводов.
    • Всегда короткая дистанция до микрофона.
    Минусы:
    • Надо его включать, иначе до свидания батарейка.
    • Должен быть всегда рядом.
  • Микрофоны сервера. Будь их несколько в разных звуковых картах, или разных мини компьютерах в удаленных комнатах.
    Плюсы:
    • Нужно просто сказать.
    • Видим где была сказана команда.
    Минусы:
    • Цена хороших микрофонов.
    • Прокладка проводов.
    • Не увести далеко от сервера.
Нет смысла спорить чего лучше. Варианты на столько разные, что лично я хочу получить их оба. Но если и дальше продолжать вести обсуждение всего и сразу в одной ветке - будет такая же каша в которой трудно понять что и от куда. Предлагаю сделать так: Отдельная ветка на конкретный вариант. Топикстартер должен будет взять на себя оформление первого поста ветки, пополняя его ссылками и новыми решениями из дальнейшего обсуждения.
Мне более интересен вариант с микрофонами. Его обсуждение прошу продолжить в этой ветке http://smartliving.ru/forum/viewtopic.php?f=5&t=1856
По итогам обсуждения в ее первом сообщении будет собрана вся инфа с примером.
Windows 10, HTTP, MegaD, Z-Wave, 1-Wire, CONNECT
Ответить