Голосовое управление на основе SDK ОК Гугл (OK Google)

Модератор: immortal

Аватара пользователя
lanket
Сообщения: 1168
Зарегистрирован: Вт окт 14, 2014 11:27 pm
Откуда: Санкт-Петербург
Благодарил (а): 260 раз
Поблагодарили: 163 раза

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение lanket » Пн сен 04, 2017 2:18 pm

serghei писал(а):
lanket писал(а):....Но проблема то в сжатии. Есп говорят не по силам сжать на лету звук. Хотя есп 32 наверное уже сможет да библиотеки то наверное ещё нету.
Да вроде как бы уже китайцы что то сотворили и уже продают Здесь. Упоминание можно посмотреть Тут. Код есть на Гитхабе , но кажется написан в IDF.
Я третий месяц ковыряю ESP32 и пока встречал реализацию декодирования потоков только сторонними микрухами. А ESP только их добывает в Интернете )).
Спасибо за наводку, друг как в Китай поедет наверное приобрету для опытов.
Я хотел реализовать с аналогичной esp8266 + atmega+audio Coder decoder. Но так и недождался посылки и потом они пропали из продажи на али.

Если с апельсинкой зеро на борту андрюша не получиться, то наверное проще будет взять простую esp8266 связать с (Модули VS1003B Модуль MP3 WMA WAV Аудио Кодек Декодирования Кодирование Модуль Развития Комплекты
http://s.aliexpress.com/JnqIBvUb
(from AliExpress Android))
И будет счастье.

Времени к сожалению нет сейчас экспрементировать.

Отправлено с моего Redmi Note 3 через Tapatalk
Разработка голосового асистента для Мажордомо по любому ключевому слову.
:arrow: Обсужение
:arrow: gitHub 2й версии терминала
:arrow: GitHub модуля для МД
gitHub сырого модуля 2й версии
:arrow: Connect
Rasberry Pi 2, MDM, MySensors. И говорящий апельсин.
Аватара пользователя
lanket
Сообщения: 1168
Зарегистрирован: Вт окт 14, 2014 11:27 pm
Откуда: Санкт-Петербург
Благодарил (а): 260 раз
Поблагодарили: 163 раза

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение lanket » Пн сен 04, 2017 2:25 pm

Ну или такую штуку к esp8266 прикрутить
Модуль UDA1380 доска uda 1380 модуль стерео аудио кодеков декодер на основе I2S Интерфейс
http://s.aliexpress.com/VZRB3UJn
(from AliExpress Android)

Отправлено с моего Redmi Note 3 через Tapatalk
За это сообщение автора lanket поблагодарил:
directman66 (Пн сен 04, 2017 4:57 pm)
Рейтинг: 1.16%
Разработка голосового асистента для Мажордомо по любому ключевому слову.
:arrow: Обсужение
:arrow: gitHub 2й версии терминала
:arrow: GitHub модуля для МД
gitHub сырого модуля 2й версии
:arrow: Connect
Rasberry Pi 2, MDM, MySensors. И говорящий апельсин.
Аватара пользователя
lanket
Сообщения: 1168
Зарегистрирован: Вт окт 14, 2014 11:27 pm
Откуда: Санкт-Петербург
Благодарил (а): 260 раз
Поблагодарили: 163 раза

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение lanket » Пн сен 04, 2017 3:06 pm

Я так понял что она по умолчанию просто слушает эфир и если есть звуки пытается распознать.
Вроде как писали ранее что онлайн распозновплки имеют ограничения на количество распознаваний в сутки что не позволяет слать все произнесенные слова ради вылавливания ключевого.

А в идеале надо распозновать после ключевого слова, с чем успешно справляется платка из первого поста.

Если её прикрутить к этой то вроде то что надо, но по фото трудно понять есть ли выводы прерывания есп.

Отправлено с моего Redmi Note 3 через Tapatalk
Разработка голосового асистента для Мажордомо по любому ключевому слову.
:arrow: Обсужение
:arrow: gitHub 2й версии терминала
:arrow: GitHub модуля для МД
gitHub сырого модуля 2й версии
:arrow: Connect
Rasberry Pi 2, MDM, MySensors. И говорящий апельсин.
Аватара пользователя
lanket
Сообщения: 1168
Зарегистрирован: Вт окт 14, 2014 11:27 pm
Откуда: Санкт-Петербург
Благодарил (а): 260 раз
Поблагодарили: 163 раза

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение lanket » Вт сен 05, 2017 9:10 pm

Пошукал тут на 4пда на тему апельсинки. Подкинули ссылку на пошаговую инструкцию реализации голосового ассистента OK Google на orange pi zero написанный на питоне.
Сам врятли разберусь уж слишком запутано. С питоном совсем ни разу не дружил. Если кому интересно Вот ссылка
https://www.cnx-software.com/2017/07/30 ... stant-sdk/

Отправлено с моего Redmi Note 3 через Tapatalk
За это сообщение автора lanket поблагодарил:
dmw (Ср сен 06, 2017 12:31 pm)
Рейтинг: 1.16%
Разработка голосового асистента для Мажордомо по любому ключевому слову.
:arrow: Обсужение
:arrow: gitHub 2й версии терминала
:arrow: GitHub модуля для МД
gitHub сырого модуля 2й версии
:arrow: Connect
Rasberry Pi 2, MDM, MySensors. И говорящий апельсин.
Аватара пользователя
lanket
Сообщения: 1168
Зарегистрирован: Вт окт 14, 2014 11:27 pm
Откуда: Санкт-Петербург
Благодарил (а): 260 раз
Поблагодарили: 163 раза

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение lanket » Ср сен 06, 2017 11:47 pm

Вобщемто попробовал поставить линух на апельсинку и прикрутить ОК ГУГЛ к нему по инструкции выше.

На удивление прошло все без танцев с бубнами.

Результат такойже как описывает автор статьи, мол что то происходит но ничего не понимает этот гугл. Он грешит на встроенный микрофон. Автор утверждает что подключив внешний USB микрофон все заработало. Этот эксперемент уже завтра.

Но меня гложет другой вопрос.
Когда завтра это заработает, зачем эта затея вообще нужна?
Ну поболтаю с гуглом. А дальше что?
Ради чего мне дали эту наводку на 4ПДА?

Разве можно его както использовать для отправки команд Алисе?
И если да то "ОК ГУГЛ" как то не очень в качестве обращения к УД, пменять бы если это возможно.

Кто нибудь что нибудь про это знает? Есть смысл дальше ковырять это напраление?
Разработка голосового асистента для Мажордомо по любому ключевому слову.
:arrow: Обсужение
:arrow: gitHub 2й версии терминала
:arrow: GitHub модуля для МД
gitHub сырого модуля 2й версии
:arrow: Connect
Rasberry Pi 2, MDM, MySensors. И говорящий апельсин.
ferrumlogic
Сообщения: 17
Зарегистрирован: Сб ноя 19, 2016 7:56 am
Благодарил (а): 21 раз
Поблагодарили: 2 раза

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение ferrumlogic » Чт сен 07, 2017 9:01 am

Google Assistant, как мне кажется, полноценный комплекс управления IOT. Прикручивать его к Алисе несколько избыточно (хотя и интересно).
Нашел вот такую разработку. Можно было бы распознанную фразу отправлять в чат Алисе на выполнение команды.
skysilver
Сообщения: 3006
Зарегистрирован: Чт авг 21, 2014 8:28 am
Откуда: Киров, Россия
Благодарил (а): 400 раз
Поблагодарили: 1753 раза
Контактная информация:

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение skysilver » Чт сен 07, 2017 12:13 pm

lanket писал(а):Он грешит на встроенный микрофон. Автор утверждает что подключив внешний USB микрофон все заработало. Этот эксперемент уже завтра.
Ждем результатов. ;)
А этот Google Assistant SDK с русской речью работает вообще?
MajorDoMo (GitHub) на Cubietruck. ОС Debian 7 (wheezy) (kernel 3.4.105) с переносом на HDD.
Мой CONNECT | Блоги | Telegram
Аватара пользователя
lanket
Сообщения: 1168
Зарегистрирован: Вт окт 14, 2014 11:27 pm
Откуда: Санкт-Петербург
Благодарил (а): 260 раз
Поблагодарили: 163 раза

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение lanket » Чт сен 07, 2017 12:14 pm

ferrumlogic писал(а):Google Assistant, как мне кажется, полноценный комплекс управления IOT. Прикручивать его к Алисе несколько избыточно (хотя и интересно).
Нашел вот такую разработку. Можно было бы распознанную фразу отправлять в чат Алисе на выполнение команды.
Если я правильно понял буржуйские слова. То эта приблуда просто слушает и распознает весь текст из эфира. Если я прав, то она никак не реагирует на ключевые слова. А это означает что в Алису будет сыпаться куча всякого ненужного хлама из эфира. Что за собой тянет ещё одну проблему с ограничением на бесплатное api по количеству слов распознавания. Соответственно Если я прав, то активировать можно только по нажатии кнопочки, что не очень удобно. Поправьте если я ошибаюсь. Если всё-таки она может реагировать на ключевые слова то вещь хорошая которая решает задачу правда чуть дороже но из коробки .

Отправлено с моего Redmi Note 3 через Tapatalk
Разработка голосового асистента для Мажордомо по любому ключевому слову.
:arrow: Обсужение
:arrow: gitHub 2й версии терминала
:arrow: GitHub модуля для МД
gitHub сырого модуля 2й версии
:arrow: Connect
Rasberry Pi 2, MDM, MySensors. И говорящий апельсин.
Аватара пользователя
lanket
Сообщения: 1168
Зарегистрирован: Вт окт 14, 2014 11:27 pm
Откуда: Санкт-Петербург
Благодарил (а): 260 раз
Поблагодарили: 163 раза

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение lanket » Чт сен 07, 2017 12:16 pm

А по поводу полноценной неполноценной комплекс, думаю что это не очень важно. Главное что за недорого и есть решение, Надеюсь что есть, можно реагировать на ключевые слова и отправлять в Алису готовые команды.

Отправлено с моего Redmi Note 3 через Tapatalk
Разработка голосового асистента для Мажордомо по любому ключевому слову.
:arrow: Обсужение
:arrow: gitHub 2й версии терминала
:arrow: GitHub модуля для МД
gitHub сырого модуля 2й версии
:arrow: Connect
Rasberry Pi 2, MDM, MySensors. И говорящий апельсин.
Аватара пользователя
lanket
Сообщения: 1168
Зарегистрирован: Вт окт 14, 2014 11:27 pm
Откуда: Санкт-Петербург
Благодарил (а): 260 раз
Поблагодарили: 163 раза

Re: Реализация голосового управления по типу ОК Гугл (OK Goo

Сообщение lanket » Чт сен 07, 2017 5:56 pm

По ходу не так уж и трудно заставить этот Google assistant SDK работать на МД. Надо только в питоне разобраться. Гугл даже примеров накидал для изучения. Вот краткий и понятный миниурок по работе с sdk.

Отправлено с моего Redmi Note 3 через Tapatalk
Разработка голосового асистента для Мажордомо по любому ключевому слову.
:arrow: Обсужение
:arrow: gitHub 2й версии терминала
:arrow: GitHub модуля для МД
gitHub сырого модуля 2й версии
:arrow: Connect
Rasberry Pi 2, MDM, MySensors. И говорящий апельсин.
Ответить