Голосовое управление на основе SDK ОК Гугл (OK Google)

vrnunya · Вт янв 09, 2018 10:53 pm

directman66 писал(а):
vrnunya писал(а):Всем привет. Не стал создавать новую тему (пока). Сделал себе подарок на новый год. Стал счастливы обладателем Amazon Echo Alexa. Колонка просто жара. Конечно же т.к. продукт для США, на неё готового ничего нет. Скажите пожалуйста есть ли идеи по созданию модуля для данного девайса? Есть счастливчики кто уже юзает данный девайс?
Поищите на канале нашего форумчанина.
https://www.youtube.com/watch?v=89zsdS0Tetc
https://www.youtube.com/watch?v=aAWCKUIylh4

вообще полагаю нужны отдельные ветки по алексе и помошнику корпорации добра )

Спасибо. Видео смотрел, но... Думаю отдельный модуль будет очень полезен. Просто получается данный способ не очень удобный. Не получится привязать сценарии( Будет просто голосовое управление. Получается весь смысл МЖД теряется. Алекса будет как отдельный сервис(
На счет отдельной ветки), согласен.

vrnunya · Вт янв 09, 2018 11:42 pm

vrnunya писал(а):
Gelezako писал(а):О, отличные новости, ещё один обладатель Алексы, глядишь скоро нормальный модуль будет. У меня есть реализация на питоне (https://www.youtube.com/watch?v=dwtCju3 ... E&index=17), которая позволяет интегрироваться с МЖД, но что бы был модуль, нужно его портировать на пхп. Это анриал задача для меня пока. Поэтому я использую питоновский скрипт. Можно включать\выключать любые устройства добавленные в МЖД. Видео постом выше, это примеры управления светом без участия МЖД. Исключительно за счёт существующей интеграции плагинов для алексы, которые были написаны компаниями производителями. Но таких не очень много.
Да. Спасибо. Гуглил и смотрел данное видео. Правда у меня МЖД на апельсине, но если не получится один эксперимент, то займусь этим способом)

В общем эксперимент прошел на ура.
Теперь голосом могу включать/выключать свет, диммировать, выключать розетки.
Могу сказать, что ни какой интерпритации с питоном я не ставил, т.к. Была задумка завязать это с homebridge, т.к. в доме есть эпл устройства.
Все прошло на ура. Если честно, не ожидал, даже пиво открыл за такую победу.)))
Единственный минус (для критиков и для тех, кто учил немецкий) - общаться с Алексой надо на английском)

skysilver · Ср янв 10, 2018 12:22 pm

Как альтернативу Google Assistant SDK для распознавания ключевого слова можно посмотреть на Snowboy Hotword Detection https://snowboy.kitt.ai
Там можно замутить свое слово/фразу активации. Из самых популярных английских - Джарвис )) Русские фразы тоже попадаются. Общими усилиями можно вывести "Алиса" в топ, и тогда эта фраза станет универсальной, а не только для вашего конкретного голоса.

SPOILERSPOILER_SHOW

: photo_2018-01-10_12-16-47.jpg (50.55 КБ) 8942 просмотра

: photo_2018-01-10_12-16-48.jpg (51.47 КБ) 8942 просмотра

Вроде, у этого же проекта есть и решения по распознаванию и синтезу речи, но что там с русским не уточнял.

skysilver · Ср янв 10, 2018 12:29 pm

Интересный обзор и сравнение микрофонных массивов:
- Seeed ReSpeaker Mic Array
- Conexant 4-Mic Development Kit
- Microsemi AcuEdge
- MATRIX Creator
- MiniDSP UMA-8
- PlayStation Eye
здесь https://medium.com/snips-ai/benchmarkin ... 0de8876fda

Gelezako · Ср янв 10, 2018 3:21 pm

ну если под апельсинку можно поставить питон, то и на ней всё будет работать

smart_g · Чт янв 11, 2018 4:33 pm

Можно
https://forum.armbian.com/topic/3084-or ... o-library/

*** Сообщение запрещено. Сообщение похоже на спам. ***

fandaymon · Сб янв 13, 2018 11:05 pm

Вот уже пару месяцев стоит голосовое управление по схеме - малинка - PlayStation Eye (микрофонный массив) - ключевое слово на snowboy - распознавание на Гугле - отправка на мажордомо в качестве команды - далее шаблоны - apiai.
Playstation Eye была куплена на али за 9 евро. Как микрофон для голоса работает просто отлично. Гугл почти 100 процентно распознаёт с 2-3 метров
Почему snowboy - потому что это распознавание offline. На сайте надо ввести ключевую фразу, 3 раза её проговорить, подождать пока натренируется сеть, скачать файлик и в принципе всё - дальше всё работает автономно. У жены и меня свои файлы, поэтому отрабатывает довольно не плохо - если говорить примерно с той же интонации, что и при тесте - срабатывает в 80-90 процентах случаев. Заодно можно подставлять юзера, когда результат отправляется в мажордомо.
За основу был взят проект Gassist PI, в котором google assistent заменен на Google Cloud Speech API, для того чтобы пользоваться русским языком

lanket · Вс янв 14, 2018 12:13 pm

fandaymon писал(а):Вот уже пару месяцев стоит голосовое управление по схеме - малинка - PlayStation Eye (микрофонный массив) - ключевое слово на snowboy - распознавание на Гугле - отправка на мажордомо в качестве команды - далее шаблоны - apiai.
Playstation Eye была куплена на али за 9 евро. Как микрофон для голоса работает просто отлично. Гугл почти 100 процентно распознаёт с 2-3 метров
Почему snowboy - потому что это распознавание offline. На сайте надо ввести ключевую фразу, 3 раза её проговорить, подождать пока натренируется сеть, скачать файлик и в принципе всё - дальше всё работает автономно. У жены и меня свои файлы, поэтому отрабатывает довольно не плохо - если говорить примерно с той же интонации, что и при тесте - срабатывает в 80-90 процентах случаев. Заодно можно подставлять юзера, когда результат отправляется в мажордомо.
За основу был взят проект Gassist PI, в котором google assistent заменен на Google Cloud Speech API, для того чтобы пользоваться русским языком

Имиджем не поделитесь?

Отправлено с моего Redmi Note 4 через Tapatalk

fandaymon · Вс янв 14, 2018 6:35 pm

Там отдельного образа нету - всё крутится на той же Малинке, на которой работает Мажордомо.
Ставилось с гита https://github.com/shivasiddharth/GassistPi. Сейчас правда автор поменял концепцию и отказался от сноубоя, но если надо - то старая версия у меня есть
В результате получался работающий на английском ассистент, к которому можно было добавлять свои действия
Далее по подсказке с форума был поставлен пакет под питон http://pythono.ru/speech-recognition-python/
На сайте https://snowboy.kitt.ai/ были получены персональные модели под ключевую фразу Привет Сара, скрипт на питоне был переписан под взаимодействие на русском, ну в принципе и всё

Файл snowboy.py получился таким

Код: Выделить всё

import snowboydecoder
import sys
import signal
import RPi.GPIO as GPIO
import time
import os
import subprocess
import speech_recognition as sr
import urllib.request

subprocess.Popen(["aplay", "/home/pi/GassistPi/sample-audio-files/customwakeword.wav"], stdin=subprocess.PIPE, stdout=subprocess.PIPE, stderr=subprocess.PIPE)

interrupted = False

#Add your custom models here
models = ['/home/pi/GassistPi/src/resources/sarah.pmdl', '/home/pi/GassistPi/src/resources/sarah_hella.pmdl']

def signal_handler(signal, frame):
    global interrupted
    interrupted = True



def interrupt_callback():
    global interrupted
    return interrupted

def detected():

    snowboydecoder.play_audio_file(snowboydecoder.DETECT_DING)

    r = sr.Recognizer()
    with sr.Microphone() as source:
        audio = r.listen(source)
        command=r.recognize_google(audio, language="ru-RU")
        
        link='http://127.0.0.1/command.php?qry=' + urllib.parse.quote_plus(command)
        f=urllib.request.urlopen(link)

# capture SIGINT signal, e.g., Ctrl+C
signal.signal(signal.SIGINT, signal_handler)

sensitivity = [0.5]*len(models)
detector = snowboydecoder.HotwordDetector(models, sensitivity=sensitivity)
callbacks = [detected, detected]
print('Listening... Press Ctrl+C to exit')

# main loop
# make sure you have the same numbers of callbacks and models
detector.start(detected_callback=callbacks,
               interrupt_check=interrupt_callback,
               sleep_time=0.03)

detector.terminate()

fandaymon · Вс янв 14, 2018 6:43 pm

В строчке callbacks = [detected, detected] указаны функции, которые будут запускаться по первому и второму ключевому слову. Их можно сделать разными, соответственно по разному реагировать, например, подставить пользователя

MajorDoMo

Голосовое управление на основе SDK ОК Гугл (OK Google)

Re: Голосовое управление на основе SDK ОК Гугл (OK Google)

Re: Голосовое управление на основе SDK ОК Гугл (OK Google)

Re: Голосовое управление на основе SDK ОК Гугл (OK Google)

Re: Голосовое управление на основе SDK ОК Гугл (OK Google)

Re: Голосовое управление на основе SDK ОК Гугл (OK Google)

Re: Голосовое управление на основе SDK ОК Гугл (OK Google)

Re: Голосовое управление на основе SDK ОК Гугл (OK Google)

Re: Голосовое управление на основе SDK ОК Гугл (OK Google)

Re: Голосовое управление на основе SDK ОК Гугл (OK Google)

Re: Голосовое управление на основе SDK ОК Гугл (OK Google)