Я так понял, что задумка изначально была весьма глобальная. Не хуже Сфинкса.fandaymon писал(а): Пт фев 28, 2020 5:07 pm SnowBoy это вообще не про языковые модели. Весь смысл что ключевые слова человек сам записывает. И он нужен чтобы отслеживать произнесение ключевого слова, а дальше записывается аудио в течение определенного времени и распознаётся гуглом
Пример тому - тот же проект SUSI (https://www.youtube.com/watch?v=V9N6K4SzpXw).
Во всяком случае, судя по архитектуре (и даже файлам) реализован SnowBoy похожим образом и отлично работает off-лайн. В простейшем случае с микрофона записывается образец ключевой фразы, строится голосовой шаблон в хитром формате, и дальше он используется для сравнения.
Можно было бы двигаться в этом направлении и предлагать пользователям писать образец под себя, но там возникает масса вопросов... Например, чтобы одновременно работать с несколькими образцами - нужно переписывать бинарники, а нас обычно интересует не один голос, а куча домочадцев... и т.п.
В любом случае, у меня не получилось с ним хорошо поиграться, т.к. я столкнулся в исходниках с рядом сложностей. Хотя, примеры посмотрел и опробовал.