Страница 4 из 12
Re: Часть функционала Алисы в "облаке"
Добавлено: Вт сен 23, 2014 11:40 am
sergejey
Да пока как-то не очень успехи. Т.е. просто нет времени в этом направлении двигаться... Как-то пытался прикрутить "расскажи про фильм ...", но наткнулся на сильную защиту КиноПоиска от роботов, не поборол и забросил пока. Насчёт википедии хорошая идея, я как-то тоже смотрел, но не всегда в первом абзаце краткое объяснение -- временами достаточно пары предложений. В общем, если кто-то займётся исследованием из каких источников можно брать относительно краткую информацию по запросам, то будем развивать быстрее. Ну и я постараюсь возобновить по этому направлению работы.
Re: Часть функционала Алисы в "облаке"
Добавлено: Вт сен 23, 2014 2:53 pm
Dark_Veter
В Plex есть плагин, который берет информацию о фильме в кинопоиске. Как я понимаю работает он так: Сначала в гугле ищет ссылку на страницу с фильмом, с помощью примерно такого запроса:
А потом берет первую ссылку и парсит полученную страницу. Народ пишет, чтобы избежать бана достаточно авторизоваться на кинопоиске. Код парсера можно подсмотреть например тут:
http://wolf-et.ru/php/kinopoisk-ru-parser/
Не очень силен в программировании, но могу посодействовать сем смогу.
Re: Часть функционала Алисы в "облаке"
Добавлено: Вт сен 23, 2014 8:58 pm
Bagir
Я как то наткнулся на видео обзор. Подопытным был Кубик. Квадратная коробка. Распознавание и синтез речи. Впрочем, лучше один раз увидеть, вот:
http://www.youtube.com/watch?v=twGfhrxl3AQ
http://www.youtube.com/watch?v=q1X6hYYqAUk
Вопрос "Что такое ..." как раз после этого меня и заинтересовал. Пару месяцев назад, на сайте МДМ я мог увидеть только погоду. Сейчас под управлением полно всякого железа. Конечно очень бы хотелось добавить хотя бы небольшой элемент общения в виде вопросов. Очень хочется помочь. Но знаний пока еще мало.
Действительно довольно трудно определить источники и размер информации, которую надо взять. Тут не обойтись без большого теста, в котором могут принять участие все желающие.
План такой:
1. Определяем вопрос и сайт, от куда можно стянуть ответ.
2. Вначале просто делаем несколько, а точнее даже очень много попыток получить информацию в браузере.
3. Когда уже есть определенные результаты, пишем тут предложение.
Если предложение будет принято, Сергей добавит этот вопрос в облако. Дальше самое интересное. Нужно любыми путями использовать рабочую силу участников форума. Например так:
1. Вопрос добавляется в режиме тестирования.
2. Вопрос и ответ будут сохранены.
3. В конце Алиса должна спросить в виде простых вопросов Да/Нет на сколько точный и полный был ответ.
Все эти результаты должны сливаться в условно открытый ресурс, где заинтересованные участники могут просматривать вопросы с отрицательными результатами, и принимать решения для исправления парсера.
Очень не многие могут писать и править код. Но желание помочь есть у всех. Надо по возможности забрать на себя обсуждение и поиск новых решений, и все работы по анализу полученных данных.
Re: Часть функционала Алисы в "облаке"
Добавлено: Ср сен 24, 2014 2:11 pm
sergejey
Я попробовал добавить ответ на вопрос "что такое ...".
В общем, если у вас подключен connect, то можно попробовать у Алисы поспрашивать различные термины.
Re: Часть функционала Алисы в "облаке"
Добавлено: Ср сен 24, 2014 2:42 pm
Bagir
Работает! Только похоже зацепляет лишние пустые строки. Сейчас толком разберусь в чем дело
Re: Часть функционала Алисы в "облаке"
Добавлено: Ср сен 24, 2014 2:55 pm
Bagir
Возможно я сейчас спешу с выводами, но по моему в ответ пролетают символы переноса строки. Не уверен, что они там нужны. Да и при использовании другого внешнего плеера для чтения текста через командную строку их так не передать.
Re: Часть функционала Алисы в "облаке"
Добавлено: Ср сен 24, 2014 3:05 pm
Bagir
Вот что уходит на чтение:
- 16:03:16 DEBUG [root]: Executing (exclusive): d:\server\apps\tell\tell.exe
Стул — мебельное изделие для сидения одного человека, с твёрдой спинкой и твёрдым сиденьем, с высотой сиденья, функционально удобной при соотношении его с высотой стола[1] (at D:\Server\www\majordomo\lib\general.class.php:390)
16:03:16 DEBUG [root]: Executing (exclusive): d:\server\apps\tell\tell.exe Основные части стула — сиденье и спинка, в типичном стуле сиденье опирается на четыре ножки, иногда в конструкцию стула входят подлокотники (at D:\Server\www\majordomo\lib\general.class.php:390)
Обратите внимание на символы перевода строки и   (Неразрывный пробел);
Еще проскакивают паразитные пробелы слева и справа.
Наверное стоит у каждого сообщения, оправляемого в синтез, вначале заменить все переносы строк и символы неразрывного пробела ( ) на простые пробелы, а затем обрезать все пробелы слева и справа.
Re: Часть функционала Алисы в "облаке"
Добавлено: Ср сен 24, 2014 3:32 pm
sergejey
Ага, учёл.
Re: Часть функционала Алисы в "облаке"
Добавлено: Ср сен 24, 2014 3:43 pm
Bagir
Волшебно !!!
Теперь все нормально.
16:42:04 DEBUG [root]: Executing (exclusive): d:\server\apps\tell\tell.exe Стол — мебельное изделие, представляющее собой приподнятую над уровнем пола поверхность, предназначенную для расположения на ней различных предметов и для выполнения на ней различных работ, принятия пищи и др (at D:\Server\www\majordomo\lib\general.class.php:390)
16:42:04 DEBUG [root]: Executing (exclusive): d:\server\apps\tell\tell.exe В роли стола может выступать и не приподнятая над полом поверхность, что дополнительно усложняет задачу нахождения исчерпывающего определения стола (at D:\Server\www\majordomo\lib\general.class.php:390)
Продолжаем тестировать!
Re: Часть функционала Алисы в "облаке"
Добавлено: Ср сен 24, 2014 3:46 pm
Bagir
Возможно стоит игнорировать знак ? в конце (и точку тоже)
Например:
Что такое стол
и
Что такое стол?
второе не ищет.