Самый лучший голосовой помощник – «Какие существуют голосовые помощники на русском языке или очень хорошие на английском для русского человека?» – Яндекс.Кью

Содержание

Список TOP-30 популярных голосовых помощников в мире

Голосовые технологии шагают впереди планеты всей, а вместе с этим трендом появляются все новые и новые голосовые ассистенты, используемые для различных целей.

Мы подготовили список доступных широкой общественности голосовых помощников (некоторые разработки еще находятся на стадии тестирования и в перечень не попали), среди которых Вы найдете , как знакомые имена Siri, Алисы, так и экзотические для нас разработки, которые популярны в других странах.

6 самых популярных голосовых помощников в мире

Хронология официальных релизов наиболее популярных голосовых ассистентов
  • Алиса от Яндекс. Отечественную разработку поставили в начале списка. Пока распространена на просторах СНГ, так как понимает только русский язык. Заметным преимуществом на русскоязычном сегменте, является интеграция с сервисами и гаджетами Яндекса. Официальный сайт https://alice.yandex.ru
  • Google Assistant от Google. Это наиболее распространенный голосовой помощник, работающий с несколькими операционными системами, также он интегрирован с платформой Android (OS от Google) и фирменными гаджетами компании: телефонами, часами, колонками и др. Но основное преимущество в другом: голосовой помощник от корпорации добра работает на более чем 36 языках (если считать вместе с диалектами), в том числе и на русском. Здесь также стоит упомянуть и более раннюю разработку от Гугл — Google Now, который стал базой для современного голосового ассистента компании. Официальный сайт https://assistant.google.com/intl/en_uk/
  • Siri от Apple. Данный ассистент присутствует во всем мире, где есть продукция яблочного гиганта, наиболее распространена в США и Европе. Поддерживает 20 языков, в том числе и русский, что делает Сири одним из наиболее «многоязычных» голосовых помощников. Официальный сайт https://www.apple.com/siri/
  • Alexa от AmazonАнглоязычная разработка с ареалом распространения в США и Канаде, обитающая, прежде всего, в колонках и других атрибутах умного дома от Амазон. Не так давно Алексу научили немецкому и японскому языкам. Официальный сайтhttps://alexa.amazon.com/
  • Bixby от SamsungГолосовой ассистент, который тесно связан с устройствами компании Самсунг и поддерживает 4 языка, на русском не говорит. Здесь также стоит отметить и вторую голосовую разработку под названием Viv, которую изначально разрабатывали создатели Сири, и которая по обещаниям Самсунг, выкупившей стартап, будет интегрирована в Bixby 2.0 Официальный сайт https://www.samsung.com/global/galaxy/apps/bixby/
  • Cortana от Microsoft. Штатный голосовой ассистент на платформе Windows пока не доступен на русском, но работает на 8 языках. Официальный сайт https://www.microsoft.com/en-us/cortana

Прочие голосовые ассистенты

Мы не будем детально останавливаться на каждом голосовом помощнике из списка ниже, если Вам будут интересны подробности о конкретной разработке из перечня, пишите об этом в комментариях, и мы обязательно осветим эти моменты в одной из следующих публикаций.

  • Ассистент Дуся от UseYoVoice
  • AliGenie от Alibaba Group
  • Duer от Baidu
  • Watson от IBM
  • M от Facebook
  • Hound от Houndify
  • DataBot от RoboBot Studio
  • Extreme от MULTIVERSE SOFTWARE
  • Dragon от Nuance Communications
  • Lyra от Artificial Solutions
  • Erica от Bank Of America
  • 24me от 24me LTD
  • Star от Starbucks
  • Dom от Dominos
  • Sirius от University of Michigan
  • Sphinx от CMU Sphinx
  • Jarvis от ItsMyLab
  • Alice от AIVC
  • Robin от Robin Labs
  • Braina от BrainaSoft
  • Mycroft от Mycroft
  • SILVIA от SILVIA
  • Xiaowei от Tencent
  • Clova от Naver Corporation

Если Вы владеете информацией о голосовых помощниках, не попавших в наш список, напишите в комментариях со ссылкой на источник информации. Будем наполнять перечень совместно.

( Пока оценок нет )

Понравилась статья? Поделиться с друзьями:

Голосовые помощники на русском — Siri, Google Ассистент, Яндекс.Алиса — выбор лучшего ассистента

В России наконец-то заработал «Google. Ассистент» — голосовой помощник, собравший массу хвалебных отзывов за рубежом. Мы сравнили его с двумя другими персональными ассистентами, доступными на русском языке. Кто оказался умнее?

Принципы сравнения просты. Сначала мы будем задавать каждому из ассистентов вопросы, проверяющие их способность искать информацию в интернете и, что более важно, вычленять из всего найденного объема краткий ответ. Затем мы попросим помощников сделать для нас что-нибудь, причем задачи постараемся ставить такие, чтобы от них могла быть реальная польза в повседневной жизни.

Siri мы проверим на iPhone X и последней бете iOS 12 (на iOS 11 она выдает те же ответы), Google Assistant — на ZenFone Max Pro, работающем на «стоковом» Android 8.1. На нем же будем запускать и Алису через приложение «Яндекс».

Кроме того, разговаривать мы с ними будем на русском языке, хоть и проверим способность помощников на ходу переключатся с русской речи на английскую.

Поехали!

Вопросы

Начнем с парочки действительно сложных для ИИ вопросов

Почему небо голубое?

Ответил лишь Google Ассистент. Алиса выдала список ссылок из «Яндекса», а Сири вообще не поняла, чего от нее хотят.

Почему страусы прячут голову в песок?

Снова справились только Алиса и Ассистент. Сири лишь поделилась ссылками из Google.

Очередь более простых и конкретных вопросов:

Кто изобрел автомобиль?

Алиса и Ассистент не испытали никаких проблем, а помощник Google еще и приложил к ответу интересный бэкграунд.

Сири же выдала список ближайших автосалонов. «Блестяще»!

Теперь — несколько понятных и распространенных типов вопросов:

Права лишь Алиса! Ни Сири, ни Ассистент смысла вопроса не поняли. «Яндекс» — молодцы!

Алиса и Ассистент держат планку. Сири как всегда…

Время кулинарных вопросов!

Алиса и Ассистент выдали ответ со ссылкой на источник, Siri не смогла и решила открыть филиал Google.

Дальше — расстояния

Здесь все поинтереснее. Сири, пожалуй, впервые не растерялась и запустила Apple Maps, проложив маршрут от Москвы до Владивостока. Ассистент сделал то же самое, но в том же окне, да еще и ответил на поставленный вопрос. Алиса перед этой задачей спасовала, однако на вопрос, сколько

ехать до Владивостока, она отвечает запросто.

Раунд за Ассистентом Google!

Теперь — вопросы, привязанные к актуальным событиям:

Да, Сири действительно открывает App Store, если спросить ее, как сыграл «Локомотив». Алиса то ли отшучивается, то ли думает, что шутим мы. И только Ассистент выдал четкий и точный ответ.

Дальше посложнее. Вопросы на индексацию новостей:

Все три помощника выдали поисковые ссылки с небольшими превью. Однако в окне Ассистента правильный ответ выделен жирным шрифтом, поэтому можно считать, что только этот бот справился с заданием.

Ассистент выступил блестяще, Алиса с Сири отбились ссылками, но в окне помощника «Яндекса» хотя бы видно название фильма.

Еще один вопрос про «Оскар» — но посложнее:

И вновь Ассистент на высоте! Сири внезапно ответила на вопрос, который ей задавали полчаса назад, Алиса открыла «Яндекс». Кроме того, Ассистент распознал контекст — понял, что «про него» — это про Тома Хэнкса.

Еще немного кино:

Все как всегда: Сири опять городит черти-что, Алиса и Ассистент справляются без труда.

Теперь — к знаменитостям:

Программа «Престолы»? Сири, ты серьезно? У Алисы и Ассистента все как всегда хорошо.

Теперь задачка на распознавание контекста. Ассистент в него «умеет», поэтому посмотрим на Алису и Сири.

На первый вопрос Сири ответила (и даже, что забавно, показала возраст Дурова), а вот второй посчитала за отдельный. Алиса выступила на уровне Google Ассистента.

Теперь — к менее известным фактам:

Сири вообще не поняла, на каком языке к ней обратились. Ассистент с Алисой как всегда не подвели.

Задачи

Начнем с самых простых и полезных.

Сообщения:

А вот здесь подводит уже Алиса. Siri и Ассистент отправляют сообщения, Алиса отшучивается. Никому она ничего, конечно, не передала. Скорее всего, это связано с тем, что и Сири, и Google Ассистент — нативные помощники для своих систем, тогда как Алиса — стороннее приложение.

К слову о них: сообщения в сторонних приложениях:

Siri в этот раз не подвела — все четко. Ассистент тоже. Алиса опять отшутилась. И опять неудачно.

Теперь — музыка:

Обидно, что несмотря на встроенный в iOS Apple Music Сири испытывает большие проблемы с тем, чтобы включать песни западных исполнителей. Грамотно отличать русский от английского помощник Apple пока так и не умеет.

Ассистент и Алиса четко поняли, что требуется сделать и запустили Google Play Music и «Яндекс. Музыку» соответственно.

Клипы — пробуем запустить Disturbed — The Night:

«Дистёрбт — Зэ Найт» — «Десять Арбат Знает». С английским у русской Siri полная катастрофа.

Алиса выдала ссылку на клип в «Яндексе», Google. Ассистент сразу открыл видео на YouTube.

Посмотрим, как обстоят дела с российскими исполнителями:

Тут Сири выступила на уровне Алисы — поделилась ссылками на ролик из поисковика.

Ассистент снова сразу же открыл на YouTube нужное видео.

Переходим к еде:

И вот тут Алиса удивила. Если Сири и Google Ассистент просто открыли список ближайших пиццерий, помощник «Яндекса» вызвал карточку «Папа Джонс», где можно полностью сформировать заказ. Круто!

Кафе:

Тут все без сюрпризов — все помощники справились.

А вот еще одна задачка про кафе, но посложнее:

Первый раунд, в котором выйграла Сири. Номер на экране — просто и понятно.

Ассистент предложил выбор, а Алиса все поняла не правильно.

С кафе ассистенты разобрались, а что насчет заправок?

Все снова на высоте.

Теперь самая необычная задачка — попросим помощников рассказать… сказку:

Сири как всегда, Ассистент отшутился, а вот Алиса превзошла все ожидания. Помощник «Яндекса» запустил отдельную карточку, где можно выбрать сказку, а прочитают ее вам профессиональные дикторы. Зачет!

Напоследок — две популярные и полезные задачки:

Алиса отправила нас в «Яндекс», а Сири и Ассистент посчитали все почти мгновенно!

Примечание редактора: в изначальной версии текста у Сири и Google Assistant получились разные результаты — все потому, что я ошибся в примере с одной цифрой. Исправлено.

…И Такси:

Google. Ассистент совершенно неожиданно посыпался. Siri предложила открыть Uber. Алиса не только уточнила адрес, но и сама вызвала машину. Высший балл.

Выводы

Лучше всех информацию в сети ищет Google. Ассистент. Алиса отстает, но не сильно, зато в плане решения «практических» задач она помощника Google даже обгоняет.

Ну, а Siri…

Сейчас это, пожалуй, самое слабое место iOS.

Сири, Алиса, Google Assistant — МирДоступа

Расскажем какой помощник лучше — проверяем Siri, Алису, Google Assistant…

Технологический прогресс и роботизация современного общества уже давно никого не удивляют — умные дома, автомобили с автопилотом и мобильные приложения с искусственным интеллектом призваны вывести жизнь человека на качественно иной уровень.

Голосовые ассистенты в последнее время также значительно поумнели. Ответить какой голосовой помощник лучше в 2020 году непросто — крупные корпорации постоянно совершенствуют своих ассистентов.

IT-компании ежегодно выпускают на рынок новые высокотехнологические разработки на основе искусственного интеллекта. С каждым годом голосовые ассистенты становятся сложнее и обрастают новыми функциями

При этом их разработчики внимательно следят за новинками на рынке, дублируя успешные решения конкурентов и отсекая креатив который не нашел отклика у пользователей.

Siri — лучший ассистент?

На протяжении долгого времени, наиболее совершенным голосовым помощником считался яблочный ассистент Siri. Интересно, что перед тем как Siri стал доступен для скачивания он тестировался в закрытом режиме около 6 лет.

Однако уже в 2019 году Siri потерял лидирующие позиции по количеству пользователей — голосовой помощник Google Assistant сместил Siri с насиженного пьедестала. Третье место по числу пользователей во всем мире занимает умнейшая Alexa от Amazon

Согласно выводам венчурной компании IQ Loup Ventures после теста всех ассистентов именно Google Assistant немного лучше распознает суть заданных вопросов и выдаёт на них чуть более оптимальные ответы чем конкуренты. Но ответ

какой голосовой помощник лучше всё равно не так однозначен в 2020 году.

Стоит заметить, что отечественный голосовой ассистент Алиса не вошёл в мировую тройку лидеров по количеству пользователей. Тем не менее для русскоязычных пользователей Алиса всё равно остаётся более актуальной, чем её иностранные конкуренты

Несмотря на попытки обучить иностранных помощников русскому языку, уровень коммуникации иностранных ассистентов при общении с российскими пользователями оставляет желать лучшего.

Даже самые умные зарубежные ассистенты в некоторых моментах уступают Алисе

В 2020 году наибольшей популярностью в России пользуются следующие голосовые ассистенты:

  • Алиса;
  • Аlexa;
  • Робин;
  • Google Ассистент;
  • Окей, Блокнотик;
  • Дуся;
  • Маруся.

Далее — попытаемся ответить определенно какой голосовой помощник лучше.

Алиса

Алиса заслуженно удерживает пальму первенства в русскоязычном сегменте рынка по числу пользователей. Алиса быстро реагирует на вопросы и отвечает на простом для восприятия языке.

Изначально Алиса была создана больше для развлечения — она активизировалась во время ожидания загрузок приложений. Сегодня функционал Алисы ничем не отличается от возможностей зарубежных ассистентов: можно спросить погоду за окном, узнать оптимальный маршрут движения в городе

Алиса позволяет играть в разнообразные голосовые игры (Города, Угадай Мелодию, Угадай песню).

Аlexa

Разработчики Алексы в своё время были первыми кто сумел наделить своего ассистента подобием искусственного интеллекта.

Аlexa была первым ассистентом, который мог разговаривать с пользователем на любые темы — ещё на старте разработки. Сложность алгоритмов Алексы позволяет работать ей только на продвинутых мобильных устройствах. Аlexa изначально была создана для умных смарт-динамиков, устанавливаемых в домах или квартирах. Но разработчики решили пойти дальше и через некоторое время появился полноценный голосовой ассистент

До сих пор Алекса не работает с русским языком — в России Алексу можно обнаружить разве что в гостиницах для англоязычных туристов и в электронных терминалах мегаполисов. Отвечая какой голосовой помощник лучше нужно отметить, что в плане искусственного интеллекта именно Алекса является наиболее совершенным ассистентом. Учим английский!

Робин

Данный голосовой ассистент разработан специально для водителей — с учетом специфики психологии автомобилиста и окружающих его условий. Робин позволяет набрать номер на мобильном, не отрывая при этом руки от руля и не отвлекаясь от дороги.

Также Робин позволяет бесконтактно набрать СМС, узнать погоду и новости, проверить сообщения в соцсетях и наличие пробок на дорогах.

Обширная база ответов ассистента Робин на самые разнообразные вопросы может выручить автомобилиста в сложной ситуации и сделать его поездку более комфортной

Помимо этого Робин обладает хорошим чувством юмора и знает массу забавных анекдотов.

Google Ассистент

Предшественником Google Ассистента является проект «Now», который был свернут Google еще несколько лет назад. Идея помощника в поисковике была позже воплощена в Assistant. Голосовой ассистент Google сохраняет на сервере диалоги с пользователем и анализирует их чтобы коммуникация с каждым конкретным пользователем была более эффективной.

Кроме того информация считанная с диалогов, используется для создания ключей и расстановки приоритетов при поисковом запросе. В дилемме какой голосовой помощник лучше многие отечественные пользователи отдают предпочтение именно Google Assistant. К тому же он изначально установлен практически во всех смартфоны на базе ОС Android.

В 2020 году Google Assistant достаточно хорошо распознаёт русскую речь и позволяет использовать множество полезных функций: включить музыку, открыть приложение, осуществить поиск информации, произвести конвертацию валют. Кроме этого помощник Google способен набирать абонентов из телефонной книги и отправлять сообщения по электронной почте и СМС

По своей функциональности Google Assistant превосходит Алису, но при этом зарубежный ассистент уступает Алисе во многих моментах так как изначально ассистент Яндекса создавался для русскоязычной аудитории.

Окей, Блокнотик

Несмотря на ограниченный функционал ассистент Окей, Блокнотик получил достаточно высокую оценку от пользователей Play Маркет. Легкий и быстрый Блокнотик в каких-то моментах превосходит голосовые ассистенты крупных корпораций.

Хорошие отзывы и большое количество скачиваний говорят о том, что ассистент получился крайне удачным. Тем более большинство пользователей не привыкло использовать дополнительные функции голосовых ассистентов

Большинство пользователей используют голосовых ассистентов для создания голосовых заметок и напоминаний. Отвечая какой голосовой помощник лучше следует отметить, что в плане легкости и быстродействия Окей, Блокнотик способен тягаться с более крупными ассистентами.

Дуся

Уникальность отечественного голосового ассистента «Дуся», заключается в том что, он постоянно работает в фоне, но при этом не занимает никакого места на экране — интерфейс у «Дуси» просто отсутствует. Запускается ассистент голосом, прикосновением к сенсорной панели или встряхиванием мобильного устройства — в зависимости от выбранного способа в Настройках голосового помощника. Какой голосовой помощник лучше? Возможно, что для решения некоторых задач именно Дуся представляет наибольшую ценность.

Несмотря на импозантное название, общается «Дуся» с пользователем исключительно деловым языком. Развлекать и смешить «Дуся» не умеет и предназначена программа прежде всего для решения конкретных задач. Функционал данного ассистента стандартен: он набирает номер телефона, прокладывает маршрут движения, находит и включает музыку, переводит простые фразы

Одним из существенных недостатков «Дуси» является то, что данный голосовой ассистент является платным.

Маруся

«Маруся» появилась на рынке совсем недавно — летом 2019 года. Разработчики постарались добавить к стандартным функциям ассистента оригинальные возможности. Так Маруся оснащена функцией распознавания образной речи и на вопрос «Брать ли мне с собой зонтик?» может выдать сводку погоды на ближайшие часы.

Ещё одной изюминкой «Маруси» является наличие функции запоминания — даже если команды произнесены короткими фразами и не привязаны ко времени, ассистент будет напоминать о запланированных событиях. Для этого достаточно спросить «Маруся, что ты запомнила?» — ассистент выдаст фразы в той же последовательности, в которой они были продиктованы

По характеру «Маруся» напоминает «Алису», функционал же больше приближен к Google Assistant. Сегодня у Маруси есть неплохие шансы выйти на лидирующие позиции и в таком случае ответ какой голосовой помощник лучше станет еще более сложным…

Facebook

Twitter

Мой мир

Вконтакте

Одноклассники

Что умеют голосовые помощники Siri, Алиса и Google Assistant

В большинстве случаев использование голосовых ассистентов сводится к нулю: то они плохо понимают запрос, то не могут его выполнить. А еще работают медленнее, чем если по старинке глянуть ту же самую погоду просто в приложении. А может, все-таки дать им шанс? Мы решили испытать интеллект Siri и Google Assistant, а также Алисы, раз уж она стремится не отставать от коллег.

Главная идея помощников — они должны понимать ваши естественные запросы, как если бы вы давали поручение своему живому секретарю. Это здорово усложняет задачу: порой даже люди не понимают друг друга с первого раза, что уж говорить об искусственном интеллекте.

Куртку брать?

Тест мы начали с простого, казалось бы, запроса: поставить два будильника — на шесть часов утра и на семь вечера. Алиса из приложения «Яндекс» сдалась сразу: мол, ее еще этому не обучили. Причем Алиса, которая живет в «Яндекс.Станции», без проблем щелкает такие запросы и исправно ставит будильники — видимо, все дело в ограниченном доступе к нативным приложениям операционной системы (Алису мы тестировали на iOS). Siri чуточку призадумалась: сразу она поставила лишь один будильник, хотя просили два. Пришлось добавлять вечерний сигнал отдельным запросом. Google Assistant включил запрос в приложение будильника. Аналогичная ситуация с установкой таймера («Разбуди меня через полчаса»): помощники от Google и Apple легко завели время, ассистент «Яндекса» отказался.

Просто спрашивать прогноз погоды слишком скучно — понятно же, что все три помощника справятся с этим легко. Поэтому зашли с другой стороны: «Мне завтра брать теплую куртку?» Теоретически ассистенты должны раскусить вопрос — в конце концов, они же соображают, что фразой «брать зонт или нет» вы спрашиваете о погоде. Здесь ситуация похожая. Алиса сперва растерялась, но после повторного запроса собралась и показала прогноз погоды:

Siri тоже не распознала подвох, а вот после вопроса «мне стоит завтра потеплее одеться?» сразу показала погоду. Google Assistant выдал список роликов по выбору трендовой куртки; на более конкретный вопрос «стоит завтра одеваться потеплее?» просто дал ссылки на сайты с прогнозами погоды. Проще в приложении глянуть, что там завтра на улице.

Иньярриту и Metallica

Помощники не всегда нормально понимают сложные имена. Это стало ясно после разговора с Алисой в «Яндекс.Станции»: система ни в какую не хотела распознавать Алехандро Гонсалеса Иньярриту (в итоге все же нашла его, но понадобилось попыток десять). Вот и проверим на других ассистентах. Но сперва дадим шанс Алисе. Удивительно, но на смартфоне ассистент с первого раза верно понял имя. Siri тоже сразу предложила подборку ссылок на мексиканского мастера: статьи в Wikipedia, онлайн-кинотеатр и так далее. То же самое сделал и Google Assistant.

Настоящий помощник умеет еще и поднять шефу настроение, так что заказываем шутки. С просьбой «расскажи анекдот» Алиса и Google Assistant справились (насколько успешно, сказать сложно — чувство юмора-то у людей разное), а вот Siri замялась:

Хотя, видимо, в этом и была вся соль.

С поиском музыки вышло неоднозначно: на запрос «открой последний альбом Metallica» Алиса сразу включила первый трек с нужной пластинки, а Siri почему-то запустила вторую песню. Справедливости ради отметим, что мы не просили проигрывать альбом с начала, но логично было бы сделать именно так. Google Assistant тоже предложил запустить Metallica, только вот нативный музыкальный сервис не был активирован.

Вечная загадка — что приготовить на ужин, когда совсем лень и холодильник практически пустой. С помощниками, по идее, такой проблемы быть не должно. Но все они просто выдали ссылки на ресурсы о готовке еды. Ответы принимаются, но хотелось бы конкретики: мол, вот вам самый простой вариант со списком нужных продуктов.

Карты и $100 в местной валюте

Ассистенты худо-бедно умеют распознавать адреса и вбивать их в картографические сервисы, тем более что у каждого помощника есть «родной» вариант: Apple Maps, Google Maps и «Яндекс.Карты». Для проверки мы выбрали улицу с заковыристым названием: 2-я Шестая линия. Усугубим задачу еще одной цифрой — допустим, дом №13. Лучше всех справилась Алиса — с первого раза и без дополнительных уточнений. Второе место заслужил Google Assistant: сначала он выдал что-то непонятное, но потом исправился и верно указал путь. Siri же призналась, что ничего не нашла, однако это не единственная ее проблема: на простейший запрос «проложи маршрут к Комаровке» помощница решила, что нам нужна… деревня с таким названием в Украине.

Запрос «открой Onliner» оказался слишком простым: справились все, но Алиса не только нашла сайт, а еще и автоматически открыла его в браузере. Siri просто выдала результаты поисковых запросов в интернете, а Google Assistant нашел на смартфоне приложение «Каталог» и запустил его — неплохо, но чуточку не то, что мы просили.

Удобный сценарий использования голосовых помощников — запрос курса валют. Не нужно лезть в калькулятор или конвертер, вам сразу посчитают нужную сумму. Но это если ассистент сразу поймет, что вы хотите. Мы добавили хитрость: «Сколько будет $100 в местной валюте?» — без уточнения, что это за валюта. Но раз системы все знают о пользователе и умеют включать геолокацию, то вполне могут сообразить, что за деньги нас интересуют. Алиса уточнила, про какую валюту речь, и, получив прямой ответ, сразу посчитала. Siri и Google Assistant отправили на финансовые сайты.


В целом помощники были полезнее, чем казалось до начала теста. Но все равно: когда руки свободны, удобнее выполнить действие самому. Возможно, дело привычки. Ну а если писать неудобно — там уже приходится полагаться на ассистентов. Решение от Google самое «серьезное»: минимум характера и попыток ответить «как человек». Алиса и Siri в этом плане приятнее, они пытаются создать ощущение человеческого разговора — что самой манерой ответа, что интонациями. А если глобально, то это по-прежнему игрушки, только уже очень смышленые. Подождем, когда их в очередной раз доработают, и проверим снова.

Читайте также:

Наш канал в Telegram. Присоединяйтесь!

Быстрая связь с редакцией: читайте паблик-чат Onliner и пишите нам в Viber!

Читайте нас в «Дзене»

Перепечатка текста и фотографий Onliner без разрешения редакции запрещена. [email protected]

эволюция, устройство и основные игроки

Уточнить у Siri рецепт сырников во время готовки или попросить Алису прочитать сказку — вполне привычные для нашей жизни сценарии. А как это работает? Как звук превращается в понятные виртуальному помощнику команды, которые сразу же исполняются? Кто главные игроки на рынке? Какие еще заботы могут снять с нас голосовые помощники?

Редакция DTI Algorithmic собрала ответы на все эти вопросы — и помогали нам в этом наши программисты и союзники. В результате получился информационно насыщенный лонгрид, который мы будем публиковать по частям. Сегодня — про эволюцию голосовых помощников, их устройство и основных игроков на рынке.

Эволюция голосовых помощников

История голосовых ассистентов начинается с конца 1930-х годов, когда ученые начали предпринимать попытки распознать голос силами технологий. Тогда созданию качественного помощника мешали две большие проблемы:

  • существование омонимов — слов с одинаковым звучанием, но с разным значением,
  • постоянный шумовой фон, из которого система должна выбирать речь пользователя.
#справка Подробнее про историю и эволюцию технологии распознавания речи на Medium

Сейчас для решения этих проблем разработчики используют машинное обучение. Оно учит нейронные сети самостоятельно анализировать контекст и эффективно определять основной источник звука. Однако пришли разработчики к этому не сразу — потребовалось как минимум 80 лет подготовительных работ:

1939 год. Советский физик Лев Мясников создал аппарат, способный распознавать человеческую речь — несколько гласных и согласных звуков.

1952 год. Сотрудники лаборатории Bell разработали механизм, который распознавал продиктованные по телефону числа от 1 до 9.

Первый голосовой распознаватель чисел, разработанный сотрудниками лаборатории Bell

1962 год. Компания IBM представила собственную технологию распознавания речи — Shoebox. Машина распознавала 16 английских слов, 10 цифр и 6 арифметических команд.

Презентация системы распознавания речи Shoebox от IBM

1980 год. Инженеры научились применять методы «Скрытой модели Маркова». Со временем это позволило голосовым системам лучше распознавать речь. Они обрабатывают слово, учитывая несколько предыдущих и предсказывая, что может с ними сочетаться.

#справка Скрытая модель Маркова описывает генерацию случайных событий в зависимости от текущего состояния объекта. Пример: человек может находиться в одном из четырех состояний и не в каждое их них может перейти сразу (схема ниже). Например, если человек лежит, то он не может моментально пойти куда-либо — нужно сесть, встать и только потом идти

Пример физических состояний человека, описанных в скрытой модели Маркова

1987 год. В США компания Worlds of Wonder начала продавать говорящую куклу Джулию, которая училась распознавать речь ребенка во время игры. В куклу был встроен процессор, который позволял ей реагировать и генерировать речь. Джули воспринимала восемь высказываний: «Джули», «да», «нет», «хорошо», «притворяйся», «голодна», «пой» и «молчи».

Реклама интерактивной игрушки — куклы «Джули»

1990-е годы. Появилась коммерческая программа Dragon Dictate, ориентированная на массовый рынок. Она распознавала речь и записывала надиктованный текст в файл.

1996 год. Появилось полноценное голосовое меню VAL от BellSouth. Система обрабатывала телефонные справочные запросы и помогала покупателям в поиске нужной информации об интересующих товарах.

Позже компания запустила Info by Voice — интерактивные голосовые «желтые страницы» с информацией о ближайших ресторанах, такси и некоторых магазинах. Система также могла рассказать о новостях и котировках акций, погоде, телепрограмме, гороскопе и спортивных событиях.

2001 год. Компания Microsoft добавила голосовой ввод текста в офисный пакет Office XP.

2002 год. Google запустил Voice Search — сервис для голосового поиска в интернете. Проект приостановили из-за неудобства использования — чтобы выполнить поиск, надо было позвонить на специальный номер. На Voice Search основан современный интерактивный помощник компании — Google Assistant.

2007 год. Центр исследования искусственного интеллекта SRI International начал разработку Siri. Siri стала первой голосовой помощницей — система умела не только искать информацию в интернете или работать как голосовое меню, но и вести с пользователем диалог.

2011-2014 годы. Google интегрировал функцию голосового поиска в браузер Chrome. Компания также запустила персонализированного ассистента Google Now с расширенными возможностями голосового поиска — сервис подбирал актуальную информацию с учетом местоположения пользователя, истории браузера и других поисковых запросов.

У Microsoft также появилась собственная виртуальная голосовая помощница — Cortana.

#интересное Ассистент Microsoft назван в честь персонажа из игровой серии шутеров Halo. Фразы для него записала актриса озвучки Джен Тейлор, озвучившая Кортану в игре

2014 год. Amazon представил первую в мире умную колонку Amazon Echo с голосовой ассистенткой Alexa.

Колонка с голосовым ассистентом — Amazon Echo

2017 год. Alibaba представила умную колонку Tmall Genie с голосовым помощником AliGenie.

2018 год. Яндекс выпустил умную колонку Яндекс.Станция с голосовой помощницей Алисой.

2019 год. Банк «Тинькофф» запустил собственного голосового ассистента «Олега». Mail.Ru Group представила голосовую помощницу «Марусю».

Как устроены современные голосовые помощники

Голосовые помощники пассивно считывают все звуковые сигналы, и для активной работы им необходима активация при помощи кодовой фразы. Например, произнесите: «Окей, Google», потом можете задать свой вопрос или отдать команду без пауз.

Подробнее о работе голосовых помощников

Математик Ханна Фрай исследует, как работает программное обеспечение для распознавания голоса, используемое в в домашней технике.

В момент голосового запроса автоматическая система распознавания речи (ASR system) преобразовывает звуковой сигнал в текст. Это происходит в четыре этапа:

  • Фильтрация. Система убирает из звукового сигнала шумовой фон и помехи, возникающие при записи.
  • Оцифровывание. Звуковые волны преобразуются в понятный компьютеру цифровой вид. Параметры получаемого кода в том числе определяют качество записи.
  • Анализ. В сигнале выделяются участки, содержащие речь. Система оценивает ее параметры — к какой части речи относится слово, в какой оно форме, насколько вероятна связь между двумя словами.
  • Выявление шаблонов данных. Полученную информацию система включает в словарь — собирает разные варианты произношения одного и того же слова. Чтобы точнее распознавать новые запросы, ассистенты сравнивают слова в них с шаблонами.

Акустическая модель — как распознают речь в Яндексе

Если после обработки запроса виртуальный помощник не понимает команду или не может найти ответ, он просит перефразировать вопрос. В некоторых случаях могут понадобиться дополнительные данные — например, при вызове такси ассистент может уточнить местоположение пассажира и пункт назначения.

Основные игроки на рынке

По данным Microsoft, самые популярные голосовые помощники в США — Google Assistant, Siri от Apple, Alexa от Amazon и Cortana от Microsoft. Русский язык из них понимают только первые два, однако на российском рынке также работает Алиса от Яндекса, а на китайском — AliGenie от Alibaba. Сравнили основные характеристики умных колонок с поддержкой этих пяти голосовых ассистентов:

Голосовой помощник

Alexa

Google Assistant

Siri

AliGenie

Алиса

Компания-производитель

Amazon

Google

Apple

Alibaba

Яндекс

Активационная фраза

«Alexa»

«О’кей, Google»

«Привет, Siri»

«Tmall Genie»

«Привет, Алиса»

Позиционирование

управление умным домом

поисковик

музыкальная колонка

управление умным домом

музыкальная колонка

Решаемые задачи

управление умными устройствами;

взаимодействие с товарами и сервисами Amazon;

дозаказ новых продуктов;

справочная информация

управление умными устройствами;

поиск информации в интернете;

справочная информация

управление умными устройствами;

поиск информации в интернете;

цифровая няня

управление умными устройствами;

управление медиа;

заказ продуктов в интернет-магазине Tmall

обработка голосового запроса;

управление медиа

Интеграция с социальными сетями и почтовыми сервисами

нет

нет

да

нет

да

Понимает команды и произвольную речь

нет

да

нет

нет

да

Мобильное приложение

Android, iOS

Android, iOS и браузер Chrome

Android, iOS

Wechat, Webao

Android, iOS и Яндекс браузер

Язык

английский;

французский;

немецкий;

японский;

испанский;

хинди

порядка 30 языков

21 язык,включая диалекты

китайский;

английский;

русский

русский

Стоимость станций голосовых помощников

$50—$150

$50—$400

$350

$74

$160 (₽9900)

Доля рынка

31,8%

22,8%

4,9%

9,5%

менее 4,9%

Продажи
(в млн.штук)
за 4 квартал 2018 года

13,7

11,5

1,6

2,8

менее 4,9

#интересное В августе 2018 г. издание «Канобу» сравнило, насколько хорошо понимают русскую речь, отвечают на вопросы и выполняют задачи Siri, Google Assistant и Алиса. Результаты — в статье

Голосовые помощники для Windows 7, 8, 10 на русском языке

Обзор голосовых помощников для телефона на базе Андроид и iOS на русском языке.

Сегодня голосовые помощники стали неотъемлемой частью жизни. С каждым днем все больше людей выбирает виртуальных ассистентов, заменяя мышку и клавиатуру. Искусственный интеллект помогает решать простые задачи с помощью голосового ввода. После ввода информации, помощник распознает сказанную речь и начинает функционировать.  Говорите четко и внятно, чтобы помощник корректно выполнил запрос. Он может подсказать маршрут, новости дня, найти музыку, показать погоду, ответить на простой вопрос. Самые распространенные голосовые помощники для ПК: Cortana, Typle, Speaker, Ok Google, Siri, Горыныч, «Алиса» Яндекс.

Cortana для Windows

Голосовые помощники для Windows

«Cortana» — голосовой помощник, интегрированный в операционную систему и созданный компанией Microsoft. Помощница предназначается прежде всего для Windows, но также в качестве приложений работает на платформах iOS, Android, Xbox One, Microsoft Phone, Microsoft Band. «Cortana» поможет систематизировать и распланировать ваши задачи и планы на определенный период, напоминает о выполнении каких-либо действий, предоставляет по вашему запросу информацию.  Также имеет встроенный функционал для ответов на общие вопросы, используя поиск Bing. В функционал входит прокладка маршрута, информация о состоянии дорог, поможет не опаздывать. Вводить информацию можно с помощью голоса и клавиатуры в текстовой форме. Она поддерживает разговор: поет песни, присылает анекдоты – не лишена чувства юмора.

К особенностям можно отнести такую функцию, как предугадывание желаний пользователя. Если дать доступ к личным данным, виртуальный помощник от Microsoft будет «подстраиваться» под вас, постоянно анализируя ваши действия: места, в которых вам нравится находиться; ваши предпочтения в тех или иных вещах; ваши долгосрочные интересы, хобби и многое другое.

Виртуальный ассистент Cortana тесно связана с операционной системой и может управлять Windows 10 и отдельными приложениями во время вашей работы: поможет прочитать Ваши электронные письма, отследить местоположение, проверить список контактов, следить за календарем, управлять музыкой и напоминания, охватывая многочисленные музыкальные приложения и контролируя звук в соответствии с  предпочтениями пользователя.

Есть возможно синхронизации нескольких устройств. Cortana будет поддерживать актуальность на нескольких компьютерах одновременно.

Алиса Яндекс (десктопная версия)

Голосовые помощники на ПК - Алиса Яндекс

Алиса – голосовой помощник, устанавливаемый на ПК (Windows 7-10), Android и IOS. Алиса может показать прогноз погоды, найти данные об общественных местах, найти музыку, проводить конвертацию валют, решает несложные математические вычисления и может поддержать разговор.  Программа очень молодая и все время совершенствуется. «Алиса» позволяет вести диалог в текстовом виде и голосовом. Голосовой помощник Алиса способен понимать смысл ваших фраз: «Где здесь можно пошопиться?», она понимает: «Где здесь магазины?».

Поисковая строка Яндекс или другое название – Яндекс.Строка находится в панели задач операционной системы Windows. Поисковая строка Яндекс умеет находить на просторах Интернета информацию, которую пользователь вводить с помощью голоса или текста. Пользователь может задать команду открыть любую папку и документ, расположенные на компьютере. Программа открывается на портативном компьютере с помощью нажатия кнопки Строки или же горячих клавиш. По сути это частный случай Алисы для ПК. Для экономии места на панели задач 8 см кнопку заменяют на иконку с микрофоном. Подробнее способах отображения помощника на ПК в статье Настройки Алисы для Windows.

Typle — голосовое управление компьютером

Голосовые помощники на ПК - Typle

Программа разработана для операционной системы Windows. Здесь не нужны знания английского языка, нет возможности работы с плеером и нет восприятия текстовой формы.  Из-за ограниченного количества функций программа кажется не такой эффективной и функциональной в использовании. Ограниченность помощника заключается в открывании лишь утилитов и Интернет-страниц.  Программа понимает шумы из вне, как команды для выполнения, отчего компьютер может работать не корректно. Голосовой помощник быстро выполняет поставленные задачи. После скачивания программы, можно придумать главное высказывание, которое дает сигнал работы.

Горыныч

Голосовые помощники для ПК - Горыныч

Отечественная разработка голосового помощника, для управления ПК операционной системы Windows 7, XP, Vista. Размер 30,4 мб. Язык русский и английский.  В основе идеи лежит приложение «Dragon Dictate», которое создано западными специалистами. Голосовой помощник выполняет все среднестатистические команды, которые выполняют его аналоги. С помощью голоса, пользователь может открывать любые папки в компьютере. Эта функция подобна функции из программы Typle. Особенностью голосового помощника «Горыныч» считается ввод текста в Word с помощью собственного голоса. Минус подобной функции в том, что речь пользователя должна быть без дефектов и четкой. Со временем программа запоминает голос владельца компьютера и начинает быстрее выполнять команды.

Speaker — голосовое управление компьютером

Голосовые помощники для ПК - Speaker

Speaker – голосовой помощник и программное обеспечение, которое используется в операционной системе Windows. Программное обеспечение отличается от остальных более широким функционалом. Пользователь может открывать и закрывать различные папки на ПК, делать фото экрана. Для работы со «Speaker» необходимо иметь стабильное Интернет-соединение. Управление программой осуществляется с помощью клавиатуры, что не всегда удобно. Голосовая функция оставляет желать лучшего: обработка речи по времени занимает 5 секунд, что долго. Программа преобразует речь в текст.

Ok Google для ПК

Голосовые помощники для ПК - ОК Гугл

Окей Гугл — голосовой помощник и одновременно часть поисковой системы. У программы есть много функций: планирование событий (установка напоминаний), отслеживание почтовых отправлений, переход на любой сайт, поиск музыкальных композиций, нахождение адресов общественных мест и др. Особенность программы: после выполнения команды, программа дополняет сама информацию. Программа имеет плюсы: бесплатность и стабильная работа. Минусы: подробная настройка программы. Ассистент встроен в браузер Google Chrome, доступен для ПК, Android, iOS.

Siri на компьютер

Голосовые помощники для ПК - Siri

 

Siri — голосовой ассистент, работающий на устройствах от компании Apple: iOS, iPhone, iPad и iPod touch и ноутбуках с macOS Sierra. На «яблочных» гаджетах Сири установлена по умолчанию, все что вам необходимо — активировать ее в настройках устройства.

С помощью эмулятора можно установить на Windows 7-10, размер файла 79 Мб. Программа преобразовывает речь человека, впоследствии давая пользователю рекомендации. Американский ассистент может выполнять простые команды, подобно другим. Отлично «понимает» русскую речь. Для работы необходимо подключение к интернету.

 

Так же читают:


Не нашли ответ, пишите в комментарии или обратную связь.

«Голосовые помощники» — Яндекс.Знатоки

Пока сложно и не совсем корректно сравнивать юную «Марусю» с куда более опытной «Алисой» – ведь голосовой ассистент Mail.ru сейчас находится на этапе бета-тестирования. Поэтому какие-то баги, проблемы с точностью ответов неизбежны. Собственно, для их отладки и продолжения обучения «Маруси» и началось тестирование. Но уже сейчас можно сказать, что создатели «Маруси» вдохновлялись «Алисой», а точнее концепцией голосового ассистента как собеседника, а не как обезличенного помощника по поиску ответов в интернете. В свое время «Яндекс» глубоко и детально проработал множество тем для бесед с пользователями, наделив свою «Алису» самобытным и ярким характером и развитым функционалом chit-chat, «болталкой» – это выгодно отличает «Алису» от большинства голосовых ассистентов. И, кажется, «Маруся» будет идти по тому же пути – Mail.ru явно делает ставку на персонажа, его характер. Уже сейчас «Маруся» отшучивается, если попадает в трудную ситуацию – например, говорит «Помедленнее, я записываю» или «Судорожно ищу ответ и не нахожу».

У «Маруси», как и у «Алисы», есть интеграция с сервисами «материнской» компании. Можно с легкостью включить музыку из VK Music, причем «Маруся» хорошо распознает имена музыкантов, даже фонетически сложные. Набор навыков еще не велик, но внешние разработчики уже сейчас могут подать заявку на создание приложений для «Маруси».

«Маруся» отвечает довольно быстро, отлично распознает речь, у нее приятный голос актрисы Елены Соловьевой. Еще полгода назад далеко не все ассистенты, включая Siri, Alexa и других, слыша вопрос «А мне понадобится завтра зонт?», понимали, что речь о погоде. «Маруся» справилась сразу. Но в принципе она честна с пользователями и признается, если чего-то не умеет – не может читать стихи и не говорит на английском языке, однако при этом понимает, когда с ней говорят по-английски. Конечно, пока она во многом уступает «Алисе»: находит информацию в интернете по запросу собеседника, но не зачитывает ее вслух, включается стихийно, без необходимости, ошибается в определении геолокации. Но, повторюсь, это бета-версия, и ей многое можно простить.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *