Голосовой помощник на русском: Голосовые помощники для Андроид — лучшие голосовые ассистенты на Android

Содержание

Голосовые помощники на русском — Siri, Google Ассистент, Яндекс.Алиса — выбор лучшего ассистента

В России наконец-то заработал «Google. Ассистент» — голосовой помощник, собравший массу хвалебных отзывов за рубежом. Мы сравнили его с двумя другими персональными ассистентами, доступными на русском языке. Кто оказался умнее?

Принципы сравнения просты. Сначала мы будем задавать каждому из ассистентов вопросы, проверяющие их способность искать информацию в интернете и, что более важно, вычленять из всего найденного объема краткий ответ. Затем мы попросим помощников сделать для нас что-нибудь, причем задачи постараемся ставить такие, чтобы от них могла быть реальная польза в повседневной жизни.

Siri мы проверим на iPhone X и последней бете iOS 12 (на iOS 11 она выдает те же ответы), Google Assistant — на ZenFone Max Pro, работающем на «стоковом» Android 8.1. На нем же будем запускать и Алису через приложение «Яндекс».

Кроме того, разговаривать мы с ними будем на русском языке, хоть и проверим способность помощников на ходу переключатся с русской речи на английскую.

Поехали!

Вопросы

Начнем с парочки действительно сложных для ИИ вопросов

Почему небо голубое?

Ответил лишь Google Ассистент. Алиса выдала список ссылок из «Яндекса», а Сири вообще не поняла, чего от нее хотят.

Почему страусы прячут голову в песок?

Снова справились только Алиса и Ассистент. Сири лишь поделилась ссылками из Google.

Очередь более простых и конкретных вопросов:

Кто изобрел автомобиль?

Алиса и Ассистент не испытали никаких проблем, а помощник Google еще и приложил к ответу интересный бэкграунд.

Сири же выдала список ближайших автосалонов. «Блестяще»!

Теперь — несколько понятных и распространенных типов вопросов:

Права лишь Алиса! Ни Сири, ни Ассистент смысла вопроса не поняли. «Яндекс» — молодцы!

Алиса и Ассистент держат планку. Сири как всегда…

Все — мимо!

Время кулинарных вопросов!

Алиса и Ассистент выдали ответ со ссылкой на источник, Siri не смогла и решила открыть филиал Google.

Дальше — расстояния

Здесь все поинтереснее. Сири, пожалуй, впервые не растерялась и запустила Apple Maps, проложив маршрут от Москвы до Владивостока. Ассистент сделал то же самое, но в том же окне, да еще и ответил на поставленный вопрос. Алиса перед этой задачей спасовала, однако на вопрос, сколько ехать до Владивостока, она отвечает запросто.

Раунд за Ассистентом Google!

Теперь — вопросы, привязанные к актуальным событиям:

Да, Сири действительно открывает App Store, если спросить ее, как сыграл «Локомотив». Алиса то ли отшучивается, то ли думает, что шутим мы. И только Ассистент выдал четкий и точный ответ.

Дальше посложнее. Вопросы на индексацию новостей:

Все три помощника выдали поисковые ссылки с небольшими превью. Однако в окне Ассистента правильный ответ выделен жирным шрифтом, поэтому можно считать, что только этот бот справился с заданием.

Ассистент выступил блестяще, Алиса с Сири отбились ссылками, но в окне помощника «Яндекса» хотя бы видно название фильма.

Еще один вопрос про «Оскар» — но посложнее:

И вновь Ассистент на высоте! Сири внезапно ответила на вопрос, который ей задавали полчаса назад, Алиса открыла «Яндекс». Кроме того, Ассистент распознал контекст — понял, что «про него» — это про Тома Хэнкса.

Еще немного кино:

Все как всегда: Сири опять городит черти-что, Алиса и Ассистент справляются без труда.

Теперь — к знаменитостям:

Программа «Престолы»? Сири, ты серьезно? У Алисы и Ассистента все как всегда хорошо.

Теперь задачка на распознавание контекста. Ассистент в него «умеет», поэтому посмотрим на Алису и Сири.

На первый вопрос Сири ответила (и даже, что забавно, показала возраст Дурова), а вот второй посчитала за отдельный. Алиса выступила на уровне Google Ассистента.

Теперь — к менее известным фактам:

Сири вообще не поняла, на каком языке к ней обратились. Ассистент с Алисой как всегда не подвели.

Задачи

Начнем с самых простых и полезных.

Сообщения:

А вот здесь подводит уже Алиса. Siri и Ассистент отправляют сообщения, Алиса отшучивается. Никому она ничего, конечно, не передала. Скорее всего, это связано с тем, что и Сири, и Google Ассистент — нативные помощники для своих систем, тогда как Алиса — стороннее приложение.

К слову о них: сообщения в сторонних приложениях:

Siri в этот раз не подвела — все четко. Ассистент тоже. Алиса опять отшутилась. И опять неудачно.

Теперь — музыка:

Обидно, что несмотря на встроенный в iOS Apple Music Сири испытывает большие проблемы с тем, чтобы включать песни западных исполнителей. Грамотно отличать русский от английского помощник Apple пока так и не умеет.

Ассистент и Алиса четко поняли, что требуется сделать и запустили Google Play Music и «Яндекс. Музыку» соответственно.

Клипы — пробуем запустить Disturbed — The Night:

«Дистёрбт — Зэ Найт» — «Десять Арбат Знает». С английским у русской Siri полная катастрофа.

Алиса выдала ссылку на клип в «Яндексе», Google. Ассистент сразу открыл видео на YouTube.

Посмотрим, как обстоят дела с российскими исполнителями:

Тут Сири выступила на уровне Алисы — поделилась ссылками на ролик из поисковика.

Ассистент снова сразу же открыл на YouTube нужное видео.

Переходим к еде:

И вот тут Алиса удивила. Если Сири и Google Ассистент просто открыли список ближайших пиццерий, помощник «Яндекса» вызвал карточку «Папа Джонс», где можно полностью сформировать заказ. Круто!

Кафе:

Тут все без сюрпризов — все помощники справились.

А вот еще одна задачка про кафе, но посложнее:

Первый раунд, в котором выйграла Сири. Номер на экране — просто и понятно.

Ассистент предложил выбор, а Алиса все поняла не правильно.

С кафе ассистенты разобрались, а что насчет заправок?

Все снова на высоте.

Теперь самая необычная задачка — попросим помощников рассказать… сказку:

Сири как всегда, Ассистент отшутился, а вот Алиса превзошла все ожидания. Помощник «Яндекса» запустил отдельную карточку, где можно выбрать сказку, а прочитают ее вам профессиональные дикторы. Зачет!

Напоследок — две популярные и полезные задачки:

Алиса отправила нас в «Яндекс», а Сири и Ассистент посчитали все почти мгновенно!

Примечание редактора: в изначальной версии текста у Сири и Google Assistant получились разные результаты — все потому, что я ошибся в примере с одной цифрой. Исправлено.

…И Такси:

Google. Ассистент совершенно неожиданно посыпался. Siri предложила открыть Uber. Алиса не только уточнила адрес, но и сама вызвала машину. Высший балл.

Выводы

Лучше всех информацию в сети ищет Google. Ассистент. Алиса отстает, но не сильно, зато в плане решения «практических» задач она помощника Google даже обгоняет.

Ну, а Siri…

Сейчас это, пожалуй, самое слабое место iOS.

Голосовые помощники на русском языке на телефон



Голосовые помощники, говорящие на русском языке, постепенно проникают в наши телефоны, с каждым днем их искусственный интеллект становится умнее, а общаться с ним становиться проще. На ранних этапах развития, разговаривать с таким помощником было не просто. Распознавание речи было еще сносным, но услышать еще не значит понять и дать подходящий ответ, а с ответами все было совсем печально.

Но технологии не стоят на месте и благодаря нейронным сетям, некоторые современные голосовые ассистенты значительно эволюционировали, в то время как другие продолжают топтаться на месте. Давайте попробуем разобраться какой виртуальный помощник, владеющий русским языком, лучший и сравним три самых популярных 

Siri, Google Аssistant и Алису.

Siri

Speech Interpretation and Recognition Interface переводится, как — интерфейс распознавания и интерпретации речи. Эта помощница знакома всем обладателям гаджетов от Apple, так как сейчас она доступна только на iOS, watchOS, macOS, и tvOS. Мало кто знает, что изначально она была приложением из App Store и ее разработчики обещали, что Сири будет доступна на Android и BlackBerry. Но после покупки Siri яблочным гигантом от этих планов пришлось отказаться. Впрочем создатель Сири Даг Киттлаус уже работает над ассистентом Viv, который будет доступен на любой платформе.

Преимущества


  1. Интеграция в операционную систему. Благодаря интеграции Сири не нужно устанавливать отдельно и она отлично справляется с простыми задачами, такими как поставить будильник, позвонить, отправить или прочитать сообщение.
  2. Конфиденциальность. Apple серьезно подходят к вопросам безопасности и не отправляет на сервера компании персонализированные данные.
  3. Быстрые команды. Возможность создавать собственные команды выполняющие несколько действий за раз.



Недостатки


  1. Конфиденциальность.  Как ни странно, но забота о безопасности может быть одновременно достоинством и недостатком. Дело в том, что если не обрабатывать персонализированные данные, алгоритмы не смогут дать вразумительный ответ на запрос в котором эти данные присутствуют. 
  2. Не справляется со сложными запросами. Самый частый ответ от Сири на более или менее сложный вопрос будет «Вот что мне удалось найти в Интернете по запросу…«
  3. Непонимание контекста. Если спросить «Какая завтра будет погода?» вы получите приемлемый ответ, но если попытаться уточнить «Будет ли дождь?«, ответом будет прогноз погоды на сегодня, что говорит о полном непонимании контекста.
  4. Плохой синтезатор голоса. Если на английском языке он не так плох, то по сравнению с конкурентами, на русском просто ужасен.
  5. Темпы развития. За 7 лет практически ничего не изменились.


Google Ассистент

Скорее всего вы уже видели видео с конференции I/O в Калифорнии, где глава Google Сундар Пичаи на продемонстрировал новую функцию Google Duplex, если нет то советуем посмотреть, это действительно впечатляет.

Посмотрев видео складывается впечатление, что будущее уже наступило, ассистент от Гугла оставил конкурентов далеко позади и вот вот все вокруг заговорят со своими телефонами, засыпая его просьбами записать их в парикмахерскую или зарезервировать столик в ресторане, но этого не происходит и на то есть причины. Google Assistant еще не на столько умен, да он может многое на английском языке, но на русском он выглядит увы не так впечатляюще. Конечно, по сравнению с совсем «глупой» Siri, он вполне ничего, но еще очень далек от совершенства. Давайте попробуем разобрать все его сильные и слабые стороны по полочкам.

Преимущества


  1. Умные поисковые запросы. Вы можете спросить «Как сыграл Спартак?«, «Какие фильмы идут в кинотеатре?» и сразу получить ответ, а не выдачу на ключевой запрос в поисковой системе.
  2. Команды. Можно попросить позвонить, включить песню, поставить таймер. Впрочем с этим сейчас справляются все.
  3. Живое общение. Если вам скучно скажите об этом помощнику, он попробует вас развлечь, стишком, песенкой, анекдотом и даже страшилкой.
  4. Обзор дня. Пока эта функция не заработала в полном объеме на русском языке. Но и уже сейчас можно сказать «Доброе утро» или «Расскажи о моем дне» и получить прогноз погоды, точное время и список напоминаний на сегодня. (На английском языке можно настроить воспроизведение новостей)
  5. Перевод на иностранный язык. «Скажи я тебе люблю по-испански«, ответ — «Te amo«.
  6. Доступность. Можно скачать на iOS.


Недостатки


  1. Проблема с русским языком. Конечно рано ругать Google Assistant, за плохую работу на нашем языке, он только начал свое общение с нами и для новичка вполне неплохо справляется, во всяком случае в разы лучше Siri.

Google Assistant

Скачать

из App Store

Google Assistant

Скачать

из Google Play



Алиса

В отличии от своих ближайших конкурентов у Яндекса нет своей операционной системы для смартфонов, но это не помешало ему создать голосового помощника Алису и вполне успешного. Конечно учитывая отсутствия полной интеграции с ОС некоторые функции недоступны для Алисы, но по другим пунктам она значительно превосходит зарубежные аналоги.


Преимущества


  1. Яндекс диалоги. Это отдельные сервисы от сторонних разработчиков активировать которые можно произнеся кодовое слово. К примеру скажите «Закажи пиццу» и откроется навык сети ресторанов Папа Джонс. 
  2. Компьютерное зрение. Попросите Алису распознать объект, найти товар, распознать текст, определить марку авто, узнать породу домашнего питомца или вид растения, найти похожие картинки, узнать знаменитость.
  3. Развлечения. Развлекать Алиса умеет, как никто другой. Она поет песни собственного сочинения, у нее в арсенале огромное количество действительно интересных игр и смешных анекдотов.
  4. Сервисы Яндекс. Алиса быстро находит информацию из поисковика Yandex, проложить маршрут, позволяет голосом заказать Яндекс такси, узнать новости.
  5. Доступность. Можно установить на iOS и Android.

 

Недостатки


  1. Не умет простейших вещей, таких как поставить таймер, написать сообщение, позвонить, создать напоминание.
  2. Сложно запустить голосом. Было бы неплохо будить Алису голосовой командой не прикасаясь в смартфону, но пока такой функции нет. Но можно разбудить Siri и позвать Алису.

Яндекс с Алисой

Скачать

из App Store

Яндекс с Алисой

Скачать

из Google Play

Сказать какой ассистент лучше однозначно нельзя, все зависит от ваших требований. Если вам нужны напоминания, или вы хотите диктовать сообщения для отправки в мессенджере, то выбирайте Siri или Google Assistant. Если хотите заказать Яндекс такси или пиццу лучше подойдет Алиса.



Понравилось? Расскажите друзьям:

Голосовой помощник — что это: Алиса, Siri и другие

Голосовой помощник – сервис на основе искусственного интеллекта, распознающий человеческую речь и способный выполнить определенное действие в ответ на голосовую команду. Чаще всего голосовые помощники используются в смартфонах, умных колонках, веб-браузерах.

Функционал голосовых помощников достаточно разнообразен. Что умеет голосовой помощник:

  • вести диалоги,
  • предлагать быстрые ответы на вопросы пользователя,
  • вызывать такси,
  • совершать звонки,
  • прокладывать маршруты,
  • делать заказы в интернет-магазине и т.
    д.

Так как все голосовые помощники обладают искусственным интеллектом, при общении с пользователем они учитывают изменение его местоположения, время суток и дни недели, историю поисковых запросов, предыдущие заказы в интернет-магазине и т.д.

Голосовые помощники: обзор

На рынке представлены разные голосовые помощники, разработанные крупными компаниями и небольшими стартапами. Наибольшей функциональностью и популярностью пользуются разработки крупнейших корпораций.

GoogleNow и GoogleAssistant

Google Now – один из первых голосовых помощников Google. Работает на устройствах с Android, iOS и в браузере Chrome. Любит подсказывать оптимальные маршруты до дома, учитывая текущее местоположение пользователя, предлагать подборки новостей, умеет анализировать почту и поисковые запросы. Google Now интегрирован со всеми сервисами Google и некоторыми сторонними приложениями. Поддерживает русский язык.

Google Assistant – более усовершенствованная версия голосового помощника. Может вести диалоги и понимать обычную разговорную речь. Русский язык есть только в тестовой версии.

Siri

Работает только на устройствах Apple. Умеет вести диалоги и давать рекомендации, например, куда пойти или какой фильм посмотреть. Поддерживает множество языков, в том числе есть версия голосового помощника на русском языке.

Microsoft Cortana

Доступен на Windows, iOS и Android. Управляет напоминаниями и календарем, отслеживает посылки, устанавливает будильники и ищет в Bing новости, прогноз погоды и другие сведения. Не поддерживает русский язык.

Amazon Alexa

Встроен в аудиоустройства Amazon (Echo, Echo Dot, Tap) и приставку Fire TV. Может проигрывать музыку, читать новости, предлагает информацию о погоде и пробках, а также заказывать товары на Amazon с помощью голоса. Не поддерживает русский язык.

Яндекс Алиса

Голосовой помощник на русском языке от компании Яндекс. Доступен в универсальном приложении Яндекс и в Яндекс.Браузере на платформах Android и iOS и десктопах. Есть интеграция с остальными сервисами компании. Голосовой помощник Яндекса умеет распознавать музыку, изображения на фото, вызывать такси, управлять навигатором и т.д.

Голосовые помощники и безопасность

Развитие технологий голосового поиска и распознавания речи вызывает у многих неоднозначную реакцию – в первую очередь, насколько безопасны эти разработки и всегда ли они слушаются только своего владельца.

Голосовые помощники уже успели «засветиться» в нескольких примечательных историях:

  • Студенты Калифорнийского университета в Беркли нашли способ запустить голосовые помощники Siri, Alexa и Google Assistant без ведома владельца. Для этого достаточно в музыку или видео добавить звуки, отдаленно напоминающие человеческую речь – программе будет этого достаточно, чтобы превратить их в слова и начать выполнять заданную команду.
  • В Китае смогли активировать голосовых помощников с помощью звуковых частот, которые обычный человек не слышит.
  • Burger King запустили рекламу с фразой «OK, Google, что такое Воппер?», на которую откликались голосовые ассистенты и начинали зачитывать строчки из Википедии.
  • Amazon Echo заказал кукольный домик, услышав просьбу 6-летней девочки. А когда этот сюжет обсуждали в новостях, голосовые помощники, восприняв фразу о заказе домика как команду, стали повсеместно заказывать эти домики.
  • Владельцы Amazon Echo жаловались, что устройство начинает самопроизвольно смеяться. Выяснилось, что устройство распознавало окружающие звуки как команду засмеяться и выполняло ее.

При этом Google и Amazon утверждают, что их помощники не включаются, если не слышат голос владельца. Apple говорит, что Siri никогда не выполнит команду, связанную с личными данными, если iPhone или iPad заблокированы.

Рейтинг 3.9, голосов 52

Лучшие голосовые ассистенты для русскоязычных пользователей

Голосовые виртуальные ассистенты на сегодняшний день, кажется, уже стали обыденностью для каждого из нас. Но они только начинают свой путь, и уж точно нет предела совершенству в развитии для каждого из присутствующих на рынке.

Их становится всё больше — куда ни глянь, голосового помощника можно встретить в банковских приложениях, сервисах, браузерах, устройствах умного дома и не только. Сегодня разберём лучших ассистентов для русскоязычной аудитории. Список последовательно отсортирован от менее подходящих до самых достойных и перспективных помощников.

Ассистент от Google — хорошо, но не для нас

Преимущества: большое количество совместимых устройств, точные ответы, встроенный переводчик, отправка сообщений в мессенджеры, хорошего качества поиск заведений и тесная работа с картами

Недостатки: слабая адаптация под русскоязычную аудиторию, заключающаяся в отсутствии фишек, которые доступны только в США

Google Ассистент — один из старожилов на современном рынке голосовых виртуальных помощников. Он был представлен 18 мая 2016 года в качестве преемника персонализированного сервиса Google Now.

История и возможности. Задолго до релиза Google Ассистента компания успела интегрировать голосовой поиск в браузер. В это время, в 2012 году Samsung выпускает S Voice, а через пару лет на рынке появляются Cortana от Microsoft и Alexa от Amazon. S Voice всё же прекратил свою работу летом 2020 года, а последние два голосовых помощника под российский рынок так и не адаптировались.

Не сказать, что Google Ассистент максимально подходит для российских пользователей, хотя поддержку того же русского языка он получил спустя пару лет после запуска. Он помогает открывать любой сайт, включать музыку и видео, вызывать контакты, переводить фразы, узнавать прогноз погоды, отправлять сообщения в мессенджеры.

А ещё можно планировать события, находить заведения и выстраивать до них маршрут. Не обходится и без работы с различными устройствами умного дома. Это могут быть лампочки, кондиционеры, пылесосы, кухонные устройства, телевизоры, стиральные машины, холодильники, духовки и даже авто.

Перспективы. Google Ассистент больше подходит американскому рынку — там с его помощью можно заказывать еду на дом, покупать билеты или бронировать столик. К сожалению, его примитивность кроется в мелочах, порой может даже сложиться ощущение, помощник от Google «совсем как не живой».

Разумеется, Google стремится к «человечности», чтобы, когда ассистент в телефонном разговоре записывал человека на стрижку, администратор даже не понимал, что общается с роботом. В любом случае, со своей главной обязанностью — помогать — Google Ассистент справляется на ура. Это неплохой вариант для Android-пользователей, но в России можно найти и более продвинутого помощника.

Siri от Apple — придётся переходить на «яблочную» сторону

Преимущества: приятный дизайн, интеграция с сервисом Shazam, работа с картами, запоминание места парковки, можно звонить людям, читать и отправлять сообщения, планирование дня по советам

Недостатки: доступность только для техники компании Apple

Сегодня Siri живёт во всех операционных системах Apple. Многие забывают, что изначально это была разработка Siri Inc., планировавшей выпускать ассистента на телефоны BlackBerry и Android-смартфоны. Правда, 28 апреля 2010 года после покупки Siri купертиновцами планы отменились.

История. Siri являлась проектом Международного центра искусственного интеллекта SRI. Разработка стартовала в декабре 2007 года, позднее появились инвесторы, вложившие в проект 8,5 млн долларов в октябре 2008 года и ещё 15,5 млн в ноябре 2009 года.

Развитие Siri было постепенным и сложным: всё начиналось с реализации диалога и понимания естественного языка, внедрения машинного обучения, попыток выстраивания очевидного и вероятного рассуждения. В целом, в наследство Apple отчасти взяла, только вдумайтесь, результат 40-летних исследований отдела SRI International.

Голос первой версии Siri для американцев записала актриса по озвучиванию Сьюзан Беннет. Интеграция в iOS была продолжительной: только к запуску iOS 7 и выходу iPhone 5S она стала вполне функциональной, и даже обрела возможность выбора между мужским и женским голосом.

Перспективы и возможности. До анонса iOS 14 абсолютно точно можно было называть Siri довольно примитивной из-за небольшого количества команд и медленной работой. В России Siri полноценно заговорила на русском в iOS 8.3. С лета 2016 года сторонние разработчики получили возможность добавлять к Siri функциональность. Но и это не придавало ей потенциал.

Произошло чудо: в 2020 году она стала знать в 20 раз больше фактов, чем за три года до этого, а задержка ответов на быстрые вопросы значительно сократилась. А ещё Siri научилась читать и отправлять сообщения в мессенджеры без необходимости их запуска. В целом, функциональность стала обширной — Siri может позвонить кому-то, прочитать сообщение, настроить будильники, таймеры и напоминания, узнать маршруты, найти музыку, ответить на вопросы, открыть фото, презентации и даже спланировать день.

Есть ощущение, что Apple явно намерена догнать упущенное и преуспеть. Кстати, в отдельном материале мы собрали 13 полезных команд этому голосовому ассистенту.

Siri умнее, чем вы думаете: 13 полезных команд голосовому ассистенту

Siri часто ругают за относительную бесполезность и несообразительность. Однако могу вас заверить: вы просто не умеете им пользоваться.

Код ДуроваКирилл Сергеев

Салют от Сбера — одно сердце, но несколько личностей

Преимущества: разнообразие ассистентов в рамках одного проекта, наличие собственного магазина приложений, распознавание одежды героев фильмов, гибкое управление финансовыми вопросами

Недостатки: пока ещё ограниченное число сторонних продуктов, поддерживающих Салют

Сбер ворвался на этот рынок лишь 24 сентября 2020 года, представив Салют — целое семейство голосовых ассистентов с разными голосами и индивидуальными чертами характера. Они носят такие имена: Сбер, Афина и Джой.

Разбор семейства виртуальных ассистентов Салют от Сбера — три персонажа, три характера

В рамках конференции СберКонф состоялась презентация виртуальных ассистентов Салют. Это первое в мире семейство AI-ассистентов, которое включает в себя три различных персонажа с разным характером.

Код ДуроваВладислав Войтенко

История и возможности. Cбер, Афина и Джой способны на многое, так как работают при помощи самого мощного в России суперкомпьютера Сбера «Кристофари». Ассистенты умеют переводить деньги, оплачивать мобильную связь, заказывать еду, записывать в салон красоты или к врачу.

Кроме того, они способны инициировать видеозвонок, включать фильм или музыку, узнавать какую-то информацию и выдавать персонализированные ответы. А ещё семейство Салют умеет распознавать одежду героев фильмов и даже может предлагать купить оригинал или аналог во время просмотра.

Важно то, что голосовые помощники любят интересоваться вкусами, предпочтениями и фактами из жизни человека. Это позволяет им побольше узнавать человека, чтобы использовать знания при последующем общении. Помимо речи с уникальными эмоциями ассистенты распознают жесты.

Перспективы. Первыми продуктами стороннего бренда, который работает с Салютом, стали телевизоры Honor. К концу апреля 2021 года голосовые помощники Салют научились проводить анализ расходов клиента банка, рассказывать о том, сколько всего средств, отслеживать установленный бюджет, предлагать инструменты инвестирования и даже консультировать по паевым инвестиционным фондам.

Система нейросетевого синтеза речи является собственной разработкой Сбера, основанной на рекуррентно-свёрточной архитектуре Tacotron/Tacotron-2. Ассистенты способны определять интонации и эмоциональный окрас речи. При подготовке ответа на запрос используется генеративная нейросетевая модель, позволяющая складывать новые предложения. Всё это без сомнений говорит о высокотехнологичном курсе Салюта.

Маруся от Mail.Ru — твой близкий друг в твоём кругу

Преимущества: возможность запоминать нужные пользователю фразы по типу кода от подъезда, умение рассказывать интересные факты, сказки и стихи, в том числе с дополненной реальностью,

Недостатки: пока ещё недостаточное количество разнообразных продуктов, работающих с Марусей

17 июня 2019 года Mail. Ru Group запустил Марусю с голосом актрисы дубляжа Елены Соловьёвы, которая озвучивала роботов в фильме «Бегущий по лезвию», мультфильме «Роботы», а также сериалы «Любовь, смерть и роботы». На разработку потратили 2 млн долларов.

История и возможности. Маруся умеет отвечать на вопросы, выполнять поручения, узнавать новости и делиться забавными фактами. Её можно попросить включить музыку или радиостанцию, узнать цену билета или прогноз погоды. А ещё она может ответить на различные вопросы и рассказать, что сейчас идёт в кино.

Кроме того, Марусю научили управлять видеосервисом Wink и облачной платформой «Умный дом», которая объединяет в себе умные розетки, лампочки и бытовую технику, а также видеонаблюдение, комплекты для безопасности в виде датчиков движения, протечки, задымления, открытия дверей и окон.

Маруся умеет играть в викторину, рассказывать стихи и сказки, в том числе с дополненной реальностью, а также ставить музыку из соответствующих детских плейлистов.

Перспективы. Мы уже рассказывали о том, как живёт Маруся в «Капсуле». Ознакомиться можно в нашем отдельном обзоре. Марусю помогала озвучивать актриса Елена Соловьёва, известная по голосу Керри-Энн Мосс и Джулианны Мур в российском дубляже. Ассистент, правда, всё равно звучит как-то слишком роботизированно.

Обзор Капсулы от Mail.ru: Маруся обрела стройное тело

Совсем недавно вышла в продажу первая «умная» колонка от Mail.ru — «Капсула» с голосовым помощником «Маруся». Сегодня мы расскажем вам о впечатлениях от устройства, напоминающего Еву из мультфильма «ВАЛЛ-И».

Код ДуроваГайк Даллакян

С 2021 года появилась возможность собственноручного обучения Маруси новым возможностям при помощи конструктора Aimylogic от Just AI. А ещё она всё глубже интегрируется в различные сервисы. Например, скоро Марусю добавят в приложение ВКонтакте. Это говорит о том, что её будущее выглядит многообещающе.

В клиенте ВКонтакте появится голосовой помощник «Маруся»

Это обнаружил читатель «Кода Дурова» после декомпиляции последней версии установочного пакета приложения для Android.

Код ДуроваГор Хачатрян

Олег от Тинькофф — кто бы не хотел себе финансового помощника?

Преимущества: гибкое управление финансовыми вопросами, консультации, финансовые советы и лайфхаки, идентификация голоса клиента, доступность в мобильном операторе и клиентском колл-центре

Недостатки: часто не понимает, чего хочет пользователь, пока ещё ограниченное число сторонних продуктов, поддерживающих Олега

Олег появился 13 июня 2019 года — он стал первым в мире голосовым ассистента в сфере финансов и лайфстайл-услуг. Его презентовали в качестве отличного помощника в приложении Тинькофф, решающего задачи, касающиеся экосистемы банка и не только.

История и возможности. Ассистент говорит голосом российского актёра кино и дубляжа Никиты Прозоровского, который озвучивал несколько сотен культовых фильмов, сериалов и компьютерных игр. В обучении голосового помощника принимает участие мощный суперкомпьютер Тинькофф — Кластер «Колмогоров».

Суперкомпьютер позволяет быстрее обучать нейросетевые модели для распознавания речи, синтеза речи, обработки естественного языка и общения на свободные темы. Олег может распознавать и интерпретировать запросы, задавать уточняющие вопросы, решать задачи, беседовать на разные темы и помогать с финансовыми и прочими услугами.

Ещё с первой версии он был способен бронировать столики, записывать в салоны, покупать билеты в кино, а также давать советы и лайфхаки из издания Тинькофф Журнал. И что важно, Олега научили идентифицировать голос клиента, чтобы выполнять команды, требующие авторизации.

Перспективы. И не банковским приложением единым. Олег выглядит достаточно убедительно на фоне своих «коллег», так как медленно расширяет своё присутствие в разных сервисах экосистемы Тинькофф, попутно предлагая смелые решения.

Например, он живёт и в мобильном операторе Тинькофф Мобайл, позволяя принимать входящие звонки вместо человека, а также записывать разговор по телефону и расшифровывать его. Уже в этом году Тинькофф завершил интеграцию умного телефонного робота Олега в клиентский колл-центр. Он умеет сообщать баланс карты, отправлять SMS с номером договора, менять тариф, а также выступать в качестве консультанта и собеседника.

Алиса от Яндекса — забавная девчонка, да ещё и умная

Преимущества: большое количество разнообразных навыков, «человечность» и действительно живой диалог, поиск потерянного телефона, распознавание объектов по фото, работа с картами

Недостатки: иногда излишне кокетничает и не всегда понимает, что ответить на вопрос при простом общении

Алису начали разрабатывать ещё в 2016 году. Яндекс к тому времени уже позволял управять голосом в Поиске, Навигаторе и других своих приложениях. К концу сентября 2017-го с Алисой успел познакомиться Владимир Путин, а первый её релиз состоялся 10 октября 2017 года.

История и возможности. Алиса — молодая ироничная девушка, она говорит голосом актрисы дубляжа Татьяна Шитова, которая озвучивала большинство героинь Скарлетт Йоханссон. Сегодня Алиса есть в разных приложениях экосистемы Яндекса и в приличном списке устройств умного дома.

Распознавание голосового запроса происходит при помощи нескольких этапов:

  • первый — отделение голоса от шумов с технологией SpeechKit;
  • второй — разбор акцентов, диалектов, сленгов и англицизмов с базой Яндекса из миллиарда произнесённых в разных условиях фраз
  • третий — наделение запроса смыслом и подбор правильного ответа с технологией Turing.
  • четвёртый — озвучивание ответа, реализуемое при помощи технологии Text-to-speech, основой которого служат сотни тысяч записанных в студии слов и фраз, порезанных на фонемы.

С 2018 года функциональность Алисы расширилась благодаря системе навыков в виде чат-ботов и других сервисов, которые активируются по ключевой фразе. Это может быть, например, заказ еды.

Перспективы. Алиса умеет отвечать на заданные вопросы, искать нужную информацию, шутить, взаимодействовать с другими сервисами Яндекса, включать музыку и видео, читать текст, составлять список покупок, записывать напоминания, заказывать товары, строить маршруты или даже бесплатно находить потерянный телефон. Как и Маруся, она знает разные сказки и игры.

«Алиса» научилась распознавать, когда к ней обращается ребенок

Голосовой ассистент Яндекса «Алиса» научилась отличать взрослые голоса от детских и по-разному общаться с пользователями.

Код ДуроваКирилл Сергеев

А ещё Алиса понимает, что изображено на фото: она может распознавать породу кошки или собаки, незнакомое здание или памятник, марку автомобиля, знаменитость или произведение искусства. На сегодняшний день Алиса кажется самым прогрессивным и наиболее «человечным» голосовым помощником. Это неоспоримый факт, ведь ловкая импровизация и поддержка разговора — действительно её важный и зачастую полезный плюс. Сложно даже представить, как далеко этот голосовой ассистент может зайти. Быть может, пора захватывать весь мировой рынок?

Выводы

Да, за голосовыми виртуальными ассистентами стоит будущее. Правда, в тех же мобильных устройствах они выглядят не так уж и перспективно, так как большинство задач легко решаются вручную. Но даже с таким раскладом это априори полезное дополнение. Голосовые помощники всё же лучше вписываются в рамки умных устройств. И это очевидно.

Сегодня их можно встретить даже в некоторых автомобилях, но в будущем придётся сталкиваться с ними чаще: например, в общественных местах и офисах массово появятся интерактивные умные дисплеи, всё в жанре фантастики минувших лет. Каждый упомянутый сегодня голосовой ассистент двигается в правильном направлении.

Нам же остаётся только одно — надеяться на прогрессивное развитие ИИ без последствий для человечества. Ну и хотелось бы верить в полноценную защиту конфиденциальности, с чем у виртуальных ассистентов порой возникают проблемы. Но это можно простить, ведь все они ещё такие молодые…

Ирина — опенсорс русский голосовой помощник. Offline-ready / Хабр

— Ирина, таймер…
— Ставлю таймер на пять минут.

Вполне себе обыденная история из моего быта. Я таки сделал собственного автономного голосового помощника.

TL;DR> Ирина вполне неплохо работает дома 24×7.

Потребуется установить Python 3.5+ и зависимости через pip (немного знаний Python).

Скиллы «из коробки»: таймер, погода, контроль медиа (громче/тише/дальше), контроль плеера MPC-HC, запуск медиа из папки, расписание ближайших электричек, «подбрось кубик/монетку».

Плагинами добавляются: другие скиллы, Text-to-Speech и Speech-to-Text движки.

Мотивация

За каждым проектом стоят причины, побудившие автора им заняться. Давайте сначала немного о них.

Во-первых, я не в восторге, что общедоступные голосовые помощники контролируются корпорациями. Я не могу точно сказать, что X порекомендует моему ребенку на запрос «мультики» и что покажет ему на Ютубе. Я бы предпочел контролировать это самостоятельно, пусть на это уйдёт и несколько больше времени.

Во-вторых, оффлайн. Почти везде голос распознаётся на серверах, и это а) потенциально небезопасно, б) есть кейсы (например, дача), где стабильный онлайн не очень-то доступен.

В-третьих, четкая работа помощника по командам. Мне хотелось бы точно знать, что происходит, когда я произношу то или иное слово. Идея «поболтать с Алисой» мне несколько чужда — в частности, потому, что я не могу до конца доверять мотивациям людей, её создающим. Если брать ребенка, то мне бы хотелось, чтобы он учился командовать компьютером, а не болтать с ним; в конце концов, именно однозначно понимаемый набор команд можно назвать алгоритмом.

В-четвертых, короткие команды. Наверное, их можно настроить и в других помощниках, но тут это сделать гораздо проще — можно их просто запрограммировать.

В-пятых, сложные сценарии. Если весь код у вас на руках, то сделать при необходимости сценарий в духе «реши десять арифметических задачек, а потом можешь посмотреть мультик» гораздо проще.

Если вы в первом приближении разделяете часть моих мотиваций — возможно, Ирина вам подойдет.

Архитектурные компромиссы

Нельзя объять необъятное

При создании этого проекта я заложил в него некоторые компромиссы. Они усложнят работу в одном случае, и упростят в другом. Давайте с ними ознакомимся, прежде чем переходить к технической части.

  1. Основная цель проекта — дать программисту возможность быстро дополнять навыки голосового помощника и настраивать их под себя.

  2. Установка помощника сделана больше для программиста на Python, нежели для конечного пользователя. Потребуется скачать проект с Github, установить зависимости через pip, и запустить Python-файл. Зато дописывать проще. (Я не против, если кто-то упакует это в EXE, но я сам не чувствую в этом необходимости)

  3. Установка плагинов. Плагины надо кинуть в папку plugins, а после их запуска можно настроить их JSON-конфиг (для тех, у кого предусмотрены настройки) в папке options. Возможно, имело смысл сделать какой-нибудь онлайн-репозиторий, и механизм установки, но я делал быстро и максимально просто.

  4. Мультиязычность. Мультиязычность бы потребовала умение обрабатывать разные языки (определенная сложность парсинга команд), а также каждый раз работать с локализованными строками. Я посчитал, что её поддержание обойдется слишком дорого программисту, пишущему «для себя». Поэтому многоязычность плагинов не поддерживается — всё только на русском, но просто. (Ядро поддерживает многоязычность, т.к. там не так много языкозависимых строк. При желании вы можете просто переписать нужные вам плагины на нужный вам язык. Также можно подключить другие Text-to-Speech и Speech-to-Text движки, и работать на другом языке)

  5. Не Python-style кода (личное). С Python я начал работать не так давно, и до сих пор много работаю на других языках. Поэтому при написании кода я часто использую типовое ООП, хотя возможно, что-то можно было сделать компактнее.

Если указанные компромиссы вас не отпугнули — думаю, имеет смысл познакомиться с Ириной.

Быстрый старт

  1. Скачайте проект с Github

  2. Для быстрой установки всех требуемых зависимостей можно воспользоваться командой: pip install -r requirements. txt

  3. Для запуска запустите файл runva_vosk.py из корневой папки. По умолчанию он запустит оффлайн-распознаватель vosk для распознавания речи с микрофона, и pyttsx движок для озвучивания ассистента (стандартный движок Windows для синтеза речи).

  4. После запуска проверить можно простой командой — скажите «Ирина, привет!» в микрофон

Общая логика

Запуск всех команд начинается с имени ассистента (настраивается в options/core.json, по умолчанию — Ирина). Так сделано, чтобы исключить неверные срабатывания при постоянном прослушивании микрофона. Далее будут описываться команды без префикса «Ирина».

Плагины

Поддержка плагинов сделана на собственном движке Jaa.py — минималистичный однофайловый движок поддержки плагинов и их настроек.

Плагины располагаются в папке plugins и должны начинаться с префикса «plugins_». Плагины задают навыки/скиллы голосового помощника.

Настройки плагинов, если таковые есть, располагаются в папке «options» (создается после первого запуска).

Готовые плагины

С Ириной поставляются плагины, которые закрывают большую часть обыденных кейсов использования голосового помощника (если вы, конечно, не собираетесь с ним общаться). Для каждого плагина написано, требуется ли онлайн. Для отключения удалите его из папки.

plugin_greetings.py — приветствие (оффлайн). Пример команды: «ирина, привет»

plugin_timer.py — таймер (оффлайн). Примеры: «таймер, таймер шесть минут, таймер десять секунд, таймер десять» (без указания единиц ставит на минуты — «таймер десять» — на десять минут. Просто «таймер» ставит на пять минут)

plugin_mediacmds.py — команды управления медиа (оффлайн). Пример: «дальше, громче, тише, сильно громче, сильно тише, пауза». (Если установлено mpcIsUseHttpRemote, то сначала делается попытка вызвать команду плеера MPC-HC, если не удается — используется эмуляция мультимедийных клавиш)

plugin_mpchcmult.py — проигрывание мультиков через MPC-HC из определенной папки (оффлайн). Пример «мультик <название_мультика>». Папка задается в конфиге. При вызове команды в папке ищется файл с соответствующим названием <название_мультика> и любым расширением. Если найден — запускается на проигрывание. (Как можно догадаться, этот плагин предназначен для показа отобранных медиа без обращения к ютубу.)

plugin_random.py — рандом (оффлайн). Примеры: «подбрось|брось кубик|монетку». Содержит примеры парсинга дерева команд (команды можно задавать деревом). Больше демонстрационный плагин.

plugin_weatherowm.py — погода (онлайн). Примеры: «погода, погода завтра, погода послезавтра, прогноз погоды». Требует установки в конфиге бесплатного API-ключа отсюда, а также местоположения пользователя.

plugin_yandex_rasp.py — расписание ближайших электричек через Яндекс.Расписания. Пример: «электричка, электрички». Требует установки в конфиге бесплатного API-ключа для личных нужд (до 500 запросов в сутки) отсюда, а также станций отправления и назначения. (Если вы ездите на электричке — фраза «ирина, электричка» очень удобна для проверки расписания)

plugin_tts_pyttsx.py — (оффлайн) позволяет делать TTS (Text-To-Speech, озвучку текста) через pyttsx движок. Используется по умолчанию.

plugin_tts_console.py — (оффлайн) заглушка для отладки. Вместо работы TTS просто выводит текст в консоль.

Свои Text-to-Speech и Speech-to-Text движки

По умолчанию для распознания речи используется движок VOSK, для синтеза — Windows (голос Irene).

Дописать свои варианты вполне можно, это стандартная операция. Детали — в Github.

Уже доступен STT через модуль SpeechReсognition (онлайн-распознавание от Гугла и пр.), а также TTS через Silero (нейросетевая генерация оффлайн). Мне не очень понравился результат Silero (хотя сам проект прекрасен) — генерируется дольше, задержка в несколько секунд, а также есть «металлические» шумы, но, возможно, он подойдет вам. (Кстати, в одном из комментариев @putnik поделился собственным анализом доступных движков TTS и STT. )

Кстати, имя помощника тоже настраивается в файле конфигурации — так что если нужно, можете сделать, чтобы он откликался на имя «Джарвис». И можно поставить мужской голос, конечно.

Аналоги

Честно говоря, я начал писать свой проект без анализа аналогов. Ну, точнее, беглый гуглеж позволил мне найти прекрасную хабрастатью @EnjiRouz Пишем голосового ассистента на Python, а также соответствующий репозиторий, который и послужил основой для проекта.

Правда, например, код для получения погоды c OpenWeatherMap пришлось полностью переписать, потому что они перестали поддерживать старое API.

Лишь позднее, в декабре на хабре появилась статья Программируем умный дом, а к ней довольно интересный коммент putnik, который попробовал самые разные системы. Процитирую:

Ну и более конкретно прокомментирую часть про голосовых ассистентов, так как я этим сейчас активно занимаюсь:

Один из самых больших проектов на github с открытым кодом голосового помощника называется Leon. Система сделана французом…

…и поэтому поддерживает только два языка: английский и французский. К тому же проект имеет довольно небольшое сообщество и в основном разрабатывается автором. Как следствие, набор модулей, которые обеспечивают интеграцию, довольно скуден.

После, у нас есть JARVIS из Железного Человека. <…> Это позволит вам создавать вашу собственную Сири в пределах отдельно взятой сети.

Интересно, получилось ли у автора создать собственную Сири, или всё же самостоятельная настройка споттера, распознавания голоса и озвучки текста на отдельно взятой малинке всё же сильно выходят за рамки «небольшой конфигурации». Ну, и если ничего не поменялось, то у него была проблема с поддержкой даже не русского, а вообще какой-либо локализации. Так что, вероятно, вам придётся делать форк и переводить все сообщения.

Чуть более популярная чем Jarvis, но уступающая Леону — система Mycroft.

Про эту знаю несколько больше, так как выбрал её и сейчас занимаюсь локализацией. И хорошо, если хотя бы к новому году смогу получить сколько-нибудь работающее решение.

Ядро небольшое, почти всё вынесено в плагины и навыки. Есть какое-никакое сообщество, которое эти навыки пишет и поддерживает. Хотя встречается довольно много говна и палок не самых лучших архитектурных решений. Ядро в интернет ломится за настройками навыков, которые хранятся на сервере, сами навыки за данными. По умному дому более-менее нормальная интеграция есть только с Home Assistant, остальное вам придётся писать с нуля. По музыке есть интеграция со Spotify (если вас не смущает необходимость хранить пароль в открытом виде на чужих серверах).

Лично я немного потыкал Jarvis, который мне показался похожим по архитектуре на мою собственную. Сделан достаточно удобно; но это, вообще говоря, проект, рассчитанный под консольные команды(!) на английском(!). Т.е. адекватная локализация на русский — дело крайне большое; не говоря уже о том, что ряд кейсов плохо укладывается в голосовое, а не консольное управление (например, игра «Быки и коровы»).

В общем, на мой взгляд, проект «Ирина» для русского пользователя — совсем неплохо. С другими проектами придется серьезно решать проблемы локализации. Хотя, конечно, интеграций в аналогах больше — но при желании их можно попытаться портировать под Ирину.

Заключение

Честно говоря, я сам не ожидал, но Ирина вполне себе прижилась у нас в семье.

Самый часто используемый навык — таймер, потому что рядом кухня. Иногда используется погода и электрички. Мультики пока ещё не востребованы, думаю заняться ими позже.

Крутится это все на ноутбуке, который в настоящее время является сервером. Встроенного микрофона хватает на эффективное распознавание с 2-3 метров; хотя, конечно, иногда не срабатывает и приходится либо повторять, либо подходить вплотную.

Загрузка процессора минимальна; думаю, пойдет и на Малинке, но, конечно, не пробовал.

Свои плагины

Честно говоря, у меня уже есть несколько собственных плагинов чисто «под себя».

Например, по «ирина, запусти музыку» открывается Яндекс. Музыка.

Еще у нас есть локальный, не сетевой доставщик неплохой пиццы (PushPizza, если кому интересно). Где-то за полчаса я написал плагин, который проверяет, в каком состоянии доставка — готовится, или едет. Написан алгоритм с использованием библиотеки pyautogui, позволяющей эмулировать ввод пользователя (мышь и клавиатуру):

  1. Открыть страницу доставки

  2. Подождать чуть-чуть

  3. Найти на экране картинку (форму ввода телефона) (да, в pyautogui такое есть из коробки)

  4. Перевести туда мышь и кликнуть

  5. Сэмулировать ввод телефона

  6. Вуаля! Страница со статусом доставки доступна

В общем, вроде писать плагины оказалось несложно. (Если вы вдруг что-то напишете и захотите поделиться, можете кидать ссылки сюда.

Благодарности

@EnjiRouz за проект голосового ассистента, который стал основой (правда, был очень сильно переработан), а также за отличную статью на Хабре: Пишем голосового ассистента на Python

AlphaCephei за прекрасную библиотеку распознавания Vosk.

@putnik за разбор других голосовых помощников и список TTS и STT решений


Github проекта

UPD: Некоторые добавления с момента публикации статьи

  • Добавлен TTS плагин для RHVoice

  • Вышла версия 3.x — с возможностью многомашинных инсталляций. На центральном сервере запускается REST/JSON сервер с Ириной (FastAPI). Сервер делает всю работу плюс даже TTS. От клиентов требуется отправлять только распознавать данные с микрофона и отсылать команды серверу. Так что Ирину можно запускать на нескольких машинах в разных комнатах.

    • Для клиента в базовом варианте (vosk) сделал готовый EXE-файл (auto-py-to-exe), который не привязан к установке Питона. Его вроде можно запускать вообще где угодно.

    • Учитывая, что у Ирины теперь есть REST API, при желании можно запилить какие-нибудь интеграции (например, написать клиент для Телеграм и удаленно вызывать команды)

  • В комментах к статье есть обсуждение с проблемами установки под Linux; возможно, кому-то пригодится

Google Ассистент на русском: как настроить и использовать

Вы, наверное, знаете, что голосовой помощник Google Ассистент уже умеет разговаривать на русском языке. Сегодня расскажем, как настроить и начать им пользоваться.

Содержание

  • Google Ассистент: что это такое?
  • Как установить Google Assistant
  • Как настроить Google Ассистент?
    • Как изменить аккаунт в Google Ассистент
    • Как настроить свой псевдоним?
    • Персональные настройки
    • Настроить доступ к музыкальным сервисам
  • Как настроить функцию «Мой день»
  • Как же использовать Google Ассистент?
  • Как в Google Ассистент просмотреть историю действий
  • Вместо тысячи слов

В последнее время очень много разговоров об искусственном интеллекте в смартфонах, о голосовых помощниках на разных устройствах. Эта тема на слуху, интересует многих пользователей. Особенно это касается голосовых помощников в смартфонах. Google Ассистент является одним из самых популярных в мобильном сегменте. Это и неудивительно, ведь он встроен в самую популярную мобильную операционную систему Android, является детищем компании Google.  

Google Ассистент: что это такое?

Немного истории. Стоит отметить, что Google Ассистент, известный ранее как Google Now, вышел в свет 9 июля 2012 года вместе с Android 4.1. Как я уже писал выше, он установлен по умолчанию практически на всех устройствах с Android, а также есть возможность установить его в качестве приложения на iPhone и на беспроводном динамике с голосовым управлением Google Home. Но все же на протяжении нескольких лет голосовой помощник был доступен только на смартфонах Pixel. В компании Google решили более напористо продвигать свой Google Assistant, поэтому теперь его могут установить все пользователи мобильных устройств под управлением Android, начиная с версии 6.0.

Но долгое время голосовой помощник от Google был недоступен на русском языке, поэтому у нас редко кто его использовал. Более того, большинство пользователей смартфонов даже и не подозревают о том, что у них он есть, так как не знают об этом. Голосовыми помощниками довольно редко пользуются обычные пользователи, скорее, продвинутые гики или энтузиасты, которые любят всё новое в IT-технологиях. И вот, в начале августа 2018 года Google Ассистент заговорил на русском языке, хотя для нашей страны всё равно остались некоторые нюансы. О них и о том, как настроить и использовать голосовой помощник Google Ассистент пойдет речь дальше в моей статье.

Как установить Google Assistant

Начнем сразу же с нюансов. К нашему большому сожалению Google Ассистент пока что не поддерживает украинский язык, вы даже не сможете включить голосовой поиск (Voice Match) в своем смартфоне. Увы, таковы реалии. Более того, если вы установите русский язык и регион Украина, то всё равно в полной мере не сможете использовать голосовой помощник от Google. В этом можете убедиться из моего скриншота.

Поэтому, если уже решили попробовать Google Ассистент, то придется установить русский язык и регион Россия, либо, к примеру, английский и регион USA.

Сегодня расскажу именно о первом варианте. Итак, прежде всего вам придется обновить приложение Google до версии 6.13 и выше. 

Самый простой способ вызова голосового помощника — нажать на кнопку «Домой» в вашем смартфоне, а также открыв приложение Google.

Нужно помнить, что без входа в учетную запись Google Ассистент недоступен. Об этом вас предупредит система сразу же. Войдите в свою учетную запись,

голосовой помощник попросит вас пару раз произнести фразу «Окей, Google» для того, чтобы потом он узнавал ваш голос.

Google Ассистент тут же откроется в виде всплывающего окна, предлагая сразу озвучить голосовую команду, ненавязчиво подсказывая задать вопрос о том, что он умеет, при этом внимательно вас слушая, о чем говорят колеблющиеся цветные точки в нижней части экрана.

Собственно говоря, и всё, голосовой помощник от Google готов к работе.

Вы можете задавать ему каверзные вопросы, расспрашивать о погоде, попросить рассказать анекдот или спеть.

Как настроить Google Ассистент?

Но для того, чтобы он умел многое, знал ваши потребности, предугадывал капризы, отвечал именно то, что интересует вас, следует немного настроить его работу. Иначе со временем вы скажете, что  Google Ассистент ничего не умеет и забудете о нем. А это, поверьте, совсем не так.

Прежде всего разберемся с основными настройками, которые, к слову, практически не изменились, если сравнивать с теми временами, когда голосовой помощник не понимал русского языка. Проще говоря, те, кто уже пробовал пользоваться Google Ассистент, нового ничего не увидят. Разве что все настройки теперь доступны на русском языке.

Открыв Google Ассистент, вы увидите в нижней части три иконки.

Слева находится иконка вызова клавиатуры, когда не очень удобен голосовой ввод. Нажав на нее, вы можете ввести любую команду для голосового помощника. По центру, собственно, активация голосового ввода, а справа — иконка доступа к сервису Google Объектив (Google Lens).

По поводу последнего могу сказать, что он позволит вам копировать текст, искать похожие товары, распознать растения и животных, искать книги и мультимедиа, но самое главное — сканировать QR- коды. 

У вас есть возможность развернуть окно программы на весь экран. Для этого просто потяните его вверх за верхний край. Вы тут же попадете в расширенную историю обращений к Ассистенту, а также к горизонтальному списку популярных запросов из Сети.

Если нажать на синюю иконку вверху, то вы получите детальную информацию о своих запросах, а также доступ к популярным сервисам. Своеобразный поиск в поиске. Но это довольно прикольно и практично.

Но если вы хотите получить доступ к еще более расширенным настройкам, то нажмите на иконку справа. Экран тут же изменится. Вы получаете подсказки по поиску, а также популярные запросы к Google Ассистент. К тому же теперь в правом углу синий значок сменится на три точки контекстного меню, в котором можно просмотреть информацию о своем аккаунте, просмотреть свои действия, а также настроить программу. Давайте попробую предугадать некоторые ваши возникшие вопросы и дать подсказки.

Как изменить аккаунт в Google Ассистент

Напомню, что голосовой помощник умеет работать с почтой Gmail, Google Фото и другими сервисами. Поэтому вам следует убедиться, что Google Ассистент подключен именно к нужному вам аккаунту.

 

Если же вы по какой-то причине подключили и используете другой аккаунт, то не стоит отчаиваться. У вас есть возможность в любой момент сменить его на нужный. Для этого придется выполнить несколько простых шагов:

  1. Прежде всего откройте Google Ассистент, нажав на кнопку «Домой»
  2. В правом верхнем углу нажмите на значок меню
  3. Откроется функция обзора, где нажмите на знакомые уже три точки в правом углу
  4. Во всплывшем меню следует нажать на Аккаунт
  5. Теперь вы сможете добавить новый аккаунт, сменив прежний

Как видите, все довольно просто и легко. Теперь голосовой помощник будет работать с нужным аккаунтом и сервисами.

Но самое интересное находится во вкладке Настройки. Именно на нее и хотелось бы обратить особое внимание. Не хочется перечислять все возможности, так как на это уйдет много времени и придется писать обширный текст, но на некоторые интересные моменты всё же обратим внимание.

Как настроить свой псевдоним?

Если захотите, чтобы Google Ассистент как-то по-особому к вам обращался, то следует выбрать псевдоним. Самое интересное, что теперь есть возможность записать транслитерацией ник, которым программа будет обращаться к вам. Все довольно просто:

  1. Запускаем Google Ассистент, нажав на кнопку «Домой»
  2. Нажимаем иконку в верхнем правом углу
  3. Переходим в раздел «Настройки», нажав на три точки в правом углу
  4. Заходим в подраздел «Личные данные», находим Псевдоним
  5. Прописываем нужное обращение

Теперь голосовой помощник именно так и будет каждый раз обращаться к вам. Вы можете сменить псевдоним в любой момент.

Также многим будет полезно настроить доступ Google Ассистент к некоторым сервисам. Рассмотрим некоторые из них.

Персональные настройки

Один из самых важных разделов, который поможет максимально настроить голосовой помощник под себя. Для этого:

  1. Запускаем Google Ассистент, нажав на кнопку «Домой»
  2. Нажимаем иконку в верхнем правом углу
  3. Переходим в раздел «Настройки», нажав на три точки в правом углу
  4. Открываем «Персональные настройки»
  5. Рекомендую включить функцию «Продолжение разговора», которая позволяет приложению услышать и выполнить ваши уточняющие вопросы, которые можно задать после ответа на основной вопрос

Разговор с Google Ассистент теперь будет более содержательным и не ограничится парой стандартных вопросов и ответов.

Настроить доступ к музыкальным сервисам

Мы недавно писали, что в Украине появилась возможность пользоваться сервисом YouTube Music. В настройках Google Ассистент теперь появилась возможность голосовой командой находить нужные треки из данного сервиса. Для этого необходимо:

  1. Запустить Google Ассистент, нажав на кнопку «Домой»
  2. Нажать иконку в верхнем правом углу
  3. Перейти в раздел «Настройки», нажав на три точки в правом углу
  4. Открыть подраздел «Музыка», где находим YouTube
  5. Отметить данный сервис, и теперь он будет по умолчанию открываться с помощью голосового помощника

К сожалению, есть некоторые неприятные моменты. Так, если вы используете, к примеру, Spotify или Apple Music, то не сможете их установить по умолчанию. По крайней мере, мне это не удалось. Возможно, позже что-то и поменяется в этом плане.

Как настроить функцию «Мой день»

Современный человек хочет быть в курсе событий. Знать о том, что происходит в его городе, стране или мире, хочет следить за погодой, иметь доступ к напоминаниям календаря, заметкам по работе и т. д. Для того, чтобы настроить функцию «Мой день», выполните несколько настроек:

  1. Запустите Google Ассистент, нажав на кнопку «Домой»
  2. Нажмите иконку в верхнем правом углу
  3. Перейдите в раздел «Настройки», нажав на три точки в правом углу
  4. Откройте сервис «Мой день»
  5. Используя флажки, выберите действия, которые Вы планируете выполнить на протяжении дня
  6. Особое внимание обратите на раздел новости. К сожалению, у вас не будет возможности добавить украинские источники поступления новостей

Для тех, кто хочет побольше знать о настройках Google Ассистент, я выложу скриншоты, на которых подробно всё видно. 

Как же использовать Google Ассистент?

Уверен, что вам уже не терпится побольше узнать о функциональных возможностях голосового помощника от Google. Начать общаться с ним довольно просто.

Нажимаете на кнопку «Домой», проговариваете фразу «Окей, Google». Задаете свой вопрос Google Ассистент и ждете ответа.

Я, насмотревшись рекламных роликов на презентации Google Ассистент, тоже решил получить ответ на такие же вопросы. Помните, как там просят записать хозяина на стрижку? Так вот, мне так и не удалось добиться желаемого.

Максимум, чего добился, — пара роликов о стрижке и то довольно скучных.

Ладно, думаю, попробую купить билет в кинотеатр на фильм «Аквамен». Мало того, что мне нужно было добавлять, что именно в Харькове, так я еще вдобавок получил только информацию о том, в каких кинотеатрах моего города фильм идет. Но желанных билетов так и не дождался.

Та же ситуация со стоимостью и бронированием билетов на самолет и поезд до Киева. Ну хоть узнал цену авиабилета до Киева. С билетами на поезд ничего не получилось, кроме ссылки на сайты по их бронированию.

Иными словами, пока что особой пользы от Google Ассистент я не вижу, разве что ради выполнения простых запросов или забавы. К слову, традиционные задачи, такие как узнать погоду, проложить маршрут до определенного места, написать сообщение и даже позвонить кому-то, не вызывают у Ассистента трудностей и получаются легко и непринужденно. Но я не уверен, что данные возможности особо кому-то нужны. Хотя, я могу и ошибаться.

Мне также захотелось пообщаться с Google Ассистент на свободные темы, задать мучащий всех вопрос: «Кто же умнее: Siri, Cortana или Google Asistant?». Тут бездушная машина всё время одинаково отвечала, не импровизируя и не уточняя.

Когда же я высказал мнение, что он скучный, то чувствовалось, что голосовой помощник был обижен и постарался исправиться.

Пел мне частушки, рассказывал анекдоты, правда, они повторялись раз за разом. Чувствовалось, что его юмора и «свободы мышления» хватает на несколько банальных шуток и заранее записанных ответов, без изюминки. Так что это, в первую очередь, инструмент и лишь самую малость развлечение.

Как в Google Ассистент просмотреть историю действий

У меня возник только один важный вопрос после использования Google Ассистент. Как известно, когда вы делаете какой-либо поисковый запрос, голосовой помощник также отслеживает ваше местоположение. Компания Google уверяет, что эти данные конфиденциальны и не передаются посторонним лицам. К тому же у вас есть возможность просматривать свои действия. Для этого следует выполнить несколько простых шагов:

  1. Запускаем Google Ассистент, нажав на кнопку «Домой»
  2. Нажимаем иконку в верхнем правом углу
  3. Переходим в раздел «Мои действия», нажав на три точки в правом углу
  4. После этого запустится браузер Google Chrome, и вы увидите журнал действий. Нажав на кнопку «Подробности», вы сможете увидеть более подробную информацию (например, где вы были, когда происходили какие-либо конкретные действия)

Но у вас нет никакой возможности как-то повлиять на данную информацию или хотя бы ее удалить. И это, несомненно, настораживает.

Вместо тысячи слов

У меня осталось какое-то двоякое впечатление от общение с Google Ассистент. С одной стороны, мы имеем долгожданную поддержку русского языка, которая дала возможность полноценно общаться с голосовым помощником (не уверен, что большинство из вас в совершенстве владеет английским). С другой стороны, я так и не получил какого-то WOW-эффекта от общения. Ответы стандартные, сухие, лаконичные, большинство вопросов так и остались без ответов, некоторые сервисы так и недоступны в Украине, также плохо с новостными ресурсами. Даже при написании обычного сообщения Google Ассистент игнорирует знаки препинания, иногда неправильно находит нужный контакт при вызове. Я уже не говорю о том, что просто пообщаться с ним не о чем. Эти банальные, заученные фразы, повторяющиеся частушки, песни и анекдоты быстро мне надоели.

Будем надеяться, что в компании Google и дальше постараются развивать свой голосовой помощник. Ведь именно за ними будущее.

bne IntelliNews — Алиса против Алексы: Яндекс запускает русскоязычного голосового помощника

Поиск

Автор bne IntelliNews 11 октября 2017 г.

Российский онлайн-гигант «Яндекс» запустил голосового помощника «Алиса», доступного для Android и iOS, а также в виде бета-версии для Windows, сообщила компания 9 октября.

На основе технологии нейронных сетей , помощник может распознавать речь, понимать запрос пользователя и оказывать помощь. Яндекс утверждает, что «Алиса» — это не просто голосовой помощник, а персонаж с характером и чувством юмора.

Голос «Алисы» — российская актриса Татьяна Шитова, известная тем, что дублировала голливудскую звезду Скарлетт Йоханссон в русских версиях своих фильмов. Виртуальный помощник Amazon Alexa не имеет русскоязычной версии.

В настоящее время «Алиса» может работать с несколькими сервисами Яндекса, включая поисковик, карты, музыку и погоду.

«Мы хотим, чтобы «Алиса» говорила с людьми на их языке, а не навязывала свой, как это было с компьютерными интерфейсами в прошлом», — заявил руководитель отдела речевых технологий «Яндекса» Денис Филиппов. утверждение.

Он добавил, что «Алиса» может распознавать нормальную человеческую речь с неполными предложениями и неправильным произношением.

Яндекс также находится в процессе разработки аудиоустройства, способного распознавать человеческую речь, сообщают Ведомости .

В конце сентября «Яндекс» подарил «Алису» президенту Владимиру Путину во время его посещения штаб-квартиры компании.

Однако голосовой помощник затруднился ответить на вопросы президента, отвечая на вопрос Путина: «С вами здесь плохо обращаются?» говоря: «Я приму это к сведению».

Когда Путин спросил, что делает «Алиса», она ответила: «Глядя на последние фотографии котов в Яндексе. Кошки самые лучшие!»

 

 

В апреле-июне выручка Яндекса увеличилась на 23% г/г до 22,1 млрд руб. (316 млн евро).

Доходы компании от рекламы, составляющие 95% выручки, выросли на 21% г/г до 20,9 млрд руб., в то время как прочие доходы, в основном состоящие из доходов Яндекс.Такси, выросли на 59% г/г до 1 руб. 2млрд.

Яндекс — КЛЮЧЕВЫЕ ПОКАЗАТЕЛИ

 

2014

2015

2016E

2017E

2018E

Финансовые показатели, $ млн

         

Доходы

1 337

986

1 037

1 272

1 418

EBITDA

554

346

366

476

548

Рентабельность по EBITDA

41%

35%

35%

37%

39%

Чистая прибыль

549

160

122

173

207

EPS (прил. ), $

1,13

0,63

0,68

0,92

1,07

Див/доля, $

0

0

0

0

0

Оценка, передача и доходность

         

EV/EBITDA

6,4

13,1

18,3

13,3

11

Р/Е

10,6

23,9

32,8

24,4

20,8

П/КФ

9,9

15,6

20,1

15,7

14

Чистый долг/EBITDA

отрицательный

отрицательный

отрицательный

отрицательный

отрицательный

Дивидендная доходность

0,00%

0,00%

0,00%

0,00%

0,00%

Рост

         

Доходы

8%

-26%

5%

23%

12%

EBITDA

2%

-38%

6%

30%

15%

EPS (прил. )

-3%

-44%

8%

35%

17%

Оценка сектора

       

EV/EBITDA

7,5

12,7

15.1

12

10

Р/Е

9,8

21,5

26,2

21

18,4

П/КФ

4,2

15,9

18,5

15,1

13,6

Рост сектора

       

Доходы

5%

-28%

1%

18%

11%

EBITDA

-1%

-35%

0%

20%

13%

EPS

13%

-42%

8%

25%

 

Основные акционеры

       

Бэринг Восток

   

4,50%

 

Учредители и высшее руководство

10,90%

       

Прочее

5,40%

       

Свободный поплавок

75,40%

       

Казначейские акции

3,80%

       

Веб-сайт

         

http://company. yandex.com

         

 

 

Российский магнат Усманов выходит из сети ВК, фирмы, связанные с «Газпромом», получают 46%

USM Holdings российского магната Алишера Усманова одобрила продажу 45% акций MF Technologies, структуры, контролирующей 57,3% голосующих и 4,8% экономических акций ВК (бывшая Mail.ru) … подробнее

Глобальный провайдер онлайн-обмена MultiBank Group бросает вызов Von der Heydt Group и предлагает возмещение держателям облигаций

Глобальный провайдер онлайн-биржи и криптовалютной экосистемы MultiBank Group подает апелляцию на решение о прекращении дела, возбужденного против ее бывшего партнера по совместному предприятию, немецкой компании Von … еще

Россия работает над суперприложением для госчиновников

Минцифры России объявило тендер на суперприложение, которое государственные чиновники будут использовать для «повышения безопасности и независимости от санкций». Победитель тендера будет … больше

Алиса от Яндекса занимает первое место на рынке голосовых помощников в России вытекло. Неудивительно, что Яндекс (российский Google) занимает первое место, но даже с учетом инвестиций банков возникает вопрос об отношении операторов к технологии.

По оценкам Just AI, при населении около 146 миллионов человек в России насчитывается около 52 миллионов пользователей голосового помощника. Судя по цифрам, у Алисы (Алисы) от Яндекса 45 миллионов пользователей, у Google Assistant — 11 миллионов, а у Siri от Apple — 6 миллионов.

Возможно, это свидетельствует о том преимуществе, которое имеют носители русского языка перед теми, кто не говорит на этом языке. Несмотря на то, что русский язык в значительной степени фонетичен, он довольно сложен, наполнен грамматическими правилами и путаницей глаголов, которые вызовут недоумение у говорящего по-английски, хотя мы прекрасно понимаем, что английский тоже не так прост в изучении.

Когда Just AI опросил пользователей смартфонов (обратите внимание, что проникновение смартфонов в России намного ниже, чем в Европе и Северной Америке), 71% сказали, что использовали умного помощника в 2019 году. В следующем году эта цифра выросла до 77%, но количество людей, сообщающих о ежедневном использовании, было намного ниже — 29% в 2019 году и 32% в 2020 году. настроен на всплеск. С этой целью Яндекс объявил о продаже 1,3 миллиона устройств с установленной Алисой с момента запуска три года назад, но смартфоны по-прежнему являются источником большинства взаимодействий с голосовым помощником.

Для справки: Amazon продала более 200 миллионов устройств Echo за первые шесть лет работы после запуска в 2014 году, причем большая часть из них появилась в США. В настоящее время утверждается, что сотни миллионов устройств с поддержкой Alexa используются по всему миру, но это, конечно, включает и устройства с встроенной интеграцией Alexa.

Таким образом, Россия отстает в плане домашних устройств, что потенциально открывает возможность для ее операторов сделать шаг вперед. Местные эксперты по-прежнему указывают на финансовые услуги и колл-центры в качестве текущих основных движущих сил, однако меньшее число указывает на телекоммуникационный сектор.

Что касается отечественных голосовых помощников, то у Mail.ru Group (владеющей социальной сетью ВКонтакте) также есть «Маруся», а у Сбербанка — «Салют». В настоящее время Алису от Яндекса можно найти в устройствах Station, а также в операционной системе Smart TV (запущенной в 2020 году), Маруся от Mail.ru — в Капсулах, а Салют от Сбербанка — на смарт-экране Портала, хотя технически это часть новое подразделение SberDevices, специализирующееся на потребительской электронике, в том числе на подключенном к Sber Box ТВ-стриминговом устройстве. Любая бытовая техника — цель для «СберДевайс», — говорит технический директор Денис Филиппов.

Сбер также запускает собственный магазин приложений SmartMarket, а в другом банке, Тинькофф, тоже есть помощник Олег, но без устройств. Возникает вопрос о сложности российских банковских услуг, если станет практичным развертывание голосового помощника для взаимодействия с клиентами, но это несколько выходит за рамки компетенции Faultline.

МТС, оператор мобильной связи, который также имеет широкий спектр операций платного телевидения, которые он сейчас пытается объединить в предложении Kion OTT, работал над умным динамиком и дошел до раздачи бета-версий для сбора отзывы клиентов в прошлом году. Тем не менее, теперь ходят слухи, что проект был остановлен в начале этого года, что потенциально может положить конец прекрасно названному помощнику Марвина.

Представитель МТС в беседе с представителями российской технологической организации заявил, что существующие стандарты конфиденциальности данных нуждаются в доработке. В МТС считают важным «внести точечные коррективы в законодательство о персональных данных, чтобы компании имели возможность обрабатывать предварительно обезличенные данные, в том числе накопленные государством, регулируемые законом. На законодательном уровне упростить процедуру преобразования персональных данных в обезличенную информацию и разрешить использование такой информации. Успешное развитие рынка умных помощников на основе технологий ИИ требует увеличения количества доступных качественных данных и создания поддерживающей среды для их использования».

Выдает ли это какую-то закулисную драму, предполагающую, что МТС попала в конфликт с регулирующим органом или судебным разбирательством, еще неизвестно. На данный момент похоже, что MTS приостановила разработку, и приведенное выше заявление может дать ключ к пониманию того, почему.

Что касается остальных операторов платного телевидения, то крупнейшим является Триколор, у которого около 15 миллионов абонентов спутникового сервиса. За ним следует «Ростелеком», у которого около 11 миллионов абонентов, примерно поровну разделенных на IPTV и кабельное телевидение. Третье место теперь принадлежит МТС, у которого около 7 миллионов абонентов на традиционном телевидении. Четвертое место занимает ER Telecom (кабельное), у которого около 4 млн, а у Ориона около 3 млн спутниковых абонентов. Примечательно, что раздел «Другие» на рынке довольно велик, на него приходится около 12 миллионов абонентов, что свидетельствует о том, насколько раздроблена инфраструктура в России.

Насколько мы можем судить, ни у одного из этих операторов нет активных планов голосового помощника. Триколор имеет интеграцию CPE для Алисы Яндекса, добавленную как расширение функциональности управления устройствами «Умный дом как услуга» (SHaaS) Триколора. «Ростелеком» продает устройства Capsule от Mail.ru, но, похоже, это все, что касается сектора платного телевидения.

Переходя к операторам мобильной связи, МТС является самым крупным оператором в городе. МегаФон, занявший второе место, похоже, не имеет каких-либо публичных планов, в то время как у Tele2 Россия, занявшей третье место (в процессе приобретения Ростелекомом), по крайней мере, есть активный чат-бот для обслуживания клиентов, который со временем может развиваться. У «Билайн» «Вымпелкома» есть что-то похожее, называется «Билайн Секретарь», и, конечно же, у Тинькофф Банка есть свой MVNO Tinkoff Mobile, который является проводником для Олега.

Сравнение языковой поддержки в голосовых помощниках (обновление 2021 г.)

Все, что вам нужно знать о языках, поддерживаемых голосовыми помощниками с самым высоким рейтингом на рынке.

Современные голосовые помощники с искусственным интеллектом теперь внедряются во все, от автомобилей до холодильников и часов. Вспомните Alexa от Amazon, Google Assistant и Siri от Apple.

Узнайте больше о наших решениях для обработки речевых данных.

И поскольку рынок расширяется с невероятной скоростью, между софтверными гигантами начинается гонка. Каждый из этих гигантов полон решимости стать голосовым помощником по умолчанию для смарт-устройств по всему миру.

В значительной степени победитель будет определяться исходом продолжающейся битвы за право владения умными колонками.

Другими словами, эти централизованные концентраторы действуют как точки расширения для «умного дома» и легче интегрируются с устройствами, на которых работает тот же ИИ для голосового управления.

Борьба за увеличение доли рынка умных колонок как никогда остра, и крупные компании делают все возможное, чтобы переманить вас на свою сторону.

Вот что вам нужно знать при сравнении языковой поддержки среди голосовых помощников.

Почему языковая поддержка имеет значение

Беглый взгляд на отзывы об этих флагманских продуктах, как профессиональные, так и отзывы пользователей, точно показывает, что является наиболее важным отличием при покупке.

Помимо чистой лояльности к бренду, потребители повсеместно утверждают, что их реакция на конкретный продукт для умного дома проистекает из скорости и точности его понимания их речи, а также натурализма голоса, который он использует для ответа.

На разных языках, диалектах и ​​акцентах потребители хотят, чтобы голосовой помощник понимал их и говорил с ними понятно.

Компании, которые продолжают активно инвестировать в развитие широкой языковой и акцентной поддержки, будут продвигаться вперед в умах потребителей, укрепляя свое место в качестве основы будущего умного дома.

Как только это будет сделано, новым претендентам будет гораздо труднее выйти на рынок без этой огромной базы лингвистической информации.

Языковая поддержка Amazon Alexa

Amazon представила миру Alexa и Echo в 2014 году, положив начало эпохе умных динамиков.

Какие языки поддерживает Alexa?

По состоянию на апрель 2021 года Amazon Alexa поддерживает 8 языков:

  • Английский
  • французский
  • немецкий
  • Хинди
  • итальянский
  • японский
  • Португальский (бразильский)
  • Испанский

Какие диалекты поддерживает Alexa?

Alexa поддерживает различные диалекты английского, французского и испанского языков:

  • диалекты английского языка (5): Австралия, Канада, Индия, Великобритания, США
  • французских диалекта (2): Канада и Франция
  • испанских диалекта (3): Испания, Мексика, США

Алекса Взгляд на будущее

Такое разнообразие языков составляет огромную долю текущего рынка интеллектуальных устройств, но также оставляет значительные возможности для расширения в будущем.

Затем Amazon объявила о выпуске второго поколения своих наушников Echo Buds, которые обеспечивают доступ без помощи рук к голосовому помощнику Amazon Alexa.

Alexa Conversations — это еще один новый подход к управлению диалогами, основанный на искусственном интеллекте, который позволяет вам создавать навыки, с которыми клиенты могут взаимодействовать естественным и менее ограниченным образом — используя фразы, которые они предпочитают, в том порядке, в котором они предпочитают.

Функция Alexa Conversations доступна в языковом стандарте en_US, хотя можно предположить, что в будущем это станет масштабной областью роста.

Языковая поддержка Google Assistant

Assistant первоначально дебютировал в мае 2016 года как часть приложения Google для обмена сообщениями Allo и его голосового динамика Google Assistant.

Какие языки поддерживает Google Assistant?

По данным службы поддержки Google, по состоянию на апрель 2021 года устройство Google Assistant поддерживало следующие языки:

  • Датский
  • голландский
  • Английский
  • французский
  • немецкий
  • Хинди
  • итальянский
  • японский
  • Корейский
  • Норвежский
  • Испанский
  • Шведский

Какие диалекты поддерживает Google Assistant?

Google Assistant поддерживает различные диалекты английского, французского, испанского и немецкого языков:

  • диалектов английского языка (6): Австралия, Канада, Индия, Сингапур, Великобритания, США
  • французских диалекта (2): Канада и Франция
  • испанских диалекта (3): Мексика, Испания, США
  • немецких диалекта (2): Австрия, Германия

Google Ассистент Перспективы будущего

С добавлением примерно 20 новых языков в январе 2019 года, а совсем недавно — нескольких индийских языков, Google Ассистент закрепил свое лидерство в конкурентной борьбе с более чем 40 языками в более чем 80 странах. Это больше, чем восемь языков и 14 стран в 2017 году9.0003

Не только дополнительные языки будут приоритетом, но и разработка более разговорного ИИ, который читает контекст и тон, также будет в центре внимания Google.

Вы даже можете выучить новый язык с помощью Google Assistant благодаря партнерству с My Berlitz Coach, основанном на широко используемом методе Berlitz. Просто скажите «Эй, Google, поговори с моим тренером Berlitz», и вам будут представлены различные сценарии, такие как заказ напитка в самолете или разговор с дружелюбным незнакомцем, чтобы помочь выучить выбранный вами язык.

Языковая поддержка Apple HomePod и Siri

Apple HomePod был выпущен в начале 2018 года, и с тех пор его производство было прекращено в пользу новой мини-версии. Однако технология голосового помощника Siri продолжает развиваться.

Какие языки поддерживает Siri?

По состоянию на апрель 2021 года голосовой помощник Siri от Apple поддерживает 21 язык:

  • Арабский
  • Кантонский
  • Датский
  • голландский
  • Финский
  • Английский
  • французский
  • немецкий
  • Иврит
  • итальянский
  • японский
  • Корейский
  • Малайский
  • Мандарин
  • Норвежский
  • Португальский (Бразилия)
  • Русский
  • Испанский
  • Шведский
  • тайский
  • Турецкий

Он также поддерживает множество диалектов китайского, голландского, английского, французского, немецкого, итальянского и испанского языков.

Обзор будущего Siri и HomePod

В 2020 году Apple объявила, что iOS 14 предлагает перевод в реальном времени на 11 языков даже в автономном режиме. Третий по распространенности язык в мире, хинди, не был одним из них, поэтому явно есть над чем поработать.

Однако это не касается оригинального HomePod. После трех лет на рынке Apple прекратила выпуск оригинального HomePod с 12 марта 2021 года и сосредоточит свои усилия на меньшем и более дешевом HomePod mini, выпущенном в ноябре 2020 года.

Почему так сложно обучать голосовых помощников новому языку?

Явное лидерство Siri в языковой поддержке привело к успеху на рынках, которые конкуренты Apple просто не могут достать, но Google идет в хвосте у Apple.

Между тем, Business Insider в 2017 году считал, что относительное отсутствие языковых опций Alexa «значительно ограничивает ее глобальный охват», однако с тех пор они добились больших успехов в добавлении языков.

Поскольку язык так явно лежит в основе борьбы за доминирование в гостиной, возникает вопрос, почему все больше компаний не развивают более широкие и надежные языковые способности.

Оказывается, самый четкий ответ на самом деле пришел в 2017 году от самого Google.

Автоматическое распознавание речи и понимание естественного языка

В течение многих лет Google разрабатывала базовые базы данных для расширенной языковой поддержки, во многом благодаря фоновому сбору данных, осуществляемому его флагманским поисковым продуктом.

Вот почему Google вполне может опередить огромное лидерство Apple: она уже проделала огромную работу по созданию огромного резерва из более чем 115 языков, способных к автоматическому распознаванию речи (ASR) через Google Assistant.

С этой возможностью локализация Google Home часто может выполняться вдвое меньше, чем обычно, поскольку голосовому помощнику нужно только понять намерение, стоящее за расшифрованным предложением.

Эта способность называется пониманием естественного языка, или NLU, и это то, что позволяет расширить поддержку британского английского языка на Канаду без особых проблем.

Однако

NLU — это место, где действительно обнаруживается намерение, стоящее за высказыванием; речевые данные должны быть специфичными для местного употребления слов, грамматики и разговорных выражений. Точная транскрипция и аннотация необходимы для создания хорошо работающего продукта.

Даже искусственный интеллект-помощник, который может точно слышать и транскрибировать слова, должен пройти трудоемкий процесс локализации NLU, то есть испанский язык может быть испанским в Испании, Мексике и Соединенных Штатах, но каждый диалект также требует отдельного языкового языка. модель.

Добавление дополнительных языков требует данных и исследований

Адаптация голосовых помощников для включения большего количества языков включает в себя все: от демографических исследований до сбора речевых данных и аннотаций, а также тестирования технологии на нескольких языках.

Крайне важно на каждом этапе этого процесса получать высококачественные данные и гарантировать, что голосовой помощник будет хорошо работать на новых рынках. Например, чтобы понять носителей определенного диалекта, разработчики речи должны иметь тысячи образцов речи носителей этого конкретного диалекта.

Исследование должно быть направлено и на голос самого голосового помощника. Собственное исследование Summa Linguae показывает, что, хотя определенные атрибуты, такие как предпочтение пола голосового помощника, в основном зависят от пользователя, они также показывают демографические различия между рынками. Например, мужской голос может лучше звучать в тех местах, где требуется более авторитарное звучание.

Чтобы узнать больше, ознакомьтесь с нашим постом о локализации голосовых технологий и носимых устройств.

Взгляд в будущее

Рынок голосовых помощников будет продолжать расти, и к 2025 году его стоимость превысит текущую стоимость в семь раз. Это означает, что даже мегакорпорации не могут рассчитывать на то, что они будут единственными, кто будет контролировать рынок.

Новым претендентам, безусловно, предстоит тяжелая битва, чтобы догнать существующие возможности голосовых помощников, таких как Home, Siri и Alexa, но технологические стартапы уже несколько раз шокировали мир невероятными достижениями.

Alibaba уже делает шаги на китайском рынке, например, в то время как на Западе проект AI Voice Assistant с открытым исходным кодом имеет реальный потенциал для дестабилизации поставщиков услуг, которые становятся слишком самодовольными.

Lenovo разработала планшет со встроенной Alexa, укрепив партнерство между этими двумя компаниями. Кроме того, Microsoft приобрела компанию Nuance, занимающуюся технологиями искусственного интеллекта, за 19,7 млрд долларов, что стало их вторым по величине приобретением с момента покупки LinkedIn.

Таким образом, в конце концов, раннее доминирование на этом развивающемся рынке, вероятно, станет ключом к долгосрочному успеху, и этот ранний импульс будет возникать в основном из репутации легкого, естественного взаимодействия.

Все начинается со сбора речевых данных

Если вам нужны высококачественные речевые данные для решения по распознаванию голоса в вашей компании, лучше всего начать с Summa Linguae Technologies.

Точно так же мы собираем речевые данные и голосовые команды из любой страны на любом языке, диалекте или неродном акценте.

Чтобы начать работу, узнайте больше о наших решениях для обработки данных или расскажите нам о своем проекте.

Русский Голосовой помощник — Введите пароль от Encounter Studios | Трек звуковых эффектов без лицензионных отчислений

Русский Голосовой помощник — Введите пароль от Encounter Studios | Трек со звуковыми эффектами без лицензионных отчислений — Artlist.io

Общая коллекция владельца —

Новая коллекция

Добавить в мою коллекцию

Сортировка по выбору персонала

  • Сортировка по выбору персонала
  • Top Downloads
  • Newest

Vocal & Instruments

  • Vocal & Instruments
  • Vocal
  • Instrumental
  • Female Vocal
  • Male Vocal
  • More
    • Duet
    • Group
    • Acapella

So вы имеете в виду очень конкретную песню. ..

Попробуйте изменить комбинацию тегов или сообщите нам, что вы ищете
, чтобы мы могли сделать Artlist еще лучше для вас.

Свяжитесь с нами

Хотите вдохновения?

Слушайте новую музыку, которую мы любим.

Go to Spotlight

Albums

Library

My

Collections