Голосовое управление андроид, полное руководство

Корпорация Google начинала свою деятельность как поисковик, и на данный момент поиск информации с помощью мобильных устройств так и остается одним из главных направлений развития. С каждым обновлением системы телефона/планшета, Google Play Services и отдельных программ появляется все больше новых функций, призванных облегчить жизнь пользователю. В этой статье я расскажу о наиболее полезных голосовых командах, контекстном поиске Now on Tap, а также покажу, как настроить телефон для выполнения любых голосовых команд, в том числе с помощью Tasker. Ведь именно об этом мы так мечтали, читая произведения фантастов в детстве.

Традиционно все новейшие разработки от «корпорации добра» внедряются на устройствах линейки Nexus. Так было и с голосовым управлением, и с Google Now, системой подачи информации в виде набора кaрточек. За Google Now, простой поиск Google и голосовой поиск отвечает одно приложение, это Google. Оно входит в комплект стандартных приложений от компании Google и доступно на любом сертифицированном Android-смартфоне.

Ранее голосовое управление активировалось только при нажатии на значок микрофона при открытой программе поиска (или на виджеты на рабочем столе). Затем появился лаунчер Google Старт, который позволил выполнять голосовые команды прямо с рабочего стола (с помощью фразы «Ok, Google»). Начиная с Android 4.4 та же возможность стала доступна и в других лаунчерах, но только при условии, что лаунчер явно поддерживает такую возможность (почти все популярные лаунчеры поддерживают).

Также существует несколько смартфонов с продвинутой функцией голосового управления, активируемoй, даже если экран смартфона выключен. Например, MOTO X содержит отдельный процессор с очень низким энергопотреблением, который только и занимается, что в фоновом режиме слушает все окружающие звуки на предмет ключевой фразы.

голосовое управление

Виджет поиска на рабочем столе

Настройки голосового поиска

Настройки голосового поиска

Голосовое управление

Простой поиск информации, конечно же, самая главная функция Google Now. Причем он достаточно интеллектуален, чтобы понимать контекст, а значит, команды можно объединять в цепочки. Например, если сказать: «О’кей, Google, кто президент Никарагуа?», то поиск выдаст ответ «Даниэль Ортега». А если далее спросить «Сколько ему лет?», то ответ будет «Семьдесят лет». Google Now понимает массу команд, приведу десять наиболее полезных.

  • Карты и навигация — «поехали/навигация #названиеулицы #номердома». Запустит Google Maps в режиме навигатора по указанному адресу. Также можно указывать город, магазин, организацию и так далее.
  • Калькулятор — «тринадцать процентов от пяти тысяч». Выдаст ответ и форму калькулятора в окне поиска. Голосом можно надиктовывать сложение, вычитание, умножениe, деление, корень числа. Также можно переводить меры весов, длин и прочего.
  • Отправка СМС/сообщений — «написать смс Олег текст я за рулем, перезвоню позже». Отправлять сообщения также можно через WhatsApp, Viber и еще несколько популярных мессенджеров. По упрощенной схеме можно диктовать «сообщение #программа #контакт #текст». Например: «сообщение WhatsApp Олег я за рулем». После этого также голосом можно подтвердить отправку командой «отправить».
  • Набор номера — «позвонить маме». Также можно продиктовать произвольный номер, которого нет в записной книге. При команде «позвонить сестре/брату» можно указать номер из контактов (если записано по-другому), тогда в следующий раз набор будет проходить автоматически.
  • Напоминания и будильники — «разбудить меня в субботу в восемь утра» или «напомнить мне выключить плиту через десять минут». Также можно добавлять мероприятия в Google-календарь. События можно привязывать не только ко времени, но и к месту. Если добавить «напомни мне распечатать текст на работе», то при включенной геолокации и указанном адресе работы (места на карте) напоминание на телефоне всплывет автоматически. Обычный встроенный в приложение «Часы» таймер заводится так же легко.
  • Угадай мелодию — «что это за песня». Запустит раcпознавание играющей музыки.
  • Музыка/видео — «слушать (музыку) #группа #песня». Запустит указанную музыку в Play Music или клип на YouTube. Нормально работает с русскими названиями, но так как английские слова и исполнителей определяет, иногда неправильно интерпретируя под русский язык, то срабатывает не всегда.
  • Фото/видео — «сделай фото / записать видео». Запустит камеру в выбранном режиме.
  • Управление настройками — «выключи вайфай», «включи фонарик».
  • Заметки — «заметка для себя тестовый пароль для сервиса один два три четыре». Добавит заметку в Google Keep.

Now on Tap

Описанию этого сервиса было уделено отдельное пристальное внимание на презентации Android 6.0 Marshmallow. И преподносился он как одна из основных особенностей новой прошивки. Но более-менее нормальную функциональность в России мы получили только в декабре. В официальном русском переводе он называется контекст от Now.

[ad name=»Responbl»]

Как это работает? «Когда вы запускаете контекст от Now, Google анализирует все, что вы видите на экране, и ищет информацию в соответствии с этими данными» — вот официальное описание со страницы поддержки. На деле это значит, что вместо того, чтобы выделять и копировать интересующие фразы на экране, затем открывать поиск и вставлять фразу, можно просто нажать и удерживать кнопку «Домой». После этого Google предложит варианты для найденных ключевых фраз. Это могут быть картинки, видео, предложение открыть это место на картах, новости. Может предложить открыть сайт организации или сделать звонок, открыть профиль Facebook или посмотреть Twitter-аккаунт знаменитостей, добавить заметку. При наличии соответствующих приложений на устройстве после тапа на иконке страница откроется сразу внутри приложения. При прослушивании музыки из разных приложений можно одним нажатием вызвать подробную информацию об исполнителях, альбомах, клипах на YouTube и прочем.

Работа Now on Tap на примере «ВКонтакте»

Работа Now on Tap на примере «ВКонтакте»

Пасхалки в поиске Google

Так же как и в десктопной версии поиска, в голосовом поиске есть пасхалки. Приведу только несколько команд, остальные можешь узнать по этой ссылке. К сожалению, почти все они срабатывают только на английском языке и с английским интерфейсом или при выбранном в настройках только английском языке.

«Do a barrel roll».
«Make me a sandwich!»
«Sudo make me a sandwich!»
«When am I?»
«Beam me up, Scotty!»
«Up up down down left right left right».
«What does the fox say?»

Tasker

Если после всего прочитанного тебе все равно не хватает команд для воплощения своих фантазий, то, имея немного времени, можно настроить Google Now на выполнение практически любых команд. Для этого нам понадобятся прежде всего Tasker и плагин AutoVoice.

С помощью Таскера можно совершать множество действий: запускать приложения, контролировать звук, запускать скрипты, управлять экраном, проводить манипуляции над файлами, нажимать кнопки на экране, управлять media, делать запросы HTTP Get и Post и реагировать на них, управлять расширенными настройками телефона. И все это можно делать, отдавая голосовые команды. А с помощью множества плагинов функциональность расширяется еще больше.

[ad name=»Responbl»]

Для начала работы необходимо включить пункт Google Now Integration внутри AutoVoice. В Таскере необходимо создать отдельный профиль для каждой команды или группы команд. Как обычно, для составления профилей рекомендую в настройках Таскера включать английский. Для тестового профиля составим голосовую команду выключения звука. Для этого создадим новый профиль с параметрами Event → Plugin → AutoVoice Recognized. Заполняем следующие поля:

  • Command Filter — тут вводим необходимую голосовую команду, в нашем примере: «выключи звук». Если нажать на строку Speak Filter, то команду можно надиктовать.
  • Exact Command — если поставить галочку, то будет срабатывать только на точную команду, иначе может сработать на каждое отдельное слово или форму слова.
  • Use Regex — использовать регулярные выражения. Позволяет настроить распознавание нескольких слов в одном профиле. Если в первом поле ввести «(выключи|выключить) (звук|громкость)» без кавычек, то профиль будет срабатывать на команды «выключи звук», «выключи громкость», «выключить звук» и «выключить громкость».

Для действия используем Audio → Ringer Volume и Audio → Notification Volume. Для контроля срабатывания можно добавить всплывающее уведомление через Alert → Flash и в поле Text ввести «Выключил».

Команды «выключи вайфай» работают сразу в Google Now, а «выключи звук» предлагает открыть настройки. И после перехвата команды через Таскер и ее выполнения все равно остается на текущем экране с запросом. Поэтому к действиям дополнительно добавим App → Go Home. Ну а чтобы позабавить друзей, во всех профилях для управления голосом можно первым действием поставить Alert → Say и ввести фразу «слушаюсь, хозяин». Тогда телефон в ответ на команды будет реагировать голосом.

Настройка профиля

Настройка профиля

Настройка действий

Настройка действий

С помощью дополнительных плагинов, например AutoRemote, можно управлять другими устройствами на Android. А если на комп поставить EventGhost, то с помощью многочисленных плагинов можно сделать немало интересного. Одним из самых полезных применений будет настройка умного дома, но это отдельная большая история. У Жуана Диаса (Joao Dias), разработчика всех Auto*-плагинов, есть также дополнение и для компа, что позволяет интегрировать управление мобильными устройствами через голосовой помощник Cortana на десктопе.

Немного хитростей

Таскер — это хардкор. Можно творить потрясающие вещи, но для этого нужно освоить много информации, разбираться в переменных, регулярных выражениях и прочем. Для тех, кто не хочет возиться с Таскером, есть большое количество программ, которые используют возможности голосового управления, но имеют более понятный и доступный интерфейс и просты в обращении. Остановлюсь на трех.

Open Mic+ for Google Now

Программа позволяет изменить ключевую фразу с «Ok, Google» на любую другую. К сожалению, после одного из обновлений сервисов и запроса от Google перестала работать с Google Engine, оставив только PocketSphinx. В связи с этим для ключевой фразы подходят только английские словосочетания, но раньше можно было удивлять присутствующих обращением к телефону «эй, ты» или «слушай команду».

Тем не менее разработчик обещает все поправить в следующих обновлениях. Из других функций можно отметить запуск распознавания по датчику приближения (два взмаха руки) и по встряске телефона. Как и MOTO X, поддерживает распознавание при выключенном экране, но, к сожалению, это очень сильно отражается на батарее, поэтому актуально для телефона на зарядке или автомобильных медиацентров на Android с постоянным питанием. Работает с Bluetooth-гарнитурой, имеет интеграцию с Таскером, может зачитывать текстовые сообщения.

Open Mic+ for Google Now

Open Mic+ for Google Now

Commandr for Google Now

Еще одна программа от разработчика Open Mic+. Интегрируется с Google Now и позволяет использовать расширенный набор команд. В списке поддерживаемых есть следующие: включить/выключить беспроводную точку доступа, приостановить/возобновить музыку, следующая/предыдущая песня, непрочитанные СМС/gmail (озвучит их голосом), громкость <х>, блокировка телефона, сделать снимок, сделать селфи. Также можно включить диктофон, управлять подсветкой, автоповоротом экрана. С рутом можно выключить/перезагрузить телефон, очистить уведомления, включить режим «В самолете». Для поддерживаемых функций можно менять команды на свои. Также имеет интеграцию с Таскером, позволяя включить для каждой задачи срабатывание по названию Task. Есть модуль для Xposed, позволяющий использовать Commandr с Android Wear.

Commandr for Google Now

Commandr for Google Now

Ассистент Дуся

Ну и наконец, детище российских разработчиков — русскоязычный голосовой ассистент Дуся, который объединяет в себе все преимущества описанных приложений и утилит. Как и Tasker, Дуся позволяет создавать свои голосовые функции (они называются «скрипты»), причем в намного более понятной и простой форме (есть справка на русском, видеоуроки) и с более мощными функциями работы именно с речевыми командами. Вдобавок здесь есть и свой онлайн-каталог готовых скриптов, созданных другими пользователями. На момент написания статьи их было около ста.

Так же как и Commandr, Дуся умеет интегрироваться с Google Now, а также имеет множество видов других бесконтактных активаций — встряхиванием, взмахом, гарнитурой, поднесением к уху и в том числе и своей фразой активации на русском. А если хочется использовать интерфейс, то и он есть, очень простой, быстрый и функциональный. Среди функций есть 25 наиболее часто востребованных, есть даже управление умными домами и домашними кинотеатрами.

Возможности ассистента Дуся

Возможности ассистента Дуся

Выводы

Сегодня функции голосового поиска в смартфонах очень развиты, и, как ты смог убедиться, разработчики предлагают нам не просто набор команд для поиска информации, а полноценную систему управления смартфоном, которую при определенных усилиях можно интегрировать с домашним компом и даже умным домом. Так что, если тебе удобнее управлять всем этим с помощью голоса, у тебя есть для этого все необходимое.

Click to rate this post!
[Total: 24 Average: 3.6]

Специалист в области кибер-безопасности. Работал в ведущих компаниях занимающихся защитой и аналитикой компьютерных угроз. Цель данного блога - простым языком рассказать о сложных моментах защиты IT инфраструктур и сетей.

Leave a reply:

Your email address will not be published.