Голосовое управление виндовс 7. Голосовое управление компьютером и телефоном — программы и сервисы

Лидером среди программ для голосового управления компьютера на русском языке является программа Горыныч 5.0. В прочем английский язык также подвластен данной программе. С помощью «Горыныча» можно задавать различные голосовые команды компьютеру: запустить программу, закрыть окно, создать новый документ, перезагрузить или выключить компьютер. Фактически голосовым управлением вы контролируете большинство процессов пользовательской работы в системе Windows без помощи клавиатуры и мышки. Голосовое управление программы позволяет набирать текст на компьютере без использования клавиатуры и мышки. Но здесь возникает несколько нюансов. Один из плюсов программы Горыныч это слушаться голоса только своих хозяинов. И для этого нужно предварительно настроить программную базу команд. Нужно самостоятельно научить своим голосом русскому языку Горыныча. С помощью микрофона вы формируете свой словарь записываемый именно вашего с голоса. Команды голосового управления компьютером могут быть пользовательские, но для набора документов приодеться приложить усилия, чтобы сделать базу богатой словарным запасом. Поэтому для голосового набора все же лучшим решением будет онлайн-серис от Google.

Полезные программы для голосового набора текста на компьютере с поддержкой русского языка.

Горынычем лучше других программ русским голосом управлять компьютером, а голосовой набор текста рекомендуется производить в онлайн-приложении Google Web Speech. Оно доступно только для браузеров Chrome. Web Speech поддерживает 32 языка (среди них даже японские и китайские иероглифы). Для того чтобы напечатать текст с помощью колоса нужен только интернет, браузер Chrome и микрофон. Русский язык программа прекрасно понимает и выдает результат целыми словами переводя устную речь в печатный текст. Сейчас уже закончились разработки платного приложения для аудио и даже видео распознании речи компьютером. Программа RealSpeaker способна распознать не только голос, но и мимику пользователя. Для ее использования подойдет обычная веб-камера с помощью, которой программа будет «читать по губам» пользователя компьютера. Такой подход повышает эффективность во голосовом управлении с помощью преобразования не только речи, но и мимики в текстовые команды. RealSpeaker уже сегодня имеет поддержку русского и еще 10 популярных языков. Программа рассчитана для платформ Windows7 / 8. После инсталляции программу следует настроить. Голову нужно держать ровно, нежелательно допускать частых потерь контакта лица с веб-камерой. Расстояние от веб-камеры желательно не превышать 40-ка см. Присутствует словарь с русским языком, который можно расширить. Но в целом, по сравнению с Горынычем, RealSpeaker более удобен для преобразования голоса в текст.

Работая над голосовым управлением компьютеров, было создано много программ.

Распознанием речи с помощью компьютера программисты-разработчики посвящали свои труды голосовому управлению еще со времен Windows 95. За это время было создано много программ для русского голосового управления компьютера и преобразования речи в текст. Среди них набрали популярность такие программы:

  • Диктограф 5;
  • Перпетуум мобиле;
  • КОМБАТ Vocative Russian ASR Engine.

Для английской речи были популярными программы:

  • MedSpeak;
  • Sakrament ASR Engine;
  • ViaVoice;
  • Voice_PE;
  • Lucent;
  • VoiceType;
  • Sakrament;
  • Voice Xpress Pro;
  • iVoice;
  • Philips FreeSpeech 98;
  • SR-TTSC.

На сегодняшний день программы лидеры в данной области:

  • Горыныч 5;
  • Web Speech;
  • RealSpeaker;
  • Dragon (только для английского языка).

Эти четыре программы выдают наиболее оптимальный результат в компьютерном преобразовании речи в команды и текст. Можно сказать, что особо выбирать нет из чего. Проблема речевого преобразования в компьютерные команды и текст является все еще актуальной. Это пока еще свободная ниша для программистов-разработчиков. Еще очень мало создано достойных продуктов в этой отрасли.

Очень скоро вся техника, от телефонов до чайников будет оснащена голосовым управлением. доступно уже давно и сейчас секретные лаборатории крупных корпораций работают над усовершенствованием этой технологии. Но уже сегодня вы можете воспользоваться этими технологиями будущего и поуправлять компьютерной техникой с помощью голоса.

Голосовое управление телефоном

Уже не первый год смартфоны на популярнейших платформах (Android, iOS, Windows Phone) имеют встроенную систему голосового управления.


Siri - одно из лучших воплощений искусственного интеллекта в современной технике. Siri - голосовой помощник встроенный в смартфоны iPhone 4S который понимает человеческую речь и может вести диалог с владельцем смартфона. Siri позволяет управлять основными функциями смартфона, создавать задачи, искать любую информацию и т.д.


Лучше меня о Siri вам расскажет видео которое я для вас подготовил. Это отрывок из презентации iPhone 4S как раз на том месте, где один из разработчиков iPhone рассказывает о Siri (если видео не видно - обновите страницу):




Сегодня в Android смартфонах голосовое управление ничуть не уступает Siri (где-то даже превосходит) и выполяет практически те же задачи.

Голосовое управление компьютером

Кроме телефона вы можете научить понимать команды и ваш компьютер. В Windows Vista и Windows 7 тоже имеется встроенная система голосового управления, только она еще не доступна в русскоязычной версии операционной системы. Для того чтобы воспользоваться например, англоязычной системой голосового управления, ваша операционная система должна быть Ultimate (Максимальная) или Enterprise (Корпоративная) и в ней должен быть установлен английский языковой пакет. Но не смотря на все эти ограничения есть другие варианты для того, чтобы начать управлять компьютером с помощью голоса.


Typle - одна из лучших программ позволяющая создавать различные голосовые команды для компьютера . Вы записываете голосовую команду и назначаете действие которое необходимо выполнить после ее произнесения. Typle вполне неплохо справляется со своими обязанностями. Правда команды придется отдавать четким, механическим голосом, чтобы программа смогла распознать их. И еще программа иногда может принять за голосовую команду посторонние звуки. Поэтому не удивляйтесь если после установки и настройки Typle на вашем компьютере начнут происходить необъяснимые события.


Голосовоеуправление.рф - облачный сервис и программа Speaker от российских разработчиков с очень хорошим распознаванием речи. Speaker намного лучше понимает человеческую речь . Еще одним плюсом программы, в отличии от Typle является то, что она начинает "слушать" команды только после нажатия командной клавиши - на данный момент это колесико мыши. Благодаря этому программа не будет выполнять команды когда это не нужно. Но по моему мнению использование колесика в качестве командной клавиши не совсем удобно, потому как оно часто используется в других случаях.


Голосовое управление в браузере Opera . Для поклонников интернет-браузера Opera есть встроенное голосовое управление позволяющее управлять основными функциями браузера голосом. В Opera нет возможности создавать свои команды, а используются уже имеющиеся команды на английском языке. Но я думаю, что мало кого заинтересует такой функционал, когда с помощью мыши и клавиатуры можно выполнить все те же действия с не меньшей скоростью.

Голосовое управление в Google

заслуживает отдельного внимания. Всем известно что Google всегда создает качественные продукты и сервисы. Многие убедились в этом начав например, пользоваться почтой Gmail . На данный момент есть две известные мне возможности голосового управления сервисами Google.


Первая - это поиск информации с помощью голоса в поисковой системе Google. Помогает намного быстрей работать с поисковой системой.


Вторая - Google переводчик , позволяющий надиктовывать текст (пока только) на английском языке и автоматически получать перевод на нужный язык.


Вполне удобно использовать голосовой ввод в Google Translate при чтении текста с учебника английского языка или например, упаковки товара, для быстрого перевода на русский язык необходимой информации.

Голосовое управление в Google Chrome

Расширение OWeb - дополняет собой уже имеющиеся функции голосового управления в Google Chrome. OWeb добавляет возможность надиктовать голосом текст практически на всех сайтах, где подразумевается ввод текста - в формах поиска, в контактных формах, в поле комментариев и т.д. Это конечно не Siri, но тоже отличный способ освободить руки и сэкономить время на набор текста.


Посмотрите видео в котором я покажу вам возможности расширения Oweb и примеры его применения:



Не хотели бы вы попробовать управлять вашим компьютером посредством голоса? Typle - это программа, которая идеально подходит для этой цели. Вы получите возможность настроить ваш компьютер полностью под себя, осуществляя управление им без использования периферийных устройств. Ограничений на количество команд в Typle нет. Работа с утилитой происходит следующим образом: вы выбираете файл, указывает, что необходимо сделать с ним и записываете голосовую команду. Когда утилита услышит голосовую команду, она незамедлительно совершит нужное действие. И не важно, эта команда должна открывать определенный сайт в браузере, воспроизводить плейлист или песню, или же запускать программу. Всё на ваше усмотрение, возможности не ограничены. Распознавание голоса в Typle реализовано на высоком уровне.

К примеру, нужно открыть ссылку в браузере. В верхнем меню выберите функцию «добавить». Перед вами появится окно, в котором необходимо будет выбрать файл или программу. Нажав кнопку «дополнительно», вы сможете выбрать сам файл, записать для него команду (к примеру «открыть хром») и сохранить. Далее стоит проверить работу команды. Нажмите «начать говорить» в программе и скажите команду. Интерфейс дружелюбный и полностью настраиваемый. Если вы забыли существующую команду, то её можно просмотреть и отредактировать в случае необходимости.

Еще несколько лет назад голосовое управление компьютером можно было увидеть только в фантастических фильмах. Теперь же достаточно скачать соответствующую программу, и вы сможете отдавать команды своему ПК без помощи клавиатуры или мыши. Конечно, подобные утилиты далеки от идеала, но есть среди них те, которые работают на должном уровне. Именно лучшим программам для голосового управления компьютером и посвящена данная статья.

Штатное средство Windows

Не все знают, но система распознавания речи является штатным приложением Windows. Голосовое управление компьютером в данной операционной системе запрятано в настройках звука и, к сожалению, не поддерживает команды на русском языке. Тем не менее упомянуть о нем стоит, ведь это пригодится тем, кто живет, к примеру, в европейских странах.

Итак, чтобы включить распознавание речи:

  • Подключите микрофон к компьютеру и настройте его, следуя подсказкам.
  • Откройте «Панель управления». Выберите режим отображения «Мелкие значки».
  • Зайдите в раздел «Распознавание речи».

После этого откроется «Мастер настройки», выполняя указания которого, вы научите свой компьютер понимать ваш голос. Правда, штатное приложение умеет выполнять только примитивные команды, так что не стоит сильно на него надеяться.

Cortana

Несколько лучше, нежели в предыдущем случае, ситуация обстоит в Windows 10. Голосовое управление компьютером представлено здесь программой Cortana, которая не только открывает по команде нужные вам приложения, ищет информацию в интернете и отправляет письма, но еще и запросто рассказывает свежие анекдоты.

Опять же, Cortana пока что не понимает русский язык. Разработчики уже больше двух лет обещают научить ее распознавать великий и могучий, но пока что в этом нет никакого прогресса. Тем не менее вы всегда можете поменять язык операционной системы на английский (или любой другой, поддерживаемый «Кортаной») и таким образом включить приложение.

Speechka

Ну, а теперь, наконец-то, настала очередь программы, позволяющей осуществлять русское голосовое управление компьютером. Называется она Speechka и примечательна своей простотой использования. Запустив приложение, вы сможете выбирать в нем те или иные действия и привязывать к ним соответствующие Так, утилита умеет открывать страницы в интернете, запускать другие программы, а также открывать определенные файлы и папки.

К сожалению, функционал Speechka, как вы наверняка заметили, несколько ограничен. Тем не менее для простых операций данное приложение подходит идеально.

Typle

А эта утилита для голосового управления компьютером обладает уже куда большим набором функций. Вернее, функции у него почти те же, что и у Speechka, но пользоваться ими в разы удобнее. Например, вы можете задать основную команду «Открыть», а затем привязать к ней названия нужных вам программ или интернет-сайтов. Поначалу интерфейс Typle покажется вам слегка запутанным, но разобраться в нем не так уж и сложно.

Минусом приложения является то, что оно больше не поддерживается разработчиками. Кроме того, программа иногда некорректно распознает русскую речь, так что желательно «общаться» с ней монотонным голосом.

Laitis

Данное приложение для голосового управления компьютером хорошо тем, что в нем есть довольно большой список уже готовых команд. Проще говоря, вам не нужно вручную делать записи для открытия той или иной программы. К примеру, Laitis умеет заходить на сайт «ВКонтакте», открывать Google Chrome, запускать Skype и многое другое.

Интерфейс программы удобный. Все функции разделены на категории, так что вы в них не запутаетесь. Также при необходимости можно редактировать уже записанные команды, если они вас чем-то не устраивают.

Также стоит отметить, что разработчики активно выпускают обновления для своего детища. В каждом новом апдейте добавляются дополнительные функции, которые делают использование программы еще более удобным.

"Горыныч"

Нет, это не сказочный злодей, а очередная программа для голосового управления компьютером. К тому же, приложение сделано отечественными разработчиками, так что русский язык оно распознает на ура. При этом «Горыныч» постепенно приспосабливается к тембру вашего голоса, так что с каждым днем вам будет все проще использовать данную утилиту.

Но есть и ложка дегтя. К сожалению, в программе нет никаких предустановленных команд. То есть вам придется самостоятельно делать все записи, а в том случае, если их много, это занятие может растянуться на несколько дней.

Speaker

Простенькое, но очень приятное в использовании приложение. После его установки запустится небольшой курс обучения, в ходе которого вы, следуя подсказкам, научитесь создавать голосовые команды. Speaker, как и его конкуренты, умеет открывать файлы, запускать программы, фильмы, музыку, а также выключать и перезагружать компьютер.

К сожалению, разработчики больше не выпускают обновления для утилиты, поэтому ее работоспособность на новых версиях Windows (старше «семерки») не гарантируется. Но даже несмотря на вполне подойдет любому среднестатистическому пользователю.

"Алиса"

Разработкой данного приложения занимается небезызвестная компания «Яндекс». Уже сейчас «Алиса» запросто подскажет вам точное время, поделится свежими новостями, включит музыку и так далее. К тому же, программа встраивается в интерфейс операционной системы, что облегчает работу с ней.

Минусы у приложения, конечно же, тоже есть. Например, вы можете пользоваться только предустановленными командами, а добавлять новые пока что нельзя. Также программа находится на относительно ранней стадии разработки, так что иногда в ней проявляются всевозможные баги. Однако разработчики активно исправляют все ошибки, а также постоянно снабжают утилиту новыми функциями.

Возможности голосового управления в операционной системе Android присутствуют очень давно. Еще в версии 2.3 Gingerbread (2010 год) пользователи могли совершать поисковые запросы или какие-либо функциональные действия с помощью голоса. Только тогда это выглядело очень странно и работало аналогично. Что теперь представляет из себя голосовое управление Android и какие функции оно может предложить миллионам пользователей? Ответы на все вопросы вы найдете в этой статье.

Голосовой поиск

Голосовой поиск представляет собой возможность искать информацию в интернете, используя голосовые команды, а не традиционные текстовые запросы. Он может использоваться на компьютере в браузере Chrome, а также на смартфоне и планшете с Android в приложении Google. Запуск системы доступен в виде двух способов - с помощью команды Ok Google или по нажатию на логотип микрофона.

Современный голосовой поиск стал одной из основ операционной системы Android. Сейчас он совместим с десятками продуктов и приложений компании. Google делает большой акцент на возможности искать любую информацию в интернете, просто произнеся желаемый запрос голосом. Сегодня, 7 лет спустя, голосовой поиск Google умеет практически все и может полностью удовлетворить рядового пользователя ОС.

  • Справка.
  • Люди.
  • Время и календарь.
  • Погода.
  • Рынки и биржи.
  • Конвертация и калькулятор.
  • Навигация.
  • Звонки и SMS.
  • Словарь и перевод.
  • Контроль.
Функциональность каждой из этих команд мы разберем далее.

Справка

Поиск Google предоставляет широкую справочную информацию практически на любой вид запроса, основываясь на семантическом поиске и системе машинного обучения RankBrain. Столица страны, создатель известной архитектуры, автор популярной картины, высоты величайших башен и гор мира, статусы авиарейсов и посылок, время рассвета и заката, глубины рек и озер и так далее. Список можно очень долго продолжать - в действительности он велик. Вкратце - если нужно быстро узнать что-то или о ком-то, то голосовой поиск Google всегда выручит.

Примеры:

  1. Столица Великобритании.
  2. Высота Шанхайской башни.
  3. Кто придумал Android.
  4. Длина Титаника.
  5. Калорийность грецких орехов.

Люди

Поисковая система Google поможет найти известного человека в сети и всю доступную информацию о нем. Основные данные берутся из популярных источников - социальных сетей или страниц в Википедии. Пользователь может узнать самые различные факты об искомой личности: настоящие ФИО, где и кем работает, место и даты рождения и смерти, наличие брака, кто родители, имеются ли дети, номинации, какое образование. Вдобавок ко всему приложение показывает связанные запросы. Они основываются на деятельности человека и сортируются по категориям: музыканты, писатели, блогеры, президенты и так далее.

Примеры:

  1. Девушка Супермена.
  2. Где умер Ленин.
  3. Кто нарисовал Крик.
  4. Сколько лет Дональду Трампу.
  5. Кто такой Павел Дуров.

Время и календарь

Поиск Google синхронизирован с календарем, поэтому при тематическом запросе может выдать результаты, связанные с планируемыми встречами или заметками. Также прямо внутри приложения одним голосом можно установить будильник, таймер, добавить встречу, напомнить купить хлеб или попросить разбудить завтра в 9 утра. Вариантов работы со временем и календарем в поиске много - от типичных запросов про время восхода солнца до установки полноценных напоминаний.

Примеры:

  1. Во сколько восход в Тольятти.
  2. Какой часовой пояс в Нью-Йорке.
  3. Разбуди меня завтра в 11 утра.
  4. Установить таймер на 5 минут.
  5. Добавить встречу/напоминание.

Погода

Один из наиболее часто используемых запросов в голосовом поиске Google - информация про погоду. Помимо стандартных команд для открытия погодных данных на текущий день или неделю, пользователь может узнать погоду в любой точке мира - в соседнем городе или в стране на другом конце планеты. Также примечательно, что поиск Google понимает различные запросы относительно погоды - например, что с погодой или будет ли сегодня дождь.

Примеры:

  1. Что с погодой.
  2. Будет ли сегодня дождь.
  3. Погода в Киеве.
  4. Скорость ветра.
  5. Какие осадки завтра.

Рынки и биржи

С помощью голосового поиска Google можно мгновенно узнать текущую стоимость ценных бумаг или актуальный курс валют. В системе представлено большое количество международных корпораций, котировки акций которых обновляются каждую секунду. Помимо технологических гигантов Microsoft, Apple, Google, Samsung, Nokia, LG, Lenovo и других, присутствуют и компании из других областей: Газпром, Сбербанк, Яндекс, Вымпелком, Аэрофлот и прочие. Можно просматривать не только цены акций, но и другие важные векторы развития: рыночную капитализацию, прибыльность или дивидендный доход.

Примеры:

  1. Цена акций Nokia.
  2. Сколько стоит доллар.
  3. Курс биткоина к рублю.
  4. Капитализация Сбербанка.
  5. Индекс Dow Jones.

Конвертация и калькулятор

Поисковая система Google поддерживает различные математические операции - сложение, вычитание, умножение, деление, корень и проценты. Таким образом, вы можете выполнять не только простейшие расчеты, но и узнавать корни и проценты из сложных чисел. Также прямо внутри приложения можно конвертировать валюты - считать количество рублей в долларе, долларов в рубле, евро в рубле или долларов в евро. Функция удобна своей скоростью - стоит только сказать команду, как за считанные секунды на экране появится результат. Нет необходимости искать в дебрях меню приложение калькулятора и делать все самостоятельно, тратя лишнее время.

Примеры:

  1. Сколько в километре сантиметров.
  2. 850 рублей в тенге.
  3. Квадратный корень из 200.
  4. 10 186 поделить на 4.
  5. 30% от 35 000.

Навигация

С помощью голосовых команд через поиск Google можно полноценно ориентироваться по местности и даже больше того. Прокладывание маршрутов от точки до точки (пешком, на машине или общественном транспорте), показ близлежащих общественных заведений, а также просмотр карт городов и поиск достопримечательностей - все это доступно для поиска посредством голосовых команд.

Примеры:

  1. Карта Белгорода.
  2. Маршрут до Кремля (можно добавить «пешком» или «на машине»).
  3. Где находится Монгора.
  4. Кафе поблизости.
  5. Ближайшая аптека.

Звонки и SMS

Было бы странно, если через голосовой поиск Google нельзя было бы звонить или отправлять текстовые сообщения. Это одни из самых часто используемых функций в телефоне, поэтому без упрощенного доступа к ним обойтись нельзя. Поисковый гигант это понимает, поэтому посредством специальных голосовых команд через поиск Google можно быстро позвонить или написать сообщение - без рук, только голосом. То же самое касается и электронных писем через Gmail. Это будет удобно в ситуации, когда руки заняты или используется гарнитура.

Примеры:

  1. Позвонить сестре.
  2. Позвонить в ближайшую пиццерию.
  3. Написать Саше «Я уже в офисе».
  4. Написать Насте «Встретимся у метро».
  5. Отправить письмо.

Словарь и перевод

В поисковую систему Google встроен фирменный сервис перевода компании. Вы можете переводить слова или целые фразы на все доступные в Google Переводчике языки просто произнеся соответствующую голосовую команду. Помимо переводчика, в приложении присутствует поддержка словаря - поиск слов и их значений еще никогда не был таким легким.

Примеры:

  1. Что такое человеконенавистничество.
  2. Определение композиции.
  3. Как переводится Believe.
  4. Как будет автобус на испанском.
  5. Перевод с русского на турецкий.

Контроль

Помимо всего вышеперечисленного, голосовой поиск Google позволяет контролировать отдельные настройки операционной системы и вместе с этим запускать установленные приложения. По умолчанию поддерживается немного функций (Wi-Fi, Bluetooth, фонарик, яркость), но на деле их вполне достаточно. Вы можете без лишних движений менять яркость экрана, включать или отключать Wi-Fi и Bluetooth, активировать фонарик или даже управлять аудиоплеером. Все это работает, и причем отлично - благодаря запрограммированным голосовым командам.

Примеры:

  1. Открыть сайт.
  2. Открыть Instagram (или любое другое приложение).
  3. Увеличить яркость.
  4. Понизить громкость.
  5. Сделать фото/видео.
  6. Включить Wi-Fi.
  7. Выключить фонарик.
  8. Показать мои будильники.
  9. Включить Linkin Park.
  10. Следующая песня (для плеера).

Voice Access

В Android также присутствуют функции для людей с ограниченными возможностями. Помимо TalkBack (озвучивание происходящего на экране), существует еще один сервис с дополнительной функциональностью. Он называется Voice Access и позволяет активировать управление голосовыми командами в масштабе всей системы. Приложение является экспериментальным и было выпущено в 2016 году. В настоящее время Voice Access по-прежнему в бета-версии, но это не мешает помощнику стабильно выполнять свои функции.

В основе Voice Access лежат те же технологии, которые Google использует для голосового поиска. При активации сервиса каждому элементу на экране присваивается определенный номер. Он служит командой для запуска приложений или работы с той или иной функцией. Никакого физического взаимодействия при этом не требуется - стоит лишь назвать цифру элемента, который необходимо открыть.

На этом функциональность Voice Access не заканчивается. Также с помощью этого приложения голосовые команды становятся доступными в пределах всей операционной системы. Например, среди прочих команд поддерживаются такие, как «открой браузер», «перейди на домашнюю страницу» или «пролистай вниз». Голосом заменяется все - основные функции, навигация, жесты (нажатие, пролистывание, действие назад) и работа с текстом (ввод, редактирование, форматирование).

Несмотря на статус бета-версии, приложение Voice Access выводит голосовое управление в Android на вершину возможностей. Совместно с поиском Google это два лучших голосовых помощника, предлагающих еще более простое взаимодействие с устройством.

  • Сергей Савенков

    какой то “куцый” обзор… как будто спешили куда то