iOS 5: фантастика голосового управления

   Автор статьи: Марк Губарев

Несмотря на то что на мероприятии WWDC 2011 Стив Джобс ничего не рассказал о голосовых возможностях iOS 5, пристальное изучение девелоперского кода бета-сборки этой мобильной ОС выявило, что таковые будут реализованы.

Apple, как известно, давно сотрудничает с Nuance Communication, одним из ключевых игроков на рынке решений для распознавания голоса и управления устройствами при помощи речи. Но и до сегодня iOS не предлагает каких-либо расширенных возможностей по голосовому взаимодействию с пользователем — исключительно базовые команды для вызова абонентов и управления аудиовоспроизведением.

iOS 5 получит куда более серьезную голосовую площадку, притом что распознавание речи может, к примеру, вестись непосредственно с домашнего экрана или по нажатии на клавишу пробел на виртуальной клавиатуре.

Опять же в Apple в свое время вроде бы за 200 млн долларов обзавелась Siri, интеллектуальным помощником, наделяющим iPhone пвсевдоразумными функциями персонального ассистента, гида и секретаря, взаимодействие с которым осуществляется голосом на естественном языке. Так, например, достаточно вслух произнести что-то типа «Подбери-ка недалеко от дома ресторан, где я буду сегодня ужинать вдвоем. Кухня должна быть европейская, а место — романтическим», и Siri незамедлительно проведет семантический анализ фразы, разобьет ее на смысловые составляющие, сформирует правильный поисковый запрос, выдав в итоге список из подходящих мест. Определившись с выбором, легко заказать столик непосредственно в онлайне.

Аналогично Siri поможет купить билеты в кино, собраться в театр, покричать на стадионе, сходить в музей... Вообще можно заявить «Эй, а что это у нас сегодня делается?» — послушный робот соберет полную информацию о культурно-увеселительных мероприятиях города.

Что интересно, голосовые запросы Siri понимает на естественном языке, разумеется, английском. Фразы «Умираю, веки сами закрываются» и «Ой, кажется, я наклюкался» приведут к бронированию номера в отеле и вызову такси.

«Кто такой Стив Джобс?», «Сколько будет два плюс два умножить на два?», «Где все банкоматы?», «Какая нынче погода на дворе?» — за буквальными вопросами последуют не менее буквальные ответы.

Технологическая составляющая Siri опирается на технологии распознавания речи Nuance и семантического анализа, разработанные в Стэнфордском НИИ по заказу Управления перспективных исследований и разработок Министерства обороны США. За фасадом Siri кроется недюжинный алгоритм, который по праву можно назвать матерью всех композитных веб-приложений, смешивающих данные из обилия различных веб-служб. Как ожидается, за подобными решениями лежит будущее мобильного Веба.


© СОТОВИК

Новости за день

новости за 13 июня

Авторизация


Регистрация
Восстановление пароля

Наверх