Google научился распознавать изображения и голосовые команды
14 июня 2011 года

Компания Google представила во вторник ряд нововведений в своем поисковом сервисе - теперь в качестве поисковых запросов можно использовать голосовые команды, а также изображения.

Нововведения включают в себя три основных пункта: Google Voice Search, позволяющий браузеру Google Chrome воспринимать голосовые поисковые запросы; обновленный сервис Google Images, который сможет искать информацию, используя в качестве поискового запроса изображение; Instant Page, позволяющий ускорить работу с поисковой системой при помощи предварительной загрузки наиболее вероятных страниц, соответствующих пользовательскому запросу.

ГОЛОСОВОЙ ПОИСК

Google Voice Search был впервые представлен осенью 2009 года для смартфонов, работающих под управлением операционных систем Android, Symbian и iOS. Теперь эта функциональность доступна и пользователям веб-браузера Google Chrome для персональных компьютеров. Технология распознавания голоса в данном браузере была внедрена в апреле - в 11-ой версии.

Голосовое управление при работе с веб-сервисом предусмотрено соответствующим веб-стандартом HTML Speech Input API, разработанным Google. Тем не менее, для того, чтобы браузер смог распознать голос пользователя, необходима не только поддержка этого стандарта, но и собственно технология голосового распознавания. Решение, используемое Google в браузере Chrome, является закрытым, а потому сложно сделать прогноз, появится ли подобный функционал в других браузерах.

Google Voice Search для настольных пользователей поддерживает пока только английский язык и доступен только на англоязычной версии сервиса. Представители компании Google уточнили, что данная функция работает при помощи той же технологии, что и аналогичный продукт для мобильных пользователей, а значит, в дальнейшем будет поддерживать те же языки, включая русский.

Стоит отметить, что голосовой поиск не является единственным применением данной технологии. Так, разработчики компании Google добавили в экспериментальном режиме соответствующий функционал в сервис онлайн-переводов Google Translate. В теории голосовое управление можно использовать для осуществления любых операций с веб-сервисами, однако представители Google пока не уточняют, могут ли сторонние разработчики использовать данную технологию в своих продуктах.

ПОИСК ПО ИЗОБРАЖЕНИЯМ

Другое обновление коснулось сервиса поиска по изображениям Google Images. Если раньше этот сервис принимал текстовые запросы для поиска изображений, то теперь он научился делать обратное - искать сайты по изображениям. Таким образом, пользователь может загрузить картинку (или указать ссылку на изображение) и найти ее упоминание на различных веб-сайтах.

Распознавание фотографий стало достаточно острой темой после того, как крупнейшая в мире социальная сеть Facebook представила в июне функцию распознавания лиц на фотографиях. Данное нововведение встретило волну критики со стороны пользователей и властей, которые посчитали, что подобная технология нарушает конфиденциальность и анонимность пользователей сети. Незадолго до того, как Facebook представил эту технологию, Эрик Шмидт (Eric Schmidt), председатель совета директоров Google, публично раскритиковал ее, заявив, что компания Google никогда не станет реализовать что-либо подобное в своих сервисах.

Новая возможность сервиса Google Images базируется на экспериментальном проекте Goggles, запущенном еще в октябре 2010 года. При помощи специального приложения пользователи iPhone и Android-смартфонов могут идентифицировать изображения, полученные при помощи камеры устройства и получать дополнительную информацию об объектах, попавших в кадр. Goggles способно распознавать названия книг, альбомов, техники, а также достопримечательности, логотипы компаний, штрих-коды, QR-коды. Стоит отметить, что с 2008 года существует сервис TinEye (принадлежит канадской Idee, Inc.), имеющий аналогичный функционал.

По словам разработчиков компании Google, при помощи новой функции сервиса Google Images можно будет, к примеру, распознавать здания по их фотографиям, музыкальные альбомы по их обложкам и так далее. Однако данная технология не умеет определять лица людей, а потому с ее помощью нельзя узнать имя человека на фотографии, но если фото человека было опубликовано на открытых веб-страницах, Google Images укажет на него.

Данная функция в ближайшее время станет доступна всем пользователям сервисов Google. Пользователи браузеров Google Chrome и Mozilla Firefox смогут воспользоваться специальными расширениями, при помощи которых можно упростить процесс загрузки изображения.

"УГАДАТЬ" ЗАПРОС

Представленная технология Instant Page для веб-браузера Google Chrome является логическим продолжением Google Instant и позволяет пользователям сэкономить время при работе с поисковым сервисом Google.

Фактически, Instant Page пытается "угадать" страницу, на которую с наибольшей вероятностью перейдет пользователь поиска Google, и загружает ее в фоновом режиме. Механизм определения наиболее вероятной страницы достаточно сложен и, по словам разработчиков, учитывает около 200 различных факторов. Данное новшество позволит пользователю сэкономить от двух до пяти секунд на одном поисковом запросе.

Первое упоминание данной технологии появилось еще в девятой версии браузера Chrome в феврале. Сейчас эта функция все еще находится в экспериментальном режиме, и, по словам разработчиков, будет окончательно представлена в Google Chrome 13, который выйдет примерно через четыре недели. Пока с ней можно ознакомиться в нестабильной версии браузера. В будущем эта функция появится и у пользователей Android-смартфонов, но компания пока отказываются называть сроки.