В настоящее время Google способен распознать текст на изображениях, сохраненных в формате PDF. О планах Google по расширению возможностей системы не сообщается.
Поисковик уже начал индексировать PDF-файлы. Наибольшую сложность представляет поиск по старым отсканированным документам, где бумага, например, испачкана следами от чашки с кофе, либо имеются различные пометки, сделанные от руки.
Ранее Google запустил в экспериментальном режиме сервис Google Audio Indexing, распознающий звуковую дорожку в видеоклипах. Он конвертирует звук в текст и индексирует последний.
Кроме того, в начале сентября Google сообщил о планах по размещению в интернете отсканированных страниц старых газет и журналов. Они будут помещены в новостной архив поисковика и появятся в результатах поисковой выдачи.
![]() | И снова разработчики Гугл меня удивляют. Это все слишком для моего устоявшегося консервативного сознания. Но, меня все же радует такой прогресс. Интересно, а когда можно будет в Гугле ввести запрос типа: Гугл, ты не знаешь где мой второй носок?. А он мне такой выдает, ты его вчера под кровать закинул. Было бы хорошо. Хотя и это новшество мне нравиться. |