Internews Kazakhstan

Поисковик с человеческим лицом. Интервью с техническим директором «Яндекса» Ильей Сегаловичем

Cоздан:   вт, 13/03/2012 - 10:07
Категория:
Тэги:

В феврале российский интернет-гигант «Яндекс» поддался мировой моде на все «социальное» и представил программу поиска по социальному интернету (ПСИ). В ее рамках компания представила поиск по страницам людей в соцсетях, начала сотрудничать с Twitter и начала подсовывать в поисковую выдачу «свежие» результаты. «Лента.ру» пообщалась с сооснователем и техническим директором «Яндекса» Ильей Сегаловичем о том, с каким багажом компания подошла к ПСИ и о ее планах в «социальном» направлении.

«Лента.ру»: Перед тем как говорить о планах «Яндекса», которые, как я понимаю, в обозримом будущем будут связаны со словом «социальный», давайте попробуем подвести черту под тем, что уже имеется. Каким было главное достижение поисковика в 2011 году?

Илья Сегалович: Если говорить о поиске «Яндекса» в 2011 году, то мы сделали одну большую и очень важную вещь: первый шаг за границу, турецкий поиск.

Сам по себе поиск — это не совсем строчка и результаты запроса, это еще и большая инфраструктура внутри компании, несколько десятков немаленьких внутренних сервисов, которые обеспечивают работу поиска. И некоторые из этих сервисов жизненно важны, когда мы выстраиваем продукт для чужого рынка. Чтобы сделать его, нужны специалисты, которые будут смотреть на различные компоненты поиска — на лингвистические компоненты, на те или иные классификации, на ранжирование, на синонимы, на транслитерацию, на перевод запроса и так далее и тому подобное. До прошлого года вся инфраструктура подготовки веб-поиска как продукта у нас была русскоязычная. Даже когда мы делали казахский или украинский поиск, внутри компании мы ничего не переделывали.

Чтобы изготовить продукт для Турции, 50 процентов усилий, кроме собственно поиска, его качества, ранжирования, всех этих классификаторов, о которых я говорил, ушли на то, чтобы научиться делать внутри себя продукт для заграницы. То есть мы интернационализировались внутри компании.

План нашего дальнейшего развития мы называем «транслокальным». Это значит, что мы не готовы в один момент стать всемирным поисковиком, но мы хотим постепенно «завоевывать» отдельные рынки, шаг за шагом превращаясь из локальной компании в международную. У нас есть несколько уникальных интересных продуктов, которые мы можем локализовывать для других рынков, привлекая пользователей, увеличивая лояльность к бренду и так далее.

По большому счету, поиск в 2011 году занимался вот этим — мы учились и становились международными.

Что по поводу развития «Яндекса» в целом?

Касательно общего развития компании, я бы выделил один главный момент: это то, что можно назвать привязкой к реальной жизни. В начале года мы сделали гео-продукт — «Яндекс. Справочник». Это сервис, где малые бизнесы, в том числе совершенно офлайновые, могут настроить показ себя на карте при поиске в вебе и мобильных устройствах; могут заказать приоритетное размещение — рекламу. Еще один новый сервис — «Яндекс. Такси» — позволяет искать такси, которые находятся рядом с вами. Это все была история про связь поиска с реальной жизнью, поиска и мобильного телефона.

Также мы сделали несколько версий наших сервисов для iPhone и не только. И сделали поиск по приложениям для iPhone и Android. Не секрет, что по приложениям все ищут плохо, и мы пока тоже не слишком хорошо справляемся с этой задачей. Просто потому, что природа этого поиска очень специфическая — в поиске приложений недостаточно сигналов, поэтому трудно выстроить качественный поиск.

Когда вы ищете конкретное приложение, обычно проблем не возникает, если только оно названо не слишком общим словом. А вот если вы ищете что-то менее конкретное, например, «игры для детей трех лет», то в результатах поиска будет просто кошмар. Мы пытались атаковать именно такой сегмент поиска, это примерно половина или треть всех запросов про приложения.

Пока я не могу сказать, что нам все удалось, но мы сделали первый подход. Поиск приложений — важное направление, и оно является частью нашего большого плана развития, связанного с тем, чтобы активнее присутствовать в мобильном мире, быть частью мобильной платформы.

В прошлом году мы сделали важное приобретение — купили компанию SPB Software. Это компания, которая делает оболочки (shells) для самых разных платформ, наиболее успешный продукт у них — это shell для Android. Последние месяцы он был в топе платных приложений. Мы постараемся сделать его лучше, насытим разными интересными сервисами, сделаем его более плотно интегрированным с приложениями «Яндекса», может быть, даже получится своего рода платформа.

Мы видим свою миссию в том, чтобы выходить в реальный мир, выходить в мобильное.

И в «социальное»?

Конечно, у нас есть задача адаптироваться к изменившемуся миру. Есть социальные сети, в них живут сотни миллионов пользователей — и это не только площадки для общения, но и информация, которой люди обмениваются, которую выделяют из гигантских потоков в интернете. Мы сделали несколько вещей в этом направлении.

Вообще говоря, учет социального начала в поиске — отнюдь не новая технология для нас: мы всегда строили свои сервисы на основе статистики социума. Наши сервисы выигрывают именно от того, что их используют много людей. Знание об использовании этими многими людьми сервиса мы используем для того, чтобы повышать его качество. Это то, что называется по-английски Collaborative filtering, взаимопомощь: например, вы покупали что-то на Amazon, а он сообщает в ответ, что тот, кто купил этот продукт, на самом деле еще покупал и вот эти.

Еще в 2005 году у нас был известный текст про «аффтар жжот», о том, как пользователи «Яндекса» помогают друг другу: когда они исправляют свои опечатки, они еще помогают исправлять опечатки другим. Но раньше все социальное, что мы делали в сфере Collaborative filtering, работало на основе неявных признаков. А в прошлом году мы запустили механизм социальной авторизации — разрешили входить в «Яндекс» по практически любому социальному логину.

С этим шагом мы уже четко двигаемся в «социальном» направлении. Мы надеемся, что у нас появятся явные знания про человека, что он честно нам скажет: «Дорогая поисковая система, я такой-то, вот это я в Facebook или во „Вконтакте“».

Бери у меня все.

Нам не надо все! Нам надо что-то, чтобы тебе помочь. Мы же не строим свой Facebook, не пытаемся заспамить ленты твоих френдов сообщениями: «Ура! Илья воспользовался сервисом „Яндекса“!» Такого у нас в планах нет.

Нам кажется, что такое знание полезно прежде всего самому пользователю, так как, открываясь нам, он рассказывает о своих пристрастиях, предпочтениях. Это позволит «Яндексу» давать более персонализированный ответ, учитывать то, что действительно интересно именно вам. И вокруг механизма социальной авторизации мы будем развивать все больше и больше сервисов.

В феврале мы запустили «Поиск людей» — новую поисковую вертикаль, которая позволяет найти аккаунты человека в основных социальных сетях. И вот, в частности, в рамках проекта «Поиск людей» с помощью социальных логинов вы можете авторизовать те или иные сервисы, сказать, что вот это все мои профили, а вот эти профили не склеивай, не показывай это про меня.

И в рамках стремления к «социальному» вы купили в прошлом году «твиттерогазету» Tweeted Times?

Tweeted Times — чудесный небольшой сервис, симпатичный тем, что он был первым в крайне модном в прошлом году жанре Social News — социальные новости. Идея этого жанра в том, что вы сообщаете системе ваш социальный логин, а она собирает информацию из этих соцсетей и делает красивую презентацию, строит релевантную картину из «френдового» потока.

Когда Tweeted Times сделали это 2 года назад, у Facebook была еще в основном унылая сортировка по времени, а сейчас Facebook сам занялся этой задачей. Но остается довольно большое количество незаполненных ниш — в частности, есть «Вконтакте», Twitter, у которых этой сортировки нет, и многие другие сервисы еще не умеют этого делать. Кроме того, у человека может быть несколько логинов в социальных сетях.

А главное, что в этом месте плохо отстроено — это презентация. Мало собрать ссылочки или контент из социальных сетей и как-то их переранжировать, но нужно еще правильно отформатировать, собрать в зависимости от типа контента — видео, картинка или текст. Не просто вытащить в ленту первые 5 слов текста, а сделать новостной продукт нормального качества а-ля «Яндекс. Новости» — только, может быть, их более газетный вариант. Но не на основе поведения миллиона пользователей и потока сообщений из агентств, а на основе вашего личного профиля.

То есть то, что вы говорили о «Вконтакте», Twitter — это можно очертить как планы «Яндекса»?

Как направление — в целом да, но обещать мы ничего тут не можем.

В 2010 году социальные сети выросли чуть ли не в 10 раз. Почему вы не начали делать свои социальные сервисы раньше, когда была потребность искать людей, когда люди реально только начали приходить в соцсети?

Поиск людей, вне зависимости от того, есть ли вы в соцсети и нашли ли вы своих друзей, он все равно есть: 2 процента запросов «Яндекса» — это поиск людей. Вообще, даже 4 процента, но 2 из них — это те запросы, когда люди ищут не знаменитостей, а обычных людей. И этот поток всегда был. Я не думаю, что на момент, когда строили социальные сети, этот поток был выше.

Люди могут быть в разных соцсетях: не во «Вконтакте», а в «Одноклассниках», или в Linkedin, или в Facebook. Люди могут не использовать в этой соцсети свой старый профиль, а в каком-то другом месте, наоборот, вести активную деятельность, и вы не можете знать наверняка, где именно. Это интерес к людям — постоянный, он всегда будет. Не иметь такого поиска глупо. А кроме того, тем же социальным сетям нужен такой сервис. Например, Bing сделал поиск, который встроен в Facebook, в сущности, основная функция которого — найти профиль человека в Linkedin. Обычно вы ищете человека в Facebook, но не находите его там, зато — вуаля! — Bing показал вам профиль из Linkedin. То, что надо!

Да. Но вы так и не сказали, почему вы раньше не начали делать социальные сервисы как поддержку для социальных сетей.

Мы ко всем социальным сетям относимся нейтрально, мы установили с ними партнерские, доверительные отношения. Со «ВКонтакте», например, мы договорились больше года назад. Мы же не соцсеть, у которой есть все данные про всех ее пользователей. Мы внешний сервис, а нам нужно обеспечить хороший поиск. По мере того, как у нас нарастало «мясо» отношений с социальными сетями, у нас появлялись предпосылки для сервисов с использованием социальности. Сейчас такие предпосылки есть.

А что вообще по плану? Если вы взяли курс на социальность, что вы будете делать сейчас в этом направлении, кроме людей?

Будем учитывать данные из соцсетей в поиске и ранжировании. Будем работать над созданием поиска по всему социальному контенту, где можно будет находить любую открытую информацию из разных социальных сетей и блогов. В общем и целом, будут социальные продукты на поиске Яндекса и в «Яндекс. Новостях».

Что может быть в «Поиске» кроме людей?

Там есть понятная история — когда вы представлены поисковой системе, она может самым разным образом учитывать ваших друзей. У конкурентов были удачные и неудачные заметные попытки сделать это. Поиск Mail.Ru все время пишет, что вот это понравилось стольки-то людям из «Моего мира». Google пишет, что это нравится таким-то людям из Google+.

Мне кажется, у таких систем, которые сами продвигают свою социальную сеть, есть один важный недостаток — они могут случайно «не попасть» в аудиторию, которая пользуется поиском, потому что аудитория может быть из другой социальной сети.

Я думаю, что «Яндекс» должен быть агностичен в этом месте, мы ничего не должны знать, у нас не должно быть никаких чувств к тем или иным социальным сетям.

А что должно быть?

Допустим, есть человек в социальной сети, он активен в ней, он тратит какое-то количество времени — в среднем, по 20 минут в день — на то, чтобы читать, что люди из его френд-ленты делают. Наверное, у него есть что-то вроде симпатии или уважения, привязанности к этим людям — какие-то чувства, он не нейтрален. Поэтому если поисковая система учтет его чувства в том или ином виде, то это будет здорово.

Простейший пример — вы ищете то, что видели: «Вчера, кто-то что-то интересное написал, кто же это был? Не помню, но там была такая вот штука...» Набираешь в «Яндексе», и он тебе показывает — ну вот же, это же Сегалович был. Получается диалог, когда система опознает тебя и помогает при поиске преподнести ту информацию, к которой ты испытываешь немножко больше эмоций. По моей оценке, поисков, которые относятся к свежей информации, у нас где-то процентов от 7 до 15, и, наверное, примерно половина из них может быть как-то задета социальными сигналами.

Вы сразу спросили про поиск, когда человек залогинен в системе, а есть не менее важная история про социальный поток. Дело в том, что у нас и в блогах, и особенно в Twitter, и в статусах в социальных сетях, которые публичны, есть важная часть данных или сигнала —  то, что людям нравится, важно, актуально или интересно в данный момент. В нашей терминологии это называется интерес к свежему. И если посмотреть даже на «Яндекс. Новости», то видно, что в каждом новостном сюжете есть ссылочка на то, сколько человек в блогах упомянули этот сюжет.

Если бы мы составляли топ новостных сюжетов по блогам, то у нас получилась бы немного другая картина, чем если бы мы составляли топ новостных сюжетов по сообщениям новостных интернет-агентств. Есть неинтересные интернет-сообществу темы, а есть интересные. Не зная ничего про вас лично, а просто собрав большое количество контента из социальных сетей, блогов и микроблогов (все это называется Social Media), можно совершенно по-другому ранжировать свежую информацию — выбирать по релевантности самое важное в ней. Это будет немножко другой, отличающийся от асоциального взгляд на мир. И в этом смысле социальное даже может быть более важно, потому что эта реальность массовая, она про больший поток запросов, больший поток пользователей, их интересы. Даже не передавая никому ничего про себя, вы уже нуждаетесь в социальном ответе.

Вы не боитесь, что это накрутят и вас опять будут обвинять?

Мы этот принцип социального ранжирования уже вовсю используем — в ранжировании свежего у нас используется довольно много сигналов, но будет еще больше. Сейчас мы начали активнее учитывать ссылки из «Твиттера», это один из важных источников о том, что прямо сейчас интересно людям и что они вообще еще обсуждают на эту тему. Мы собираемся сильно проинтегрироваться с данными из разных социальных сетей, и, получая весь поток данных, мы сможем по-другому показывать и ранжировать свежие ответы. Это наша основная задача на ближайшие месяцы

А что будет с блогами?

По-моему, блоги сохранят часть своего значения в том или ином виде. Я не могу сказать, что их уже нет или не будет. Но нам, конечно, надо переосмыслить поиск по ним, мы думаем над этим, пока ничего не придумали.

Рейтинг и подобные штуки, по-моему, близки к социальной теме.

Близки, да. Проблема с рейтингом одна — как только ты публикуешь рейтинг, можно считать, что его уже и нет. Это как с принципом неопределенности Гейзенберга. Рейтинги для использования внутри Яндекса нам нужны, они у нас есть, а наружу — это совсем другая история. Но, безусловно, в социальных сетях и блогах есть такой фактор, как социальный ранг человека или автора, и его надо изо всех сил стараться учитывать в разных продуктах. Это правда.

Если вы введете новые сервисы, что будет с теми людьми, кто не хочет получать советы по результатам поиска из социальных сетей?

В настройках они смогут отключить влияние на поиск, и все сохранится по-старому. Можно будет даже, например, оставлять привязку профиля для новостей, а отключить влияние на поиск, в новостях оставить. Например, вам Facebook симпатичен, но в выдаче его вы не хотите видеть, а в новостях — не против. Будет гибкая настройка.

Вот вы говорите, что не хотите ничего ни о ком знать, хотите дружить со всеми равномерно, а каков вообще объем данных?..

Объем фантастический. В том-то и особенность. Очень трудно собрать это обычным краулером (роботом). Собственно, поэтому мы договорились о сотрудничестве с Twitter, о том, что они предоставляют нам свой firehose. Практически нереально вытащить всю информацию силами поисковика.

Я говорю не об объемах как физических величинах, а об объемах как том количестве данных обо мне, которое будет знать «Яндекс».

Он точно будет знать меньше, чем социальная сеть, потому что социальная сеть выдает наружу только дозированный объем информации. Все-таки мы сервис, который строится над публичным контентом, у нас нет задачи доставать контент, который не публикуется, который как-то скрыт. В этом плане мы живем немножко по другим законам, живем в открытом интернете. Даже полный список друзей нам не доступен, мы не можем по профилю получить список друзей, только если пользователь соцсети явно не передал его нам.

Классический журналистский вопрос про идеальный поисковик. Вам задавали его еще несколько лет назад. Как бы вы сейчас на него ответили?

Отвечая на такой вопрос, непременно скатишься в какую-то футурологическую дребедень. Понятно, что через несколько лет твое мобильное устройство будет про тебя знать больше, чем сейчас. Начиная от привычек, например, когда вы ложитесь спать и просыпаетесь (устройство знает их уже сейчас, просто не рассказывает), как часто, куда и зачем вы ездите, заканчивая тем, с кем, где и когда вы пьете. И оно будет больше и больше про вас знать, потому что это удобно прежде всего вам самим. Все профили в социальных сетях уже лежат в вашем мобильном.

Поиск будет сильно зависеть от этого устройства — от вашего местоположения, от времени дня, от ваших привычек, поведения, от друзей. Устройство будет помогать вам, подсказывать то, что нужно именно вам и именно сейчас.

Потом есть много интересного про физическую активность человека и его физическое состояние. Есть такие приложения для iPhone, которые считают пульс, а другие рисуют тахограмму, причем без дополнительных устройств — при помощи вспышки от камеры приложение считает, как кровь течет через палец. И дальше с этой информацией уже можно что-то делать. Устройство знает, когда ты на пробежке. Устройства будут помогать, советовать что-то полезное в нужные моменты времени. Понятно, что в каких-то случаях вы можете сказать голосом в такое устройство. То есть устройство, с которого вы ищете, будет у вас в кармане.

А что у «Яндекса» с голосовым поиском?

Мы вместе с партнерами работаем над тем, чтобы у «Яндекса» появились такие технологии.

В прошлый раз вы тоже говорили про мобильные устройства.

Ну, вот видите, какие-то изменения случились, какая-то жизнь происходит — у «Яндекса» уже почти есть своя платформа, мобильные устройства с предустановленными сервисами, появились интерфейсы, занимаемся голосовым поиском, кучу приложений для мобильного понаписали за эти годы.

Вообще, возможно, история про дополненную реальность будет хитом 2012 года. Она будет более актуальна, появятся всякие программы про трехмерный мир вокруг нас, которые смогут показывать что-то интересное, рассказывать, отвечать на какие-то вопросы. Это даже не очень дорого, с точки зрения технологий и того устройства, которое уже лежит у вас в кармане.

Беседовал Султан Сулейманов

Илья Сегалович окончил Московский государственный геологоразведочный университет в 1986 году. С 1990 года работал в «Аркадии», а с 1997 года в компании CompTek («Аркадия» стала подразделением последней), из которой впоследствии выделился интернет-поисковик «Яндекс». На сегодняшний день занимает пост технического директора компании. Помимо «Яндекса», Сегалович участвует и в сторонних проектах. Так, перед выборами президента России в марте 2012 года он инициировал создание мобильных приложений для наблюдателей. Также Сегалович участвует в работе благотворительного фонда своей жены «Дети Марии».

Источник: Lenta.ru