Mail на РИФ+КИБ-2010
В апреле этого года на весенней конференции Рунета «РИФ+КИБ – 2010» был представлен доклад руководителя группы Mail.ru, посвященный «серебряным пулям, полупулям и другим боеприпасам современного поисковика». «Серебряной пулей» Владислав Шабанов назвал учет гиперссылок при ранжировании. Свои выводы он обосновал тем, что это делает выдачу одновременно по очень большому количеству запросов лучше, и реализация его возможна небольшой группой. Но ведь со времени создания этой «пули» прошло более 10 лет! А так как большой процент гиперссылок сегодня не только можно, но и нужно игнорировать, эта «пуля» часто пролетает мимо цели.
Чем же можно заменить «серебряную пулю»? А ничем. Равных ей нет, поэтому требуется использовать «боеприпасы» помельче.
Во-первых, это социальное ранжирование, которое позволяет не только учитывать запросы пользователей, но и куда они переходят, какое количество времени тратят на просмотр страницы и так далее. Рассмотрим, к примеру, запрос [звездные войны]. Вводя этот запрос, пользователи могут иметь в виду или знаменитый фильм Дж. Лукаса, или очередную потасовку среди звезд шоу-бизнеса, а может просто понятия «звездные» и «войны».
Сделав анализ поведения интернет-пользователей, можно использовать полученные сведения в поисковой машине. В случае, когда по найденному на запрос результату никто не кликает, желательно его убрать. В обратной ситуации, если множество пользователей часто переходит по ссылке на один из результатов поиска, надо бы поднять его повыше.
Результаты исследования, проведенного Mail.ru, показали, что пользователи чаще реагируют на естественные раздражители. В том случае, когда в сниппете результатов поиска выводятся метки «в подарок», посетители поисковика переходят на такие сайты чаще.
В заключение доклада Шабанов сделал следующие выводы:
- Результат запроса, по которому мало информации, лучше отбросить.
- Также отбрасываем результаты запроса, если сессия пользователя выглядит необычно.
- При наличии в результатах раздражителей следует запрос обрабатывать отдельно.
- При наличии сомнений в каком-либо результате, можно поэкспериментировать: поместить его на какое-либо место, через пару часов поменяем местами с другим, сравним результаты.
Распределение рейтинга результатов похоже на работу системы контекстной рекламы. Происходит обновление результатов в конце списка, учет количества переходов на сайт, анализ факторов, отсеиваются роботы. Необходимо анализировать поведение посетителей поисковика, кроме того, нужно иметь под боком социальную сеть и почту. При соблюдении этих условий можно создавать отдельные социально направленные добавки в процесс выстраивания страниц, найденных по запросу пользователя, в зависимости от пола, возраста и образования пользователя.
Владиславу Шабанову видится будущее поиска во всем вышеперечисленном. Можно только добавить необходимость глубокого анализа сайтов. Поисковик обязательно должен разбираться в содержании обрабатываемой страницы. Например, новость надо извлечь и учитывать ее дату при ранжировании, а в сообщениях форумов необходимо извлекать число просмотров (можно также учитывать число ответов).