Dolgin.indb
Шрифт:
тений120. Косвенными источниками оценок могут служить, например, прошлые покупки или время просмотра конкретной веб-страницы, или
последовательность кликов по ссылкам в сети. В. Коуэн и В. Фэн пока-
зали, как можно отслеживать музыкальные предпочтения путем анали-
за логов (хронологической записи событий), статистики скачиваний и
прочей технической информации121. По названию файла можно устано-
вить исполнителя или композитора, а по IP-адресам – потребителей.
Тот
книга здесь сопровождается списком литературы, приобретенной поку-
119 Подробнее об этом см. часть 2, параграф 2.7.3.1.
120 Предпочтения могут быть явными (когда пользователь сам оценивает потреб-
ленные книгу, компакт-диск или ресторан) либо неявными (когда выводы дела-
ются на основе его действий).
121 Cohen W. W., Fan W. Web-Collaborative Filtering: Recommending Music by Crawling the Web // Proceedings of the 9th International World Wide Web Conference, 2000.
76
ГЛАВА 1.3. НАВИГАЦИЯ – НОВЫЙ ВИД УСЛУГ В МИРЕ МУЗЫКИ
пателями данной книги122. Считается, что фактом покупки люди выра-
жают свою оценку. Хотя купленное и понравившееся – это, очевидно, не
одно и то же, но этой разницей Amazon считает возможным пренебречь.
Несмотря на то что качество прогнозов, выведенных из косвенных дан-
ных, ниже, чем из прямых потребительских оценок, бизнес сделал став-
ку именно на них. За этим проглядывает желание не просто избавить
покупателей от лишних хлопот, но и дозировать их компетентность.
(Это тот же мотив, который привел дигитальные отрасли культуры к
единообразию цен.) Опции, облегчающие выбор, привлекают клиентов, способствуя увеличению продаж, но они же уточняют выбор, что ведет
к снижению продаж. Предоставляя услугу по навигации, бизнес заин-
тересован в таком ее виде, который не вредит сбыту продукции разно-
го достоинства. То есть он выбирает оптимальный для себя вариант, но
это не значит, что это лучший вариант с точки зрения покупателя. Если
бы навигационный сервис Amazon был платным и доходы от него были
бы сопоставимы с продажей книг, тогда резонно было бы ожидать более
высокого качества. Дареному же коню в зубы не смотрят. Предоставили
какую-то навигацию – и на том спасибо. Вообще, экспертиза, соединен-
ная с продажами, потенциально содержит возможность двурушничест-
ва, и полагаться на нее если и можно, то с большой осмотрительностью.
1.3.2.6. Кто кого фильтрует?
По мере того как число участников коллаборативной фильтра-
ции растет, нарастают проблемы обработки данных. При нескольких
миллионах пользователей ограничения
ся ощутимыми. Поэтому, когда рекомендательный сервис используют
в качестве придатка к торговым системам, фильтрацию по типу «пот-
ребитель-потребитель» заменяют цепочкой «объект-объект» (см. рису-
нок). Этот принцип экономичнее, в частности из-за отсутствия необхо-
димости часто пересчитывать взаимосвязи между клиентами123. В этот
момент и закладываются предпосылки для незаметной переориента-
ции метода с нужд потребителей на интересы продавцов.
122 Подробнее см. приложение 1, параграф 11.6.1.
123 Этот вариант навигации в 2001 г. предложили Бадрул Сарвар и его коллеги из Уни-
верситета Миннеаполиса (см.: Sarwar B., Karypis G., Konstan J., Riedl J. Item-based Collaborative Filtering Recommendation Algorithms. [on-line] Department of Computer Science and Engineering, University of Minnesota, Minneapolis, 2001. [cited Feb. 15, 2006]. Available from URL: <http://www10.org/cdrom/papers/519/index.html>). В том
же направлении одновременно двигались и другие группы, включая Amazon.
77
ЧАСТЬ 1. ПЕРСПЕКТИВНАЯ МОДЕЛЬ МУЗЫКАЛЬНОГО БИЗНЕСА
В основе пообъектной фильтрации – фиксация всех оценок, вы-
ставленных пользователями системы различным объектам (это могут
быть товары, услуги, учреждения и т. д.), и анализ сходства между объ-
ектами, что не совсем то же самое, что сходство между людьми. Напри-
мер, берется конкретный продукт – книга – и выявляются все прочие
книги, получившие от различных потребителей сходную оценку. Хотя
с точки зрения математики подсчеты «объект-объект» вроде идентич-
ны данным, полученным из оценок потребителей, но во втором случае
отбираются продукты, нужные людям, а в первом – люди, «нужные»
для продвижения продуктов. В объектной фильтрации сходство между
товарами устанавливается по профилю оценок потребителей, а в «чело-
веческой» версии – по ряду персонально выделенных и значимых па-
раметров. Разница именно в том, что в коллаборативной фильтрации с
непосредственным участием потребителей те сами расставляют акцен-
ты, а пообъектная схема обходится без этого. Методы были бы иден-
тичны, если бы в поклиентской версии фильтрации учитывались все
оценки всех покупок, совершаемых потребителями.
Пренебрегать прямо высказанными оценками – это все равно что
судить о совпадении вкусов людей по их знакомству с блокбастерами.
К тому же очевидно, что факт потребления чего-либо далеко не всег-