В «VK Клипы» появилась новая система рекомендаций для зрителей. Как утверждает VK, бесконечная лента теперь подстраивается под интересы пользователя и может перестраиваться в режиме реального времени. Новая рекомендательная система опирается на зрительский отклик: реакции и комментарии. Причем система считывает и позитивные, и негативные сигналы. Например, если пользователь нажал кнопку «Это неинтересно», сервис больше не будет предлагать ему данный контент.
Для выстраивания ленты рекомендаций алгоритмы машинного обучения анализируют каждый ролик в «VK Клипы» и определяют, что происходит в нем, о чём говорят герои, находят знаменитостей в кадре и распределяют клипы по жанрам и категориям. Кроме того, к уже существующим механизмам команда «VK Клипы» добавила собственную нейросетевую технологию поиска дубликатов. Новая разработка позволяет анализировать видеоряд и аудиодорожку каждого клипа, находить и отсеивать повторяющиеся ролики даже с разным хронометражем, разрешением, примененными фильтрами и наложенными шумами.
По утверждениям VK, у пользователя будет только оригинальный контент без повторений. Кроме того, заявлено, что в топ рекомендаций теперь будет попадать больше роликов за счет обновленной схемы отбора контента. Она стала устойчивее к накруткам, что даёт равные шансы для всех авторов. Нужно только, чтобы контент не нарушал правила «ВКонтакте».
Александр Дзюба
Директор по машинному обучению и медиарекомендациям «ВКонтакте»
«Это обновление — самое масштабное изменение рекомендательной системы клипов с момента их запуска, как с точки зрения пользовательского опыта и результатов вовлечённости, так и с технической стороны. Чтобы в реальном времени подстраиваться под интересы зрителей и дать в два раза большему количеству авторов проявить себя в VK Клипах, наша рекомендательная система обрабатывает в 10 раз большую нагрузку. В среднем для одного пользователя лента перестраивается 20 раз за каждое посещение раздела „Клипы“ или приложения VK Клипы. В сумме это около 100 млн генераций ленты в час. Это потребовало от нас полностью пересмотреть схему работы с данными, оптимизировать построение списка рекомендаций и сделать его практически невесомым, а также запастись резервами и возможностями для кратного масштабирования нагрузки».