NetFlix
이미지 출처: https://signup.netflix.com/MediaCenter/Overview

http://www.wired.com/underwire/2013/08/qq_netflix-algorithm/

밀린 글 몰아보기. 오늘은 지난 8월 7일 Wired에 실린 넷플릭스 기사인데요. 넷플릭스의 제품 혁신 & 개인화 알고리듬 담당 부사장인 Carlos Gomez-Uribe, 엔지니어링 디렉터 Xavier Amatriain에게 넷플릭스의 추천 알고리듬에 대해 물어보는 기사입니다.

아시다시피 넷플릭스는 초창기에는 DVD 우편대여업으로 시작했지만, 이후 스트리밍에 초점을 맞추면서 폭발적으로 성공했고, 그 성공의 기반에는 강력한 추천 알고리듬이 있었는데요. 기사에서 흥미로운 부분을 추려 보면 다음과 같습니다.

1. 넷플릭스에서는 추천이 거의 모든 것: 이베이는 물건 구입의 90%가 검색으로 인한 것이라지만, 넷플릭스는 시청 관련 행동의 75%가 추천에 따른 것이라고. 검색은 추천이 미처 다루지 못한 것을 보조하는 정도.

2. 별점은 의미가 적다: 예전에는 사용자가 별점을 주고, 그 결과에 따라 예측 별점을 보여주는 것이 중요하다고 생각해서 공을 들였으나 실제로는 그렇지 않았다. 별점은 사용자의 희망사항이 투영된 것이지 실제 행동과는 거리가 있다. 사람들은 외국 영화나 다큐멘터리를 종종 본다고 얘기하지만 실제로는 그렇지 않다.

3. 넷플릭스 추천 알고리듬의 핵심은 시청 패턴: ‘시청 패턴이 유사하면 보고 싶어하는 것에 대한 취향도 비슷하다’라는 가정 위에 알고리듬을 만들었다. 때에 따라 예측 별점 세 개, 두 개짜리를 추천해주는 것도 그 때문. 쉰들러 리스트는 별 다섯 짜리 영화지만, 수요일 밤 오래 일하고 와서 집에 들어왔을 때 보고 싶은 영화는 따로 있지 않나.

4. 시청 패턴 데이터를 수집해서 알고리듬 개선: 재생 목록, 검색 목록, 시청 일시, 시각, 기기, 브라우징이나 스크롤 등의 사용 데이터를 수집. 가족 회원의 경우 개인 프로필을 만들 수 있게 했고, 추천에 요일, 시간대, 기기, 위치 등의 ‘맥락'(예: 자정에 아이패드 켰을 때 vs 밤9시에 TV를 켰을 때)을 넣는 건 현실적 어려움이 아직 있지만 노력 중.

이 정도인데요.

가장 재미있었던 것은 ‘시청자가 하고 싶다고 얘기하는 것과 실제 하는 것은 다르다’라는 부분이었어요. 설문조사나 심리테스트가 갖는 한계점과 비슷한 것 같더라고요.

‘발견’에 있어서 별점이나 검색 외에 알고리듬 추천, 친구 추천 등 여러 가지 방법이 있을 텐데, 아마존이나 넷플릭스처럼 맞춤 추천이 대단하다고 생각하면서도 이베이에서는 90%가 검색이라니, 상황마다 다른 방법이 필요한 것 같고 그러네요.

Advertisements