[윤선미의 추천 시스템 입문편] 1. 추천 시스템이란?

추천 시스템이란?

정보 필터링

  • 정보의 양이 폭증함에 따라 정보 소비자가 원하는 정보를 얻는 데 시간과 노력이 많이 필요
  • 정보 소비자에게 원하는 정보를 쉽게 얻도록 도와주는 정보 필터링이 필요
  • 정보 필터링의 대표적인 분야
    • 검색
    • 추천 시스템

추천 시스템

  • 정보 소비자가 원하는 정보를 찾아 소비자에게 추천하는 시스템
  • 검색과의 차이점
    • 검색은 소비자가 관심사를 표현하는 검색이라는 행위를 해야함(active)
    • 추천은 특별한 행위 없이도 정보 전달이 가능(passive)

추천 시스템 분류

  • 시나리오에 따른 분류
    • 연관된 아이템 추천
      • 현재 소비되고 있는 아이템과 연관된 아이템을 추천
      • 쿠팡의 연관 상품 추천
    • 개인화 아이템 추천
      • 소비중인 아이템이 없더라도 개인의 관심사를 찾아 소비할 만한 아이템을 추천
      • 유튜브 (<-> 마켓컬리 ‘md’의 추천)
  • 피드백 종류에 따른 분류
    • 명시적 피드백을 사용하는 추천 시스템
      • 영화 평점, 좋아요, 싫어요와 같이 소비자가 명시적으로 자신의 선호를 표현한 데이터
    • 암시적 피드백을 사용하는 추천 시스템
      • 웹 페이지 접속 기록(상품), 음악 청취 기록과 같이 소비자가 명시적으로 표현하지는 않았지만, 선호를 보여주는 피드백
  • 업데이트 주기에 따른 분류
    • Offline 추천 시스템
      • 특정 시점의 데이터를 사용해 추천 결과를 계산하는 방식
    • Online 추천 시스템
      • 지속적으로 사용자의 데이터를 받아 추천 결과를 업데이트하는 방식
      • 대부분의 추천 시스템은 Online -> 사용자가 취향 변화에 따라 추천 결과를 최신으로 업데이트해야 하기 때문

현업에서는 다양한 추천 로직이 섞인 하이브리드 추천 시스템을 많이 사용한다.

추천 알고리즘의 종류

  • Knowledge-based Filtering
    • 추천하고자 하는 분야의 도메인 지식을 활용해 추천하는 방식
    • ex) 성별/연령별로 많이 팔리는 상품들을 모아 추천에 활용
  • Content-based Filtering
    • 추천하려는 아이템의 콘텐츠 정보를 분석하거나 정리된 메타 정보를 활용해 콘텐츠별로 특징 정보를 만들고 이를 활용해 추천
    • ex) 상품 페이지 하단에 같은 카테고리에 있는 인기 상품 추천
  • Collaborative Filtering
    • 소비자들의 소비 이력을 사용해 소비하지 않은 새로운 아이템을 추천
      • 특정 소비자의 소비 이력과 비슷한 패턴의 소비 이력을 가진 소비자들 집단에서 좋게 피드백한 상품을 추천
    • 클릭 이력을 바탕으로 소비자가 다음으로 클릭할 만한 상품을 추천
    • 피드(feed) : 페이스북, 인스타그램, 유튜브 등은 플랫폼의 첫 화면에서 개인화된 추천으로 피드 탐색을 더욱 흥미롭게 만들고 있다.

추천 알고리즘 평가 방법

  • 오프라인 평가
    • 사용자의 아이템에 대한 선호 기록과 추천 시스템이 추천한 결과를 비교하여 추천 품질을 평가
    • 특징
      • 별다른 비용 지출 없이 수집된 데이터만 이용하여 평가 가능
      • 여러 모델을 동시에 평가할 수 있음
      • 선호 기록이 기존에 사용하고 있는 추천 모델에 영향을 받을 수 있으므로, 실제 사용자의 만족도와 평가 결과가 다를 수 있음
  • 온라인 평가
    • 만들어진 추천 시스템을 직접 사용자에게 노출시켜 사용자의 반응을 수집하여 평가
    • 특징
      • 실제 사용자의 만족도를 측정한다는 측면에서 정확한 방식
      • 비용이 비싼 평가 방식(사용자의 만족도 감소 가능성 등)

현업에서는 오프라인 평가와 온라인 평가를 섞어서 하고, 개발 단계에서는 오프라인 평가를 하며, 테스트 단계에서는 온라인 평가나 하이브리드 방식으로 한다.

Comments