한성자동차



인공지능이 당신의 취향을 분석한다, 초개인화 기술

  • 2020-03-24
  • 731
  • by 글쓰는 몽글c

사람들은 저마다의 취향을 가지고 살고 있다. 영화를 볼 때도, 뉴스를 볼 때도, 심지어 쇼핑을 할 때도 사람들은 본인들의 취향에 맞는 정보들을 취하고, 내가 좋아하는 상품들을 살펴보며 구매하고 있다. 

예전부터 취향 기반 소비는 매우 자연스러운 행동이었으며, 시대가 변화하면서 이를 알아내는 기술은 점차 발전해오고 있다. 대부분의 오프라인 서비스들은 온라인화되고 있으며, 특히 스마트폰이 보급되면서 사람들은 잠자리에 드는 시간을 제외한 모든 시간에 스마트폰을 통해 나의 행동들을 인터넷상에 기록하고 있다. 그리고 기업들은 이렇게 기록된 데이터들을 활용하여 사용자들의 취향을 분석한다.

1

또한 이렇게 분석된 취향에 따라 사용자는 나에게 적합하다고 판단된 다양한 추천들을 받게 되었고 이를 개인화라 불러왔다. 그리고 이러한 추천 기술은 기업들이 인공지능(AI: Artificial intelligence) 기술들을 적용하면서 점차 정교화된 학습과 분석이 가능하게 되었으며, 지금 우리는 인공지능이 나보다 내 취향을 더 잘 알고 있는 ‘초개인화(Hyper-personalization)’ 시대에 살고 있다.

지금부터 몇 가지 사례를 통해서 인공지능이 어떻게 나의 취향을 분석하고 나에게 최적화된 정보들을 제공하는지 좀 더 자세히 알아보도록 하겠다.


당신이 좋아할만한 포스터를 제공하는 넷플릭스

2

넷플릭스는 미국의 주문형 콘텐츠 서비스 제작 기업이다. 예전 블록버스터와 비디오와 DVD를 우편으로 배달하던 업체에서 시작해서 지금은 미국 최대의 VoD 업체, 그리고 콘텐츠 제작사가 되었다. 2017년에 전 세계 기준 이용자수 1억 명을 넘어섰으며, 국내에서도 넷플릭스 유료 가입자가 2019년 6월 기준, 184만 명이 되었다. 이런 넷플릭스가 성장하는 데는 방대한 콘텐츠, 넷플릭스 오리지널, 편리한 디자인이 일조했다고 생각하지만, 넷플릭스의 추천 알고리즘이 매우 큰 역할을 하였다.

이는 넷플릭스가 추천 시스템에 인공지능을 활용한 '협업 필터링(collaborative filtering)'과 '내용기반 필터링(content based filtering)'을 조합한 알고리즘을 사용하고 있기 때문이다.


협업 필터링(collaborative filtering):  
기존 사용자의 영화 선택 정보를 분석, 비슷한 성향 사용자들이 좋아한 콘텐츠를 추천하는 알고리즘
유사한 사용자의 행동 로그를 이용함

내용기반 필터링(content based filtering):
영화에 대한 다양한 항목(배경, 인물, 장르 등)을 분석하여 분류하고 이를 개인 영화 시청 패턴(검색한 영화, 보다가 그만둔 영화, 시리즈물 시청 여부 등)과 비교하여 유사성을 계산함
영화 정보 + 사용자의 개인 시청 패턴을 통한 추천


현재 넷플릭스는 협업 필터링을 기반으로 한 모델 기반 협업 필터링 (Model based Collaborative Filtering)을 사용하고 있다고 한다. 이러한 추천 알고리즘에 대한 투자와 노력으로 인해 넷플릭스에서 시청한 전체 영화의 75%는 이 추천 알고리즘을 통해 이루어진다고 한다. 뿐만 아니라, 넷플릭스에서 추천하게 되는 포스터의 이미지 또한 해당 알고리즘을 통해, 그 사람이 선호하는 형태의 포스터를 추출하여 제공하고 있다.

예를 들어 ‘두 교황’이라는 영화를 추천함에 있어서 다큐를 좋아하는 20대 여성에게는 풍경이 강조된 편안한 분위기의 포스터를, 정치 성향의 드라마를 좋아하는 30대 남성의 경우 어떤 사건이 일어날 것만 같은 분위기의 포스터를 추천해 줄 수 있는 것이다. 최근 인기 있는 ‘위쳐'라는 미드 역시 추천해 주는 순서가 다른 것뿐 아니라 다른 포스터를 제공하고 있음을 알 수 있다. 포스터가 영화 선택에 큰 비중을 차지하는 스트리밍 서비스에서 이러한 시도는 좋은 방법이라고 생각된다.


당신이 좋아하는 정보만 보여주는 페이스북

3

페이스북에서 친구들과 많은 커뮤니케이션을 하거나, '좋아요'한 페이지의 정보들을 자주 훑어보는 사람이라면, 자기 전에 페이스북을 보다 보니 어느새 30분, 1시간, 2시간을 훌쩍 넘기고 다음날 피곤한 컨디션으로 일어났던 기억이 한두번 정도는 있을 것이다. 

이는 페이스북의 인공지능 기반 뉴스피드 알고리즘에 의해 우리가 콘텐츠를 소비하고 있기 때문인데, 페이스북은 도대체 어떤 방법으로 추천하고 있기에 우리는 해당 서비스에서 눈을 떼지 못하는 걸까?


추천 알고리즘의 신뢰를 위한 WAIST (Why am I seeing this post?)
2019년 3월, 페이스북은 추천 알고리즘에 대한 신뢰도 향상을 위해 WAIST라는 기능을 미국에서 우선 선보였다. 이는 국내에서도 '이 게시물이 표시되는 이유는?'이라는 메뉴로 얼마 전 적용이 되었는데 이 내용을 보면 추천 알고리즘에 대해 대략적으로 파악해볼 수 있다.

알고리즘은 내가 많이 보았던 콘텐츠, 그리고 링크를 열어보았는가에 대한 여부, 마지막으로 얼마나 인기가 있는지에 대한 여부들을 통해 나에게 추천을 해주고 있었다.

내용을 조금 더 살펴보면, 글 순위에 영향을 주는 요인으로는
- 친구나 가족 우선 표시
- 사진, 동영상, 링크 게시물
- 댓글, 좋아요, 공감, 공유 수 등의 횟수
- 게시 후 경과된 기간 등
을 통해 글의 랭킹을 정의한다고 한다.


결국 내 주변의 사람들 소식, 또 자주 보고, 관심 있어 하는 콘텐츠를 지속적으로 보여주고 있는 셈인데, 다시 이야기하면 내가 좋아할 만한 정보를 지속적으로 추천해 주고 포스팅함으로써 나는 나도 모르는 나의 취향을 제공하는 페이스북에 갇혀 시간을 계속 소비하게 되는 것이다.


나도 모르게 상품을 구매하게 되는 아마존

4

국내에서는 네이버 쇼핑, 쿠팡, G마켓, 11번가 등을 통해 온라인 쇼핑을 많이 이용하고 있지만, 미국에서는 아마존이 독보적인 온라인 상점으로 자리를 잡았다. 미국 소비자의 50%는 아마존에서 상품을 구매하고 있으며, 전 세계 온라인 상품의 구매의 40%가 아마존에서 일어나고 있다.

이는 아마존에 다량의 제품들이 등록되어 있기 때문이기도 하지만 고객의 구매 데이터를 토대로 그 사람이 관심 있어 할 만한 다른 제품들에 대한 취향을 인공지능을 활용하여 판단, 또 다른 구매를 유도하고 있기 때문이기도 하다. (실제로 아마존 매출의 35%가 추천상품에서 발생한다.)

이러한 정확도가 높은 추천은 자연스럽게 매출로 이어졌고 이는 다양한 상품들을 판매하는 셀러들의 참여로 이어지고 또 고객들의 검색과 구매로 이어지게 되었다.

아마존 매출에 지대한 영향을 미치고 있는 추천 알고리즘은 아마존의 자회사인 A9에서 개발을 했으며, 기본적으로 인공지능 기반 협업 필터링(Collaborative Filtering) 알고리즘을 사용하고 있다. 이는 넷플릭스에서도 활용하고 있는 알고리즘으로 A라는 아이템을 선택한 사람에게 가장 잘 맞을 수 있는 B 아이템을 추천해 주는 방식이다. B아이템은 A아이템을 구매한 사람들이 가장 많이 선택한 아이템이라고 할 수 있겠다.

협업 필터링 알고리즘은 잠재 노드(특정 아이템을 선택한 이유에 해당하는 다양한 변수들)를 활용하는 등 점차 고도화되고 있기 때문에 아마존과 같은 온라인 쇼핑몰에서 하나의 상품을 구매하러 들어갔다가 두세 가지의 상품을 더 사가지고 나오게 되는 것은 전혀 이상한 일이 아닐 것이다.


인공지능 추천의 문제점을 아는 것 또한 중요

인공지능이 알아서 내가 좋아하는 정보들과 상품들을 추천해 주는, 정말 편리한 세상이 되었다. 때로는 나보다 더 나를 더 잘 파악하고 있는 건 아닐까? 하는 생각이 들 때도 있다.
사용자 개개인은 내가 좋아하는 콘텐츠를 쉽게 소비하고 기업들은 고객들의 체류시간과 매출을 높일 수 있어 인공지능을 활용한 ‘초개인화’는 그야말로 고객과의 접점이 있는 서비스라면 반드시 고려해야 할 요소일 것이다. 
하지만 한 가지 주의해야 할 점은, 내 취향 정보를 내가 아닌 인공지능이 너무나도 잘 알고 있다는 점이다. 그리고 어느새 이 인공지능에게 나도 모르게 길들여질 수 있다는 점이다. 

예를 들어, 특정 서비스에서 내가 좋아하는 농구 영상을 콘텐츠를 즐겨보았다면, 일정 시간이 흐른 후 농구를 제외한 축구, 야구와 같은 다른 스포츠 영상은 더 이상 보이지 않게 될 수 있다. ‘내가 좋아하는 영상을 더 많이 볼 수 있을 텐데, 이것이 무엇이 문제일까?’라고 생각할 수도 있겠지만 스포츠 외 다른 카테고리에서는 정말 큰 문제가 될 수도 있다. 정치라는 분야에서 내가 지지하는 특정 정당의 글을 즐겨보았고 비슷한 의견을 가진 정보들만을 소비하게 된다면 어느 순간 나는 내 정치 성향과 유사한 글들만을 소비하게 되고 결국, 그 사람은 소비의 편향(bias)을 통해 하나의 프레임(frame)에 갇혀버리게 될 수 있다. 그리고 다양한 의견들을 듣지 못한 채 나의 정치 성향을 더욱 견고하게 만들어 갈 것이다. 


5

이러한 현상을 ‘필터 버블(Filter Bubble)’이라고도 하는데, 나도 모르게 인공지능은 나의 의지와 상관없이 알아서 다양한 정보들을 필터링을 하여 내 취향에 맞을 것이라고 생각하는 콘텐츠만을 버블에 담아서 제공하고 있는 것이다.

따라서 이러한 개인화된 콘텐츠와 상품들을 소비하고 있는 사용자들이라면 개인화 알고리즘의 의도를 인지하고 보다 다양한 콘텐츠를 소비하기 위한 인공지능 활용방법에 대한 고민이 필요하다.
알고리즘을 학습시키는 것은 결국 '나'의 행동이며 ‘나’의 데이터이기 때문에 알고리즘의 기본적인 동작원리를 알고 문제점을 파악하여 나에게 맞추어 활용하는 것은 진정한 ‘초개인화’ 시대를 사는 사람들의 필수 요소가 되어버렸다.



  • 글쓰는 몽글c

    인공지능, 챗봇, 음성, 금융, 핀테크 등 세상을 바꿀 수 있는 기술과 잡다한 지식에 관심이 많은 IT 직장인입니다. :)

    역서 : 꼭 필요한 만큼의 리서치, 1달러 프로토타입

    브런치 : https://brunch.co.kr/@monglec

    이메일 : pentaxzs@daum.net