본문 바로가기
SQL

[비즈니스 데이터 분석] 리텐션과 관련한 자료에 대해 해석하기

by 포 키 2026. 1. 18.
반응형

오늘은 데이터리안의 블로그 글을 참고해 리텐션에 관한 정보 수집 및 개인적인 해석에 대해 작성하는 포스팅이다.

내용 구성은 필자가 읽고 추가로 검색한 내용을 첨언해서 이해한 구조를 작성한 것이다.

예시를 많이 들었고, 내가 이해한 것을 다시 정리하기 위해 작성하는 글이기에 필자가 정리한 부분없이 정확한 정보만을 보고 싶다면, 아래에 남겨두는 데이터리안의 블로그를 통해 읽어보는 것을 권장한다.

https://datarian.io/blog/classic-retention?utm_source=sql-camp&utm_medium=camp&utm_campaign=referral&utm_content=sql-advanced

 

클래식 리텐션 Classic Retention

AARRR 프레임워크에서 가장 중요한 Retention, 사용자 유지와 관련한 지표 계산에 대해서 알아봅시다.

datarian.io

 

 

필자는 전공생도 아니고, 개인적으로 SQL에 관심을 갖게 된지 오래되지도 않았고, 관련된 일을 한 경력도 따로 없었어서 분석이라는 과정을 세밀하게 알고 있지 않다.

그래서 처음으로 알게된 부분도 있고, 색다르게 정보를 얻어가는 이 과정이 참 재밌으면서도 어렵고 낯설다.

조금씩 나아가보자고는 하지만 아직도 모르는게 많아서 어디서 무엇을 손대야 할지 잘 모르겠지만, 누구든 다들 그런 시간을 넘어가면서 습득하는게 공부니까 나도 얻어가는 재미를 길게 가지면서 공부를 하고자 포스팅을 작성한다.

쓸데없는 말은 이만 줄이고, 이제 본론으로 넘어가보자!

 

 

1. 리텐션이란?

먼저 '리텐션' 이라는 말을 나는 이번에 처음으로 제대로 접해보았다.

채용공고를 뒤지면 보이는 그로스해커팀, A/B 테스트, AARRR 등의 용어들 막연하게 나는 그런걸 할줄 모르는데.. 어디서 배워야 하나 했는데 데이터리안에서도 쉽게 설명해주는 포스팅이 있더라.. (참조하실 분 하시라는 의미)

이 리텐션이라는 용어만 먼저 해석을 하면 사용자 유지 라고 한다.

이를 설명하기 위해서는 조금 더 올라가서 그로스 해킹을 먼저 이해할 수 있어야 하던데, 뒤로 살짝 넘겨두고 용어만 더 설명을 하겠다.

리텐션은 마케팅에서 사용되는 하나의 지표로 사용자가 얼마나 계속 남아있는지를 수치(비율)로 표현한다.

쉽게 설명을 하자면 고객이 어떻게 하면 우리 회사 제품을 꾸준히 사용할 수 있을지를 분석하기 위해 사용되는 하나의 지표이자 이탈 여부를 직접 보여주기도 한다는 것!

데이터리안의 글을 빌리자면, 새로운 고객들을 끌어오는 것보다 기존 고객들이 만족을 느끼고 지속적으로 사용하는 것을 더 우선으로 여기는 것이 리텐션이다.

실제로 기업에서는 고객을 새로 유치하는 것에 비해 기존 고객들을 유치하는 것이 금전적으로 훨씬 좋다고 들었다.

물론, 신규 고객이 늘면 당연히 좋겠지만, 신규 고객들에 한정되어 투자를 하게되면 기존 고객들을 만족시킬 서비스 유치 비용에 비해 규모가 달라지겠다는건 누구나 생각해봐도 알만한 정보니까 이해가 된다.

나도 통신사를 변경할 때 기기값이 지원이 되서 옮기는 것도 있고, 실제로 통신사에서 지원해주는 VIP 혜택 같은걸 다 찾아 받는 한 사람으로 이 부분은 크게 공감이 되는 것 같다.

 

 

1-1. 그로스해킹

그럼 아까 리텐션이 왜 그로스 해킹이랑 관련이 있다고 한건지 이걸 왜 먼저 알고 있어야 한다고 한건지 알아보자.

그로스 해킹이라는 것은 '성장 + 해킹' 을 붙여 만들어진 말로 고객의 니즈에 따라 제품들을 더 개선하고 변형해서 해당 제품이 시장에서 높은 성과를 보이도록 하는 것을 말한다.

정의를 내리자면, 한 제품을 새로이 개발하는 과정에 마케팅 아이디어를 제품에 녹여내는 전략이라고 한다.

회사 제품이 아무리 품질이 좋은들 쓸모가 없으면 안되듯, 트렌드를 적극적으로 반영하고 고객들이 원하는 제품으로 만들어 내기 위해 많이 사용하는 전략이라는 것이다.

그러기 위해서는 비즈니스를 위한 성과 지표를 계속해서 발전시켜나가야 하고, 뒤쳐져서는 안된다.

이전에는 마케팅이 광고를 통한 인지도 개선이 주를 이루었다면, 지금은 인지도 뿐만 아니라 고객의 니즈에 맞추는 것이 가장 우선시 되어 이를 위해 개발과정에서 다양한 분석들도 요구되고 있다.

 

 

1-2. AARRR

그렇다면 AARRR은 무엇일까?

그로스해킹에서 주로 사용되는 프레임워크이자 해적지표라고도 일컫는다.

각 용어를 단계별로 풀면 아래와 같다.

더보기
  • A : Acquisition (사용자 획득)
  • A : Activation (사용자 활성화)
  • R : Retention (사용자 유지)
  • R : Revenue (매출)
  • R : Referral (전파)

일반적으로 기업에서는 한 서비스를 기준으로 사용자를 먼저 획득할 것이다.

필자는 쿠팡플레이를 예시로 들어서 설명을 이어가겠다.

 

쿠팡플레이가 만들어진 초창기에는 타사 OTT 프로그램이 비싸서 흥행하였다.
그래서 쿠팡 와우를 사용하면 쿠팡플레이를 같이 사용할 수 있도록 출시했다.      → 사용자 획득
쿠팡플레이에서만 공개되는 스포츠 라이브가 흥행하며, 쿠팡플레이를 사용하는 고객들이 늘어나기 시작했다.
→ 사용자 활성화
쿠팡플레이에서는 스포츠외에도 타 OTT에 흔하지 않은 인기 작품을 계약했고, 구독자들이 계속해서 사용을 했다.
→ 사용자 유지
쿠팡플레이에서는 영화관을 가지 않으며, 디지털 TV를 사용하지 않는 고객들을 위해 쿠팡플레이에서 최신 영화를 다운받을 수 있도록 저렴한 가격에 개별구매 작품들을 출시했고, 이를 이용해 구매해서 보는 고객들이 생겼다.
→ 매출
쿠팡플레이를 통해 최신 영화를 저렴하게 구매해 즐긴 고객이, 쿠팡 와우만 가입을 해도 로켓 혜택과  OTT 혜택을 동시에 즐길 수 있다며, 친구에게 추천을 해줬다.      → 전파

 

이처럼 사용자를 획득하는 것은 많이 획득할 수 있어도, 쿠팡플레이에서 직접 개별구매를 진행해 보는 고객과 이를 추천하는 고객은 적은 것 처럼 점점 고객층이 줄어드는 구조가 일반적이다.

쿠팡와우를 사용하더라도, 쿠팡플레이는 사용하지 않는 고객들도 있는 것처럼 다른 예시로 홈페이지 가입을 한다고 해서 무조건 그 고객이 구매를 하지는 않는다는 것이다.

이러한 프레임워크를 통해 각 기업은 기준을 잡고 어떻게 마케팅을 진행할지를 분석의 결과를 통해 정하곤 한다.

리텐션도 이 프레임워크의 한 단계에 해당이 되기 때문에 알아두어야 한다는 것!

 

 

1-3. 리텐션 지표 계산을 위한 정의 방법

정의를 위해서 다시 쿠팡플레이 예시를 끌어와보자면, 쿠팡플레이에서는 고객이 로그인만 한다고 해서 실제적으로 이용하는 것이 아니다.

로그인을 한 후, 보고싶은 작품을 찾다가 없어서 실질적으로 OTT 기능을 활용하지는 않았다면, 이것은 사용자를 유지하고 있다고는 할 수 없기 때문이다.

그렇기 때문에 쿠팡플레이의 경우, 고객이 실제로 하나의 작품을 눌러 감상했는지, 개별 구매 작품을 이용했다면 구매를 했는지 등을 분석함으로 리텐션을 정의할 수 있다.

 

 

2. 리텐션 방법

리텐션은 한가지 방법으로만 계산이 가능한 것이 아니다.

먼저 리텐션은 절대로 전체 고객을 기준으로 잡지 않는다.

사용자가 유지가 되고 있는지를 파악하기 위해서는 전체 고객을 기준으로 잡는게 맞지 않을까? 라는 생각을 했는데, 전체고객을 기준으로 잡아버리면 특성이 전혀 다른 고객들이 섞여버리기 때문이다.

특성이 다른 고객이 섞이면 왜? 라고 물으면 고객군에 따른 행동의 시간적 흐름이 사라져 버린다.

무슨 말인지 모르겠다고 할법한데, 쉽게 설명을 해보자면 오늘 가입한 사람과 이벤트 가격으로 몇달 반짝 쓰는 사람(해지 예약), 몇년을 사용했고, 앞으로도 이걸 꾸준히 믿고 계속 사용할 사람 이렇게 집단으로 분류가 되는 상황에서 모든 고객들을 모아서 보면 분석 자체는 가능해도 유의미하게 활용을 하기는 힘들다는 것이다.

한마디로 비슷한 기간에 가입한 고객들을 같이 묶어서 보기 위함이라고 생각하면 편하다.

전체 고객군은 우리 서비스가 얼마나 성장했는지에 대한 규모를 보기 위해서는 적합하나, 각 군집으로 나누어 리텐션을 계산한 결과값은 얼마나 고객들을 만족시켜서 유지하고 있는지를 본다는 것에서 의미가 완전히 다르다.

그렇게 하기 위해서 리텐션은 코호트 분석으로 진행을 하는데 이 부분은 뒤에서 추가로 다루도록 하겠다.

이제 아래에 리텐션 계산 방식을 소개해보고자 한다.

 

 

2-1. 클래식 리텐션

클래식 리텐션은 특정한 일자를 기준(예 : 2월 1일) 으로 특정 시점에 유입된 사용자 집단(예 : 1월 1일 가입 고객) 중 몇 %가 접속을 했는지 계산하는 방법으로 리텐션을 계산한다.

그러나 이 방식에는 문제가 있다.

일주일을 기준으로 쿠팡플레이를 매일 사용한 고객과 격일에 한번 사용한 고객을 같은 기준으로 봐도 결과적으로는 사용자를 계속해서 유지하고 있으니 문제가 없지만, 클래식 리텐션 계산에 의하면 결과값은 양일이 다르기 때문이다.

그렇기 때문에 쿠팡플레이와 같은 서비스보다는 SNS와 같이 매일 사용하는 지를 확인하기 위한 지표로 많이 사용한다.

 

 

2-2. 롤링 리텐션

롤링 리텐션의 경우, 고객이 이탈하지 않고 남아있는지에 대해 중점으로 둔다고 한다.

다른 이름이 더 익숙한 사람이 있을텐데 맞다. Unbounded 리텐션이라는 이름도 사용한다.

롤링 리텐션 계산법은 간단하다.

기준일을 두고 기준일을 포함해서 그 이후로 한번이라도 재방문한 유저의 비율을 계산한다.쉽게 설명을 해주자면 일주일간 야놀자를 이용한 고객을 기준으로 언바운디드 리텐션으로 계산을 해보겠다.

 

고객 1/1 (DAY 0) 1/2 1/3 1/4 1/5 1/6 1/7
방문       방문    
방문   방문     방문 방문
방문     방문   방문  
방문 방문 방문 방문 방문 방문 방문
1/6 이탈 X 4 4 4 4 4 3  
1/7 이탈 X 4 4 4 4 4 3 2

다음과 같이 고객이 존재할 때 해당 고객이 시청한 마지막 일자를 기준으로 이전에 시청한 일자 사이의 방문하지 않은 공백기가 있더라도 방문한 것으로 간주한다.

이 경우, 1월 6일자와 7일자 양일로만 비교를 한다면 리텐션 값이 다르게 나타난다.

그렇기 때문에 롤링 리텐션은 어느 날을 기준으로 두느냐에 따라 과거의 산출한 결과값이 변할 수 있어서 해당 부분의 이해도가 없는 사람들과의 협업에서는 사용을 비추한다고 한다.

 

 

2-3. 범위 리텐션

범위 리텐션은 클래식 리텐션을 조금 더 보완해서 유연하게 활용하는 방식이다.

클래식 리텐션은 특정 일자 하루하루를 기준으로 삼았다면, 범위 리텐션은 이름에서부터 예상되듯이 구간을 나누어 계산을 진행한다.

보통은 DAY 0 (기준일), DAY 1-3, DAY 4-6 등의 기준으로 많이들 나누는 것으로 보이는데, 이는 반드시 따라야 하는 기준은 아니기에 맞춰서 사용하면 된다.

아까 야놀자 예시를 든 표를 그대로 사용해서 위의 기준을 따라 적용시켜보면 아래와 같은 결과를 가져올 수 있다.

 

  1/1 (DAY 0) 1/2 ~ 1/4 (DAY 1-3) 1/5 ~ 1/7 (DAY 4-6)
기간내 방문 유저수 4 3 4
범위 리텐션 100% 75% 100%

확실히 아까와 다른 기준으로 적용하니까 리텐션 결과값이 달라진 것을 볼 수 있다.

 

이렇게 같은 값을 기준으로 계산을 해도 어떻게 산정하느냐에 따라 결과값이 달라질 수 있기 때문에 어떤 방법을 더 많이 쓴다던데.. 라며 따라하기 보단 우리 서비스의 특성상 주기적으로 오는지 확인하는게 좋겠어! 라는 기준을 명확하게 먼저 잡고 난 다음에 진행하는 것이 가장 이상적이다.

 

 

3. 이 외의 알아둘 것 모음

리텐션처럼 알아두면 좋을 것들을 추가로 정리해보고자 한다.

참고로 데이터리안에 있는 Stickiness는 정리가 워낙 잘되어 있어서 내가 이해한걸 기반으로 작성할 필요가 없어보여서 다른 부분만 찾아보고 정리한다.

진짜 활성 사용자수에 대한 내용부터 GA4를 간단하게 깨우치기에 좋은 글같아서 아래에 따로 링크를 남겨두도록 하겠다.

https://datarian.io/blog/stickiness

 

DAU, WAU, MAU 그리고 Stickiness 알아보기

유저들이 더 자주 접속하는 것이 중요한 비즈니스에서는 Stickiness 지표를 중요하게 봅니다.

datarian.io

 

 

3-1. 코호트 분석

먼저 코호트란 같은 기준으로 묶은 고객군을 말한다.앞에서 언급했던 오늘 가입한 고객군, 이벤트 기간에만 사용하는 고객군 모두 코호트고, 우리가 일반적으로 분류하는 성별과 연령대도 코호트이다.마케팅 분석에서 사용되는 코호트는 보통은 구매라던지 가입일자를 기준으로 많이 잡고, 어떤 광고를 통해 유입한것인지 조사를 요새는 다 하지 않나. 그 역시 코호트이다. 왜냐고? 성과를 비교할 수 있기 때문.

코호트 분석이란 같은 기준으로 나눈 고객 집단의 시간에 따른 행동 변화를 비교하는 분석이다.

코호트 분석은 누구를 기준으로 어떤 군집을 기준으로 묶을 것인지 / 특정한 이벤트 (구매, 방문, 특정 기능 사용 등) / 시간 (언제까지 남아있는지) 이 3가지를 유념해야 한다.리텐션과 다른 지표들을 분석하기 위해서 코호트 분석을 사용하는 것이지 코호트 분석이 리텐션 분석인 것은 아니다.시간에 따른 행동 변화를 비교해서 리텐션 변화의 원인을 추적하는 분석의 방법이다.

 

 

3-2. LTV

LTV는 고객이 서비스를 이용하는 동안 만들어내는 모든 가치를 의미한다.이 고객 가치를 코호트 분석을 이용해서 비교를 한다.고객 가치를 왜 확인하냐면 고객이 서비스를 이용하면서 만족한 행동으로 나타난 결과를 측정한다.그럼 만족도를 알면 되지 않냐? 의문이 들 수 있는데, 만족도는 그 서비스 자체를 평가하는 것이라면 가치는 그 만족도를 기반으로 비즈니스적으로 구매를 한다거나 활용을 하는지를 판단한다.한마디로 만족도는 서비스 평가, 리텐션은 지속적인 사용, LTV는 얼마의 가치를 남기는지를 알 수 있는 지표인 것이다.

 

 

3-3. 활성도

활성도는 사용자가 얼마나 자주, 얼마나 서비스를 활용하는지를 중심으로 둔다.즉, 방문이 중점이 아니라 방문 후 얼마나 가치있는 활동을 하는가를 중점으로 둔다는 것.이 활성도 지표를 빈도와 깊이로 나눌 수 있는데 이 중 빈도에 대한 이야기는 위의 데이터리안 고착도 본문을 참고하면 정말 쉽게 이해가 된다.그럼에도 이 부분을 추가한 이유는 활성도와 리텐션이 혼동될 수 있기 때문이다.리텐션은 얼마나 지속적으로 사용하는가라는 주기성을 가지고 남아있는 것을 계산하는 것이라면, 활성도는 적극성을 계산하는 것이라고 보면 된다.물론 리텐션도 방문을 기준으로 두지 않고, 구매라던지 컨텐츠 몇건 활용 등의 기준을 세우기도 하지만, 리텐션은 단순히 그 기준에 충족만 되면 OK이다.활성도는 반복도 반복이지만, 말그대로 얼마나 활용을 하는가에도 초점이 맞춰있기 때문에 엄연히 다르다.

 

 

3-4. 이탈율

이탈율은 말그대로 특정 기간동안 서비스를 떠난 고객의 비율이다.우리의 서비스를 이용하다가 어떤 부분이든 마음에 들지 않았다거나 다른 기업의 서비스가 더 좋다는 이유로 메리트를 따져서 얼마나 많이 떠났는지를 정확히 분석해내는 것이 개선에 가장 필요한 부분이다.같은 기준을 두고 같은 기간동안을 계산했을 때, 리텐션 값과 이탈율을 더하면 거의 100%가 될 수 있다.하지만 이 부분은 크게 중요한 것은 아니고, 이탈을 방지하는 것이 가장 중요하기 때문에 위험을 인식시키기 위해 이탈율이 몇 %라고 적시하는 것이 꽤나 성장하는데에는 도움이 되기에 적어본 내용이다.이탈율은 일정 기간동안 서비스를 떠난 사용자 비율이기 때문에, 리텐션의 보완 지표로 사용자 유지 문제를 직관적으로 파악할 수 있다는 것. 이 핵심만 알고 활용하면 좋겠다.

 

 

3-5. 전환율

전환율이란 사용자가 의도한 다음 단계의 행동을 수행한 비율을 나타낸다.아까 쿠팡플레이를 다시 예로 들자면 한 작품을 모두 정주행한 고객들이 비슷한 작품을 추천해서 띄웠을 때, 얼마나 넘어가는지를 확인할 때도 쓸 수 있다는 것.더 쉽게 말하면 GPT 무료 크레딧이 끝났다는 알림이 뜰 때, 유료로 결제하여 전환하는 사람들이 몇 %나 되는지 확인할래 하면 전환율을 계산하면 되는 것이다.전환율은 가장 빨리 개선 효과가 나타나는 지표로 순간적인 부분을 의미한다.이런 전환율이 중요한가? 여기에 대한 대답은 당연히 중요하다.그 이유는 광고를 통해 궁금해서 클릭한 사람들이 구매를 실제로 모두 하는가? 아니다.이렇게 유입 효율을 판단할 수도 있고, 퍼널별 병목 구간을 찾을 수도 있기 때문에 전환율 역시 중요한 지표가 된다.AARRR을 보면 각 퍼널이 모두 동일한 수치를 가지지 못한다.어느 구간에서 병목현상이 발생하는지 개선하기 위해서는 필요한 부분이다.

 

 

3-6. ROI

ROI는 투자 대비 성과가 얼마였는지를 숫자로 보여주는 지표로 내가 투자한 금액에 비해 얼마나 벌어들였는지를 알기 위해 활용한다.이미 잘되고 있는 부분을 고치기 보단, 병목 구간을 개선해서 ROI를 높이고, 의사 결정에도 필요한 부분이기 때문에 해당 기준 역시 중요한 부분이다.우리가 앞서 알아봤던 지표들이 모두 ROI 를 계산하는데에 필요하다.

 

 

반응형