데이터 분석 리포트를 작성하기 전, 내가 지금 어떤 종류의 데이터를 가지고 있는지부터 파악하면
'가능한 것', '불가능한 것'을 명확히 할 수 있습니다.
이번 글에는 데이터를 크게 두 가지로 나누고 그 특성을 알아보겠습니다.
우리가 '옷을 구매할 때'를 상상해 볼까요?
1. 구매자는 온라인에서 띄워주는 광고를 보고 옷에 관심을 가진다.
2. 구매자는 온라인, 오프라인에서 옷을 산다.
두 단계로 간단하게 요약이 가능합니다. 하지만 이 과정에서도 데이터는 발생합니다.
1번 과정에서 구매자가 광고를 보고 구매 사이트를 접속할 때
2번 과정에서 구매자가 옷을 구매하고 pos기로 계산할때
1번 데이터를 '업무에 직접적으로 필요하지 않지만 분석을 위해 추출해야 하는 데이터'
2번 데이터를 '업무에 필요한 데이터'라고 정리할 수 있겠네요.
이 글에선 전자는 '업무 데이터' 후자는 '로그 데이터'라고 정의하겠습니다.
업무 데이터
앞서 말했듯이 업무 데이터는 '업무에 필요한 데이터'입니다.
이 업무 데이터의 특징은 '갱신형 데이터'라는 특징입니다.
옷의 가격 변동이 있을 때 새로운 데이터를 삽입하는 대신 기존의 데이터를 갱신합니다.
이러한 업무 데이터는 다시 두 가지로 나뉩니다.
- 트랜잭션 데이터
- 마스터 데이터
트랜잭션 데이터란?
서비스와 시스템을 통해 사용자의 행동을 기록한 데이터입니다.
데이터에는 날짜, 시각, 마스터 데이터의 회원 ID, 상품 ID, 수량, 가격 등이 포함됩니다.
구매 데이터, 리뷰 데이터, 게임 플레이 데이터 등이 있습니다.
이러한 트랜잭션 데이터를 기반으로 리포트는 작성됩니다.
하지만 데이터에 회원 ID는 있지만, 이 회원이 어떤 특성을 가졌는지 알 수 없습니다.
따라서 '마스터 데이터'가 필요합니다.
마스터 데이터란?
서비스와 시스템이 정의하고 있는 데이터입니다.
트랜젝션 데이터의 회원 ID 만으로는 회원이 남성인지 여성인지, 어디 사는지 알 수 없습니다.
따라서 트랜젝션 데이터의 상품 ID와 마스터 데이터를 결합해서,
상품 이름, 상품 카테고리 발매일 등을 명확하게 해야 합니다.
업무 데이터를 다루는 법
그렇다면 분석가는 업무 데이터를 어떻게 다뤄야 할까요?
분석가는 업무 데이터의 특징을 정확히 파악해야지, 좋은 분석을 할 수 있습니다.
다음은 업무 데이터의 특징과 데이터 분석가의 분석법입니다.
1. 데이터의 정밀도가 높다. -> 정확한 값이 요구되는 매출 관련 리포트를 사용할 때 쓰자!
2. 갱신형 데이터이다. -> 데이터 추출 시점에 따라 결과가 변할 수 있다!
업무 데이터에 문제가 생겼을 경우 트랜잭션과 롤백 기능으로 문제를 해결할 수 있습니다.
이것으로 데이터의 정합성이 매우 높은 것이 특징입니다.
하지만 데이터가 자주 갱신되므로, 데이터 추출 시점에 따라 결과가 변할 수 있으니 분석가는 이 점을 유의해야 합니다.
사실 업무 데이터만으로도 비즈니스를 할 수 있습니다. 구매만 할 수 있으면 되기 때문입니다.
하지만 우리는 돈을 더 벌기 위해 '서비스의 방문 횟수', '페이지뷰', '사용자 유도' 등을 해야 합니다.
이때 사용되는 것이 로그 데이터입니다.
로그 데이터
'업무에 직접적으로 필요하진 않지만 분석을 위해 추출해야 하는 데이터'입니다.
업무 데이터와 다르게 로그 데이터는 '누적형 데이터'이며 사용자의 정보가 변경되어도 데이터를 수정하지 않습니다.
로그 데이터엔 '시간, 사용자 엔드포인트, IP, URL, Cookie' 등의 정보를 저장하고,
추출 방법에 따라 데이터의 정밀도가 달라지기도 합니다.
다소 정제되지 않은 듯해 보이는 로그 데이터도 분석가는 적절하게 다뤄야 합니다.
로그 데이터를 다루는 법
1. 접근 분석도구를 함께 사용해 방문 횟수, 페이지뷰, 액션 수, 장치별 방문수 등의 지표를 구할 때 사용!
( 이전 글의 구글 애널리틱스를 생각해 보시면 됩니다.)
2. 기간을 지정하여 집계할 때 추출 결과가 변화지 않음을 활용
3. 크롤러의 로그가 함께 포함될 수 있으니 주의!
두 데이터를 함께 활용한다면?
지금까지 업무 데이터와 로그 데이터의 정의와 특징, 분석가가 데이터를 다루는 법을 알아보았습니다.
이 두 데이터를 함께 사용한다면
'웹사이트에서의 행동이 오프라인의 행동에 어떠한 영향을 미치는지' 등을 조사할 수 있습니다.
예를 들어 특정 미디어 또는 광고로 유입된 사용자가 오프라인에서 계약할 가능성이 더 높다면, 해당 미디어와 광고를 더 활용할 수 있을 것입니다.
더하여, 분석가는 데이터를 활용해 사용자와 서비스에 가치를 제공해야 합니다.
가치 있는 데이터 분석의 예로는 무엇이 있는지를 간단히 설명하고 글을 마치겠습니다.
- 목표를 관리하고, 설계하고, 서비스 조직의 성장에 기여하기 [목표 관리]
- 사용자 행동을 기반으로 경향을 발견하고, 매출과 서비스 개선에 기여하기 [서비스 개선]
- 과거의 경향을 기반으로 미래의 행동 예측하기 [미래 예측]
<데이터 분석을 위한 SQL 레시피>를 각색한 글입니다.
데이터 분석가가 되기 위해 공부하는 분들에게 좋은 길잡이가 되었으면 좋겠습니다.
'Specialist > Marketing' 카테고리의 다른 글
에이블리(ABLY)의 "샥-출발" - AARRR 분석 (0) | 2022.08.19 |
---|---|
AARRR이란? (0) | 2022.08.05 |
그로스 해킹이란? - 리그 오브 레전드와 오버워치의 차이점 (0) | 2022.06.05 |
데이터의 등장과 발전, 엔지니어와 분석가의 과제 (0) | 2022.04.26 |
통계학 기초 복습 (0) | 2022.03.25 |
댓글