Specialist/Project

[디스이즈] 앱 로그 데이터 분석 프로젝트 [3]

홍원 2022. 10. 8. 18:47

이전 과정

 

[디스이즈] 앱 로그 데이터 분석 프로젝트 [2]

이전 과정 [디스이즈] 앱 로그 데이터 분석 프로젝트 [1] 이전 과정 [디스이즈] 앱 사용자 데이터 분석 프로젝트 [시작] 1. 디스이즈란? 디스이즈는 동아대학교 컴퓨터공학과 개발팀이 만든 '동아

khw742002.tistory.com

  • 1차 로그 설계
  • 추가 회의
  • 문제 해결
  • 최종 로그 설계

1. 리뷰 텍스트 데이터 분석

(1) 리뷰 크롤링

개요

개발 팀이 충분한 공부 시간을 가지고 정확한 로그 개발을 하는 것을 대기하며,

과거부터 현재까지의 디스이즈가 사용자에게 어떤 경험을 주었을지 알아보기 위해 앱 리뷰 텍스트 분석을 진행하였습니다.

  • 크롤링 도구 : UI Path
  • 크롤링 내용 : 플레이 스토어 - 디스이즈 리뷰 

크롤링 프로세스

  1. Flow chart 클릭
  2. 엑티비티 검색 ➡️ Sequence 클릭
  3. Flow chart에서 데이터 크롤링과 생성한 Sequence 연결
  4. 액티비티 검색 ➡️ Excel Application Scope 클릭
  5. Excel Application Scope에서 저장할 엑셀 파일을 선택
  6. 액티비티 검색 ➡️ Write Range, 실행에 드래그 앤 드롭
  7. Write Range 속성에서 데이터테이블(dt) 입력
  8. Write Range 속성에서 Add Headers 콤보 박스 체크
  9. 파일 디버그 ➡️ 실행 클릭 ➡️ 실행 완료 후 엑셀 파일 확인

크롤링 결과

  • 데이터 수 : 112 행
  • Date 열 : 2015년~2022년
  • Review 열 : 리뷰 텍스트 내용

(2) 분석

전처리

  • 분석 툴 : R
  • 전처리 내용 : 데이터 형식 변환, 텍스트 전처리(한글외의 문자 삭제)를 한 뒤 티블화 하였습니다. 


일자 별 리뷰 개수

연도 별 , 월 별 리뷰 개수 분석을 통해 사용자가 리뷰를 꾸준히 남기고 있는지 알아보겠습니다,

  • 연도 별 리뷰 개수 : 2016~2022 = 49개 < 2015 = 63개
  • 월 별 리뷰 개수 : 2015연도 중에서도 출시월인 3월에만 리뷰 수가 집중적임

18학번인 제 입학 시기엔 디스이즈 어플이 학생들의 입소문을 타고 있었지만, 전역 후 디스이즈 어플은 아무도 알지 못했습니다. 그리고 이는 리뷰 수를 통해 정확히 나타났습니다.


빈도 분석

각 리뷰에는 어떤 단어가 많이 나왔는지 알아보기 위해 빈도 분석을 진행하였습니다.

  • 2015 ~ 2019 : 정보, 유용, 편리 등
  • 2020 ~ 2021 : 기능, 버스, 최고, 무쓸모인듯 등

2019년 이후 앱 리뉴얼이 있었다는 소식에, 2020년을 기준으로 나누어 보았습니다. 2020년 이후 리뷰 수가 적어 아쉽지만, 기능, 버스의 언급이 2년에 걸쳐 있었고 무쓸모인듯 vs 최고로 의견이 나뉘는 양상도 보였습니다. 하지만 팀을 향한 단순 응원성 리뷰보다는 사용자의 서비스 유용성을 나타낸 리뷰가 더 중요하다고 판단되었기에, '무쓸모인듯' 이란 단어는 치명적이라고 판단됩니다.


감성 분석

  • 리뉴얼 전 - (긍정 : 편리, 감사, 최고, 성공), (부정 : 오류), (중립 : 유용)
  • 리뉴얼 후 - (긍정 : 최고, 감사) , (부정 : 잘못)

리뉴얼 전에 있던 긍정어인 편리, 성공이 리뉴얼 후에 빠졌습니다. 그리고 리뉴얼 전에 있던 '유용' 중립 단어가 (하지만 가장 중요한) 리뉴얼 후에 빠지게 되었습니다. 마지막으로 부정어는 리뉴얼 이전 오류, 리뉴얼 이후 잘못이라는 단어로 변경되었습니다.

정리하자면 앱 리뉴얼로 오류를 잡았으나, 서비스 유용성이 크게 줄어들었습니다.

학생들에게 편리를 주는 것이 목적인 어플인만큼 리뉴얼 후의 사용자 반응은 매우 부정적이라고 판단됩니다.

 

사용자와 개발팀 사이 윤활제 역할을 할 저희 데이터팀이 꼭 필요한 상황이었습니다.


2. 앞으로의 방향

로그 개발 및 수집

로그 개발 및 수집이 많이 지연된 것은 사실입니다. 개발팀 대부분이 로그에 대한 지식이 부족했기에, 개발 툴 및 수집 방법 공부에 시간이 많이 걸렸고,  코로나 이후 사실상 개발 연습용 앱이 되어버렸기에, 마케팅 및 사용자 데이터 중심 의사결정의 동력이 떨어졌습니다.

하지만 이것은 개발팀만의 문제는 아니라고 생각합니다. 저희 데이터팀 역시 개발팀과 적극적인 커뮤니케이션 없이 '개발 잘하겠지..'라며 마냥 대기한 것이 큰 문제였고, 개발 지식 역시 전무했던 것도 사실입니다.

그래서 결정한 절충안으로 앱에 Firebase Analytics를 설치하여 로그 개발 및 수집을 비교적 간편하게 진행하기로 결정했습니다.  하지만 이것이 더 나쁜 방법은 아닙니다. Firebase + GA4의 분석 능력이 현재의 저희보다 실력 좋은 것도 사실이고, Bigquery 와의 연동으로 raw data 역시 자유롭게 핸들링할 수 있을 것이라 예상됩니다.


데이터 팀은?

개발 대기 기간 동안 생각해낸 데이터팀의 추후 계획입니다.

  • 현시점 디스 이즈 사용자 수 분석
  • OMTM 지표 선정
  • 지속적 마케팅으로 사용자 유치(UTM을 사용한 사용자 유입 경로 로그 확보)
  • 사용자가 주로 사용하는 기능과 사용하지 않는 기능 파악
  • 사용자의 앱 여정 분석
  • 주 사용자 층인 동아대학교 학생이 디스이즈 어플에 필요로 하는 기능 파악 (ex : 선배와의 연결, 취업수기, 밥 친구 찾기 등등)
  • 디스이즈 어플의 핵심 기능 분명화하기(aarrr 중 activation의 중요성)
  • 분석 내용 기반 앱 A/B test 후 업데이트 기획

정리

이번 글에는 프로젝트의 정체 시기에 있었던 일들을 정리하였습니다.

글에는 저희의 고생이 보이진 않지만 정말 다사다난했습니다. 이번 기간에 팀 간 커뮤니케이션의 중요성을 알게 되었습니다. 팀별로 나뉘는 것이 아닌 스쿼드 형식(개발 1명, 데이터 1명) 진행을 고려하는 것도 좋아 보입니다. '미드 라이너만 있는 팀', '정글러만 있는 팀'은 오래가지 못할 것이니까요. 

하지만 캠퍼스가 달라 앱 출시(2015년) 이후부터 아무 접점이 없던 컴퓨터공학과와 경영정보학과가, 지속적으로 협동할 초석을 만든 중요한 기간이었다고 생각합니다. '8년의 벌어짐'을 '2달 만에 풀칠'한 거면 잘했다고 칭찬해주고도 싶습니다. 


끝까지 보신 분들을 위해 분석 코드 공개합니다 :) 깃허브에서 확인해주세요.

 

GitHub - hongwon2/R--text-analysis: 텍스트분석 레파지토리

텍스트분석 레파지토리. Contribute to hongwon2/R--text-analysis development by creating an account on GitHub.

github.com