패널 조사 데이터를 기반으로 패널의 라이프스타일을 지정후 신규 패널에 대한 라이프 스타일에 대한 값을 랜덤포레스트 방식을 사용해 예측.
1인 개발.
k클러스터를 이용해 앱사용 패널에 대한 헤비,미들,라이트 유저로 군집을 분류해 각 앱의 집군들의 행태를 파악하도록 데이터를 가공.
sql 작성 및 R script 작성.
패널 모바일 기기에서 트래킹한 데이터를 가공해 fact, summary 성 테이블에 데이터를 생성. 생성 된 데이터로 모바일 기기 이용자의 앱사용에 대한 실태를 제공
배치에 필요한 SQL을 작성하고 최적의 SQL이 실행 되도록 튜닝.
배치 프로그램 전반적인 설계
파이썬 BeautifulSoup과 Selenium을 이용해 신규 안드로이드 앱에 대한 정보를 구글 스토어에 웹크롤링을 통해 DB 업데이트 .이 정보를 가지고 배치에서 활용.
1인 개발