안효진 / 우수 고객 분류 & 고객 데이터 분석 프로젝트
이 프로젝트의 Tech Stack
decision-treejupyter-notebookpythonpandasscikit-learnmatplotlibseabornrandom-forestmachine-learninglinear-regression
우수 고객 분류 & 고객 데이터 분석 프로젝트
회원 DB를 이용하여, 신규회원이 가입할 때 우리 서비스의 우수고객이 될 가능성을 판별합니다. 또한 입력받은 회원 데이터를 이용해 그들에게 적합한 상품을 추천할 수 있도록 추가적인 정보(신체사이즈)를 예측합니다.
2019년 12월 1일 ~ (진행중)
Tech Stack
  • decision-tree
  • jupyter-notebook
  • python
  • pandas
  • scikit-learn
  • matplotlib
  • seaborn
  • random-forest
  • machine-learning
  • linear-regression
    Project 세부내용

    우수 고객 분류 & 고객 데이터 분석 프로젝트

    회원 DB를 이용하여, 신규회원이 가입할 때 우리 서비스의 우수고객이 될 가능성을 판별합니다. 또한 입력받은 회원 데이터를 이용해 그들에게 적합한 상품을 추천할 수 있도록 추가적인 정보(신체사이즈)를 예측합니다.

    수행기간: 2019년 12월 (2주)
    특징: 회원 DB 이용을 위한 실전형 소규모 모의 프로젝트

    우수 고객 분류하기

    이 프로젝트는 운동화 판매회사의 고객분석팀에 재직중이라 가정하고 진행하였습니다.

    회원의 DB를 가져옵니다.

    a1.jpg 기존 회원의 우수고객분류, 나이, 성별, 지역, 관심사를 가져와 학습하여 우수고객을 판단합니다.

    우수고객 여부를 판별합니다.

    a2.jpg 기존의 회원DB로 우수고객 판별이 가능한 모델을 만들고, 이를 이용해 이후 가입하는 신규회원들의 우수고객 전환 가능성을 판별합니다. 우수고객으로 판단될 시에 해당 고객에 대한 보다 집중적인 케어가 가능해져 서비스의 품질이 올라갈 것으로 기대됩니다.

    고객 데이터 예측하기

    회원의 DB를 가져옵니다.

    b1.jpg 회원의 적합사이즈, 나이, 출장수, 키, 몸무게 데이터를 가져와 학습하여 신체 적합사이즈를 예측합니다.

    신체 데이터를 얘측합니다.

    b2.jpg 신체 적합사이즈를 기입하지 않은 회원들에게 적합한 사이즈를 자동으로 추천해주어 알맞는 상품이 노출되도록 서비스를 개선할 수 있습니다.

    한계점 확인 및 개선

    • 다량의 데이터 확보
    • 보다 철저한 사전 탐색 및 분석 작업
    • validation set, test set 작업을 통한 신뢰할 수 있는 모델 성능 평가
    • 효율적인 학습을 위한 Feature 고안

    습득

    • 주도적인 데이터 분석 수행 및 머신러닝 모델 설계
    • 머신러닝 시스템의 실제 활용 경험
    • 머신러닝 이해(classification, regression...)
    • 파일럿 분석의 이점 확인