-
나도 데이터 해결사가 되고 싶다면? [감으로만 일하던 김팀장은 어떻게 데이터 좀 아는 팀장이 되었나]책으로 공부하기 2023. 3. 18. 12:10
실무 비즈니스를 하면서 보던 것만 보고, 관련된 것만 읽고 공부하다보니 가끔 통계학적 용어나 이 상황에서는 어떤 모형을 쓰는 것이 적절한지 판단이 되지 않을 때가 있습니다. 그래서 잊고 있던 통계학적 기본 지식들을 다시 훑어보기 위해 책을 읽기로 결심했습니다.
이 책은 궁금하지만 물어보기 부끄러웠던 질문들, 기본적이지만 막상 질문이 들어오면 대답을 하지 못할 것 같은 문제들도 대화 상황을 통해 친절히 설명해주고, 계산식 없이 이해를 돕기 위해 재밌게 풀어내고 있어서 누구든지 읽기 편하고 기초를 다지는데 도움될 것입니다. 더욱이 대화 상황이 비즈니스에서 이루어지고 있어서 조직에서 데이터를 어떤 상황에 이용하고 어떻게 문제를 해결하는지를 알 수 있어서 분명 일하고 의사결정하는데 도움이 될 것입니다.
최근에 로지스틱 회귀를 사용하여 마케팅 반응율을 예측하는 모형을 만들었습니다. 옆자리에 앉으신 분이 "왜 회귀를 쓰지 않고 분류를 쓰나요?" 여쭤보았습니다. 그때는 "결과가 0과 1로 나오기 때문에 회귀가 아닌 분류를 사용합니다."라고 하였는데 이 책을 읽으니 "반응여부는 반응했다와 하지 않았다 두 가지 경우로 나옵니다. 하지만 그 결과를 딱 부러지게 알 수 없으니 반응을 확률로 보여주는 것입니다. 그래서 범주형으로 나오는 것은 회귀가 아닌 분류로 풀어야합니다. 범주형으로 나오는 분류 방법론에는 로지스틱 회귀, 판별 분석, 서포트 벡터 머신, 의사결정나무, KNN 등이 있습니다. 결과값인 반응율이 0보다 작거나 1보다 크면 문제가 생기니 0~1사이의 값으로 나와야하고 그렇기 때문에 로지스틱 함수를 사용합니다. S자 곡선처럼 생겨서 Y값이 0과 1사이에 존재하도록 만들어줍니다." 라고 했으면 완벽했겠다 라고 생각했습니다.
왜냐하면 똑같은 상황이 '6.로지스틱 회귀'에서 다루어지고 있었습니다. 이처럼 실제 실무에서 충분히 경험할 수 있는 데이터 관련 문제들을 쏙쏙 뽑아 잘 다루어주셔서 분야나 직급에 상관없이 읽어보셔도 좋을 것 같습니다.
많은 기업들이 데이터를 기반으로 의사결정하고 인공지능 등을 활용하여 서비스를 하고 있기 때문에 우리 모두 끊임없이 노력하고 발전하고 트렌드에 뒤쳐지지 않게 공부합시다~! 화이팅!
'책으로 공부하기' 카테고리의 다른 글
[그로스 해킹] 가장 효율적으로 빠르게 마케팅으로 성공하는 법 (0) 2023.04.06 분석의 가장 기본 : 변수 특성 확인하고 적절한 분석 방법론 찾기 (0) 2023.03.18 [김팀장 3부] 데이터로 비즈니스를 혁신하기 (0) 2023.03.18 [김팀장 2부] 더 다양한 분석 방법론과 기술통계량 (0) 2023.03.18 [김팀장 1부] 전통 통계학 방식으로 분석 결과 해석하기 (0) 2023.03.18