전체 글
-
[머신러닝] feature importance 의 특징과 장단점머신러닝 배우기 2023. 12. 4. 11:44
보통 트리 기반의 모델을 학습한 후 feature importance 를 확인하는 코드를 많이 보셨을 겁니다! 직관적으로도 알 수 있듯 특성의 중요도를 나타내는 지표입니다. 뜻이 너무 직관적이기 때문에 오히려 자세히 알아보지 않고 넘어가는 경우가 많습니다. 하지만 feature importance의 특징을 통해 머신러닝의 특징까지 확장하여 개념을 단단히 할 수 있다는 사실! 오늘은 그런 feature importance 라는 지표에 대해 정확하게 알아보겠습니다! ▶︎ Feature Importance 란? : 머신 러닝 모델에서 독립변수가 종속 변수에 영향을 미치는 정도를 나타내는 지표 : 모든 변수들이 정규화된 Linear Model에서는 y = a₁x₁ + a₂x₂ + a₃x₃ + ・・・ + b 변수..
-
[통계] 상관계수 총정리! 피어슨과 스피어만 상관계수 차이 비교머신러닝 배우기 2023. 11. 27. 15:25
상관계수란, 두 변수 간의 관계의 강도와 방향을 측정하는 통계적인 지표입니다. 일반적으로 데이터의 특성에 따라 피어슨 상관계수 또는 스피어만 순위 상관계수 중 선택합니다. 오늘은 상관계수와 자주 사용하는 피어슨/스피어만 상관계수에 대해서 확실히 짚고 넘어가보도록 하겠습니다! 1. 상관계수 정의 : 두 변수 간의 관계의 강도와 방향을 측정하는 통계적인 지표 2. 상관계수 분석 시 주의할 점 : 두 변수 간의 선형적인 관계를 측정하기 때문에 다른 형태의 관계를 감지하지 못할 수 있다. : 인과관계를 나타내지 않으며, 두 변수 간의 관계가 우연에 의한 것일 수도 있다. 따라서 상관계수를 해석할 때 주의가 필요하다. 3. 상관계수 종류 : 상관계수에는 여러 종류가 있으며, 데이터의 특성과 분석 목적에 따라 적절..
-
[그로스해킹] 성공은 고객과 제품을 이해하는 것에서 시작된다책으로 공부하기 2023. 11. 27. 13:12
"그로스해킹". 디지털마케팅을 하면서 여러 번 들어봤지만, 그로스해킹이 무엇이고 어떻게 쓰이는지 제대로 공부해본 적이 없었다. 매번 책 한번은 읽어봐야지~ 하다가 이번에 읽게 되었는데, 디지털 마케팅에서 데이터 분석을 하는 나에게는 너무 필요했었고, 내가 무엇을 어떻게 왜 해야하는지 한 번에 정리해주는 책인 것 같아서 좋았다. 데이터 분석, 마케팅, 스타트업, 개인 사업자들에게 성공을 위한 길잡이로써 추천해보는 책입니다. 이 책은 성공하는 법! 에 대해 알려주지 않습니다. 물론 많은 사람들이 각자의 산업의 특성과 업종, 하는 일, 프로덕트가 다른데 성공하는 법을 하나로 단언해서 알려준다면 그것이 오히려 말이 안되는 것일 것 같습니다. 각자가 만드는 제품과 환경이 모두 다르기 때문에, 성장에 대한 전략도 ..
-
[그로스해킹] 고객을 이해하기 위한 이론 (2) 코호트 분석책으로 공부하기 2023. 11. 27. 12:50
1. 코호트 분석의 정의 : 같은 인자를 공유하는 집단을 분석하는 것. : 서로 다른 집단의 분석을 통해 제품의 변화 개선을 직관적으로 파악할 수 있다. : 예) 각 주별 가입한 사용자들이, 가입 후 1주가 경과할 때마다 서비스에 남아있는 비율 분석. 몇 주가 지났을 때 얼만큼의 비율이 남아 있는지를 확인 할 수 있고 각 주에 따라 가입율 및 유지율의 차이가 있는지를 확인하면서 무엇이 다른지를 파악하고 이를 개선할 수 있다. (예로는 마케팅 채널이 달랐는지, 화면 UIUX 차이는 없었는지 등) 2. 코호트 분석 시 주의할 점 : 제품의 특성과 가치에 따라 코호트 시간 단위를 적절하게 설정할 수 있어야 한다. 예를 들어 메시징 플랫폼이면 하루에도 여러 번씩 사용하기 때문에 단위를 데일리로 하는 것이 적절하..
-
[그로스해킹] 고객을 이해하기 위한 이론 (1) AARRR책으로 공부하기 2023. 11. 27. 12:11
1. AARRR 정의 : 사용자가 서비스를 최초로 인지하여, 첫 사용을 하고, 나중에 또 사용을 하러 와서, 매출도 발생시키고, 주변 사람들에게 써보라고 추천라는 과정을 단계적으로 나누어 분석하는 것. 각 단계별로 사용자들이 얼마나 남아 있는지를 분석하는 기법.(= 깔대기 분석) A Acquisition 사용자들이 어떻게 당신의 제품을 처음 접합니까? A Activation 사용자들이 첫 사용에서 멋진 경험을 합니까? R Retention 사용자들이 당신의 제품을 다시 사용합니까? R Revenue 당신의 제품은 어떻게 돈을 법니까? R Referral 사용자들이 다른 사람에게 당신의 제품을 이야기 합니까? 2. AARRR 주의할 점 : AARRR 개념을 나의 제품에 끼워 맞추면 안된다. 제품의 가치에 ..
-
[SQL] Primary key 쉽고 완벽하게 이해하기SQL 배우기 2023. 11. 27. 10:43
릴레이션 모델을 논리적 스키마로 표현할 때, contacts(id, name, email, phone, score) 밑줄이 그어진 속성을 보신 적이 있을 겁니다. 이것은 릴레이션에서 primary key를 표현하는 방법인데요, 릴레이션에서 가장 중요한 키는 primary key가 아닐까 감히 확신해봅니다! 오늘은 이렇게 중요한 primary 키에 대해서 알아보겠습니다. - primary key 의 정의 - primary key 의 특징 - 테이블 생성시 primary key 지정하는 두 가지 방식 Q. primary key 의 정의 A. candidate key 중에서 릴레이션의 특정 행을 고유하게 식별하기 위해 DBMS에서 선택하여 사용하는 키 (▶︎ candidate key : 릴레이션에서 특정 행을..
-
[SQL] Self join 셀프조인 완벽 이해하기SQL 배우기 2023. 11. 24. 19:09
조인(JOIN)은 A테이블에는 c라는 데이터가 없지만, B테이블에는 c라는 데이터가 존재하여 B에서 c라는 정보를 가져올 때, 주로 사용합니다. 하지만 A 테이블에 c라는 정보가 있지만, 직접적인 관계는 아니라서 바로 사용을 할 수 없다면? 즉, 같은 테이블에 정보는 충분한데 그게 열로써 나타나있지 않아서 다른 행에서 불러와야할 때! 즉, 한 테이블에 존재하는 컬럼(column) 사이에 관계가 존재할 때 → 그럴 때 사용하는 것이 바로 셀프 조인(Self-join) 입니다! 셀프 조인은 하나의 테이블이지만 복사를 하여 역할을 다르게 부여하는 개념이기 때문에 무조건 별칭을 부여해서 어떤 테이블인지, 어떤 테이블에서 불러온 컬럼인지를 명시해주어야합니다. 간단한 예제로, 셀프 조인을 이해해봅니다! employ..
-
[파이썬] 파이썬에서 SQL 실행하기 (sqlite3)파이썬 배우기 2023. 11. 24. 18:38
sqlite3라는 라이브러리를 사용하여 파이썬에서 sql을 실행해보려고 합니다. sqllite3는 파이썬에 기본적으로 내장되어 있기 때문에 바로 import 해서 사용하실 수 있습니다. 실행하기 전에 connect() 라는 함수로 데이터베이스랑 연결을 하고, cursor()를 활용해 데이터베이스에서 이것저것 실행할 수 있게 명령어를 db에 전달하여 정보를 가지고 오도록 하고, 중간중간에 연결된 DB파일에 저장을 해준다거나(commit) 저장시점으로 되돌아가거나 (rollback) 연결을 끊어줄 수도 있습니다(close). 기본적인 예제를 실행해보도록 하겠습니다. 실행해볼 기본적인 단계는 아래와 같습니다. 1. 파이썬에서 데이터베이스에 연결하기. 2. 테이블을 만들고 데이터 삽입 3. 테이블 확인 4. ..