분류 전체보기
-
인과관계 분석 방법론과 주의할 점 요약책으로 공부하기 2023. 4. 8. 11:46
"데이터 분석의 힘_ 그 많은 숫자들은 어떻게 전략이 되는가" 챕터마다 요약된 내용들을 그대로 적었습니다. 상황에 맞는 방법론이 구체적으로 쓰여있으니 아래 요약을 읽고 더 궁금하거나 깊이 알고 싶은 분들은 이 책 읽어보기를 추천드립니다. Chapter 1) 정말 광고가 아이스크림 매출을 올렸을까 : 데이터의 상관관계는 인과관계가 아니다 - 데이터 분석의 목적은 대개 '어떤 요인(X)이 결과(Y)에 영향을 미쳤는가?', 즉 'X→Y의 인과관계가 성립하는가'를 확인하는 것이다. - 인과관계는 상관관계와 다르다. 상관관계는 X와 Y가 서로 관계가 있음을 의미할 뿐이다. - 그러나 인과관계와 상관관계는 혼동될 때가 매우 많다. - 비즈니스 현장이나 정책 형성 과정에서 인과관계를 잘못 파악하면 판단 오류로 이어져..
-
인과관계 분석의 다양한 방법론과 책 후기책으로 공부하기 2023. 4. 8. 10:25
과거 이공계, 통계학과만의 영역이었던 데이터 분석이 다양한 직업의 종사자들과 대부분의 사람들에게 필수적인 역량이 되었습니다. 데이터 분석은 데이터 사이언티스트나 엔지니어들뿐만 아니라 의사결정을 하는 임원, 의사결정을 위한 보고 자료를 만들고 제안하는 직원, 미래의 방향을 찾고 어떤 시장이 유망할지, 어떤 고객이 어떤 물건을 좋아하는지 고민하는 사업자들 모두에게 필요한 역량이 되었습니다. 기술적인 데이터 수집이나 처리, 분석을 직접하지 않더라도 정확하게 읽고 "해석"하는 것은 말할 것도 없습니다. 데이터로 현실을 해석하는 것은 인과관계를 파악하여 미래의 사업 전략을 구체화하는 시발점입니다. 성공과 실패를 좌우하는 때로는 무섭기도 조심스럽기도 하고, 때로는 고맙고 중요한 부분이기 때문에 올바르게 설계하고 정..
-
[그로스 해킹] 가장 효율적으로 빠르게 마케팅으로 성공하는 법책으로 공부하기 2023. 4. 6. 01:19
디지털 마케팅을 하는 저로서는 그로스 해킹에 관한 책을 꼭 한번 읽어보고 싶었습니다. 다른 기업들은 어떠한 과정의 흐름속에서 고객을 파악하고 전략을 구체화시켜나갔을까? 그로스해킹은 기존의 마케팅에 기술적인 요소를 결합하고, 철저한 데이터분석 및 과학적인 실험으로 성과 측정을 통해 의사결정을 하며 고객을 끌어들이고 나의 고객으로 만드는 마케팅 방법입니다. (저자 왈 : 그로스 해커는 전통적인 마케팅 교본을 버리고 그것을 검증 가능하고, 추적 가능하며, 확장 가능한 방법만으로 대체하는 사람이다. 그들은 광고, 홍보, 돈 대신 이메일, 클릭 당 지불 광고, 블로그, 플랫폼 API를 도구로 사용한다. 마케터들이 브랜딩, 마인드 공유와 같은 모호한 개념들을 추구하는 반면, 그로스 해커들은 이용자와 함께 끊임없이 ..
-
[HIVE SQL] 내장함수(Bulit-in Function) 확인하기 + 파이썬은 덤SQL 배우기 2023. 3. 27. 22:36
내장함수란 말 그대로 이미 내장된 함수를 의미합니다. 데이터베이스 관리자가 자주 사용되는 함수를 만들어놓은 것이기 때문에 알고 있으면 빠르고 편하게 사용할 수 있습니다. [Hive 에서 Built-in 함수 확인하기] SHOW FUNCTIONS; -- 함수, 테이블, 데이터베이스의 목록 확인 DESCRIBE FUNCTION weekofyear; tab_name : weekofyear(date) - Returns the week of the year of the given date. A week is considered to start on a Monday and week 1 is the first week with >3 days. DESCRIBE FUNCTION EXTENDED weekofyear; Py..
-
행과 행의 관계를 쉽게 계산해주는 윈도우 함수 Window Function [SQL]SQL 배우기 2023. 3. 18. 13:18
Window Function 행과 행 간의 관계를 쉽게 정의하기 위해 만든 함수 (예, 그룹 내 순위, 집계, 순서, 비율) - 그룹 내 순위 관련 함수 : RANK, DENSE_RANK, ROW_NUMBER - 그룹 내 집계 관련 함수 : SUM, MAX, MIN, AVG, COUNT - 그룹 내 행 순서 관련 함수 : FIRST_VALUE, LST_VALUE, LAG, LEAD - 그룹 내 비율 관련 함수 : CUME_DIST, PERCENT_RANK, NTILE, RATIO_TO_REPORT 특징 - 윈도우 함수에는 OVER 문구가 필수로 포함된다. window_function (arguments) over(partition by 컬럼 order by 컬럼) - window_function 뒤에, ..
-
분석의 가장 기본 : 변수 특성 확인하고 적절한 분석 방법론 찾기책으로 공부하기 2023. 3. 18. 12:34
변수의 특성을 파악하는 것은 데이터 분석의 가장 기본입니다. 변수의 특성을 확실히 알아야 데이터를 이해할 수 있고 올바른 통계 분석 기법을 선택할 수 있습니다. 1. 변수의 특성 확인하기 2. 올바른 분석 방법론 선택하기 ※ 참고 : 데이터 분석 두 가지 접근법 1. 확증적 데이터 분석 : 가설을 설정한 후, 수집한 데이터로 가설을 평가하고 추정하는 전통적인 분석 - 추론 통계(수집한 데이터를 이용하여 추론하는 통계 기법으로 신뢰구간 추정, 유의성 검정 기법 등을 이용함) 2. 탐색적 데이터 분석 : 원 데이터를 가지고 유연하게 데이터를 탐색하고, 데이터의 특징과 구조로부터 얻은 정보를 바탕으로 통계 모형을 만드는 분석 방법 - 기술 통계(수집한 데이터를 요약 묘사 설명하는 통계 기법으로 데이터의 대표값..
-
나도 데이터 해결사가 되고 싶다면? [감으로만 일하던 김팀장은 어떻게 데이터 좀 아는 팀장이 되었나]책으로 공부하기 2023. 3. 18. 12:10
실무 비즈니스를 하면서 보던 것만 보고, 관련된 것만 읽고 공부하다보니 가끔 통계학적 용어나 이 상황에서는 어떤 모형을 쓰는 것이 적절한지 판단이 되지 않을 때가 있습니다. 그래서 잊고 있던 통계학적 기본 지식들을 다시 훑어보기 위해 책을 읽기로 결심했습니다. 이 책은 궁금하지만 물어보기 부끄러웠던 질문들, 기본적이지만 막상 질문이 들어오면 대답을 하지 못할 것 같은 문제들도 대화 상황을 통해 친절히 설명해주고, 계산식 없이 이해를 돕기 위해 재밌게 풀어내고 있어서 누구든지 읽기 편하고 기초를 다지는데 도움될 것입니다. 더욱이 대화 상황이 비즈니스에서 이루어지고 있어서 조직에서 데이터를 어떤 상황에 이용하고 어떻게 문제를 해결하는지를 알 수 있어서 분명 일하고 의사결정하는데 도움이 될 것입니다. 최근에 ..
-
[김팀장 3부] 데이터로 비즈니스를 혁신하기책으로 공부하기 2023. 3. 18. 11:27
- 추천 시스템 사례 : 넷플릭스에서 영화 시청의 3분의 2가 추천 시스템으로 발생한다. 아마존에서 팔린 상품의 3분의 1은 추천 시스템에 의한 것이다. 구글 뉴스도 추천 뉴스를 클릭해서 보는 비율이 대략 38%이고, 링크드인에서 입사 지원의 절반이 추천 시스템에 의해 발생한다. - 추천 시스템이 추천하는 것 : 대체재, 보완재, 베스트셀러 (기본이 중요. 상품군별 등 특성으로 나눠서 구분해서 보여주면 베스트 셀러가 가장 효과가 좋음. 따라서 상품의 카테고리를 잘 정비하는 것이 중요) - 사용자 기반 : 상품 간 유사도 비교 (피어슨 상관계수), 사용자가 많아지면 계산하는데 시간이 너무 많이 걸리고, 그 시간을 줄이려면 IT 비용이 많이 든다. 그래서 추천 결과를 계산하는 시간과 비용을 줄이기 위해 아이..