전체 글
-
[Mac] Homebrew 설치하는 법정보공유 경험나눔 2024. 1. 10. 12:40
Mac 을 사용하시면 프로그램이나 패키지를 설치할 때 brew ~ 로 하라는 검색 답변 내용을 많이 보셨을 겁니다. Homebrew란, 터미널에서 명령어로 프로그램을 설치/업데이트/버전관리/제거 등을 할 수 있는 Mac 용 패키지 관리 애플리케이션입니다. 맥 사용자들에게는 엄청 유용한 프로그램입니다! 특히 패키지 설치나 라이브러리 관리를 위해 Mac을 이용해 코딩하시는 분들이면 대부분이 설치를 하실 겁니다. 오늘은 Homebrew를 설치하고 이용하는 법에 대해 알아보도록 하겠습니다. Homebrew 공식 홈페이지 설치 방법 1. 터미널을 열어 Homebrew를 다운받습니다. /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/ins..
-
[SQL] NULL 값이 있을 때 연산하기 (SIGN, COALESCE)SQL 배우기 2024. 1. 9. 22:37
년도별 평균 적금 판매 좌수를 구하고 싶습니다. 2023년도 4분기는 아직 결산이 안됐습니다. NULL값으로 발생하는 문제가 있습니다. → NULL 값을 함께 연산을 하면 NULL 값이 나옵니다. (COALESCE 처리) → NULL 값이 아닌 분기들의 평균을 구하고 싶습니다. (SIGN, COALESCE 처리) year Q1 Q2 Q3 Q4 2021 1000 1200 1100 1300 2022 1300 1000 1200 1500 2023 1300 1200 1000 select year, (coalesce(q1,0)+coalesce(q2,0)+coalesce(q3,0)+coalesce(q4,0))/(sign(coalesce(q1,0))+sign(coalesce(q2,0))+sign(coalesce(q3,..
-
현업에서 사용하는 데이터 분류 (업무 데이터, 로그 데이터)정보공유 경험나눔 2024. 1. 9. 19:11
저는 은행에서 일했던 데이터 분석가입니다. 많은 분들이 은행에는 어떤 데이터들이 있냐고 물으시는데 오늘 한 번 정리해보도록 하겠습니다. 우선 크게 '서비스나 프로덕트를 운용하면서 쌓이는 업무 데이터'와 필수적이진 않아도 행동 관찰과 분석에 필요한 로그 데이터로 나뉠 수 있습니다. ▶︎ 업무 데이터 → 개념 : 서비스와 시스템을 운용하기 위한 목적으로 구축된 데이터 → 특징 : 데이터 처리 도중 문제가 발생하면, 트랜잭션과 롤백이 기능하기 때문에 데이터의 정합성이 보증된다. 정확한 값이 요구되는 업무 보고 데이터에 적합 : 대부분 갱신형 데이터이다. 변화가 있을 때 추가, 갱신, 제거됨(또는 경우에 따라 일별로 찍어놓기도 함) 예) 고객이 탈퇴하는 경우, 데이터를 물리적으로 제거, 상품 가입을 취소하는 경..
-
[ChatGPT] 왜 프롬프트 지니를 써야할까?자연어처리 공부 2024. 1. 9. 14:45
다들 ChatGPT 많이 쓰시죠? 저 또한 너무 유용하게 잘 활용하고 있습니다. 요즘 저의 생산성과 효율성을 책임지고 있습니다. 하지만 더 높은 생산성과 효율성을 원하신다면, 오늘 소개드릴 "프롬프트 지니"를 추천합니다. ChatGPT의 확장 프로그램인 프롬프트 지니는 한국어 질문을 영어로 바꿔주고, 영어 답변을 한국어로 번역해줍니다. 한국어로 써도 충분히 잘 되는 것 같은데 왜 영어로 해야하냐구요? 몇 가지 이유를 들어 쉽게 설명해드리겠습니다! 1. 우선 인공지능을 학습할 때는 많은 양의 데이터를 학습시킬수록 정확도가 올라갑니다. 인공지능은 학습 데이터를 통해 데이터의 특성과 패턴을 파악하는데 데이터가 많을수록 일반화도 잘되고 정확도가 올라갑니다. 우리도 10문제 풀고 시험보는거랑 100문제 풀고 시험..
-
[책 후기] 돈은 좋지만 재테크는 겁나는 너에게책으로 공부하기 2024. 1. 7. 12:21
2024년이 밝아서 재테크를 시작해보고 싶다는 생각이 들었습니다. 작년뿐만 아니라 지금까지의 저를 보았을 때, 명품이나 사치 등에 관심은 없지만 친구들이랑 술먹는 것도 좋아하고 놀러가는 것도 좋아하고, 여행도 많이 다녔습니다. 분명 3천 만원까지는 쉽게 모았는데 그 이후로 돈이 늘어나는 속도가 급격히 줄어드는 것 같더라구요. 분명 1천 만원만 모으면 그 뒤로부터는 쉽다고 했는데... 돈이 모인 만큼 씀씀이도 커지고 나이가 들면서 더 맛있고 분위기 좋은 곳을 찾아서 그런 것 같습니다. 또한 저는 아빠가 행복하게 즐기면서 살려고 돈을 버는건데 그렇게 아끼는지 답답하기도 했는데, 정년퇴직하셨는데 아무 것도 안하시면서 저보다 버는 돈도 많으시고 꾸준한 수입으로 하루하루 산책하고 책읽고 티비보시고 여행다니시는 모..
-
[자연어처리] Transformer 쉽게 풀어서 정리해드립니다.자연어처리 공부 2024. 1. 5. 20:25
자연어처리에서 창의적인 아키텍처와 엄청난 학습량, 높은 성능으로 한 획을 그은 구글의 Transformer가 있습니다. Transformer 아키텍처는 "Attention Is All You Need" 논문에서 처음 소개되었습니다. 이 모델은 기존의 순환 신경망(RNN)이나 장단기 메모리(LSTM), 게이트 순환 유닛(GRU) 등의 기존의 순차적인 아키텍처를 사용하지 않고, Attention 메커니즘을 중심으로 구성되어 있습니다. "Attention Is All You Need. Concentration is All I Need, Also." 저는 이 모델을 이해하기 위해 많은 노력과 집중력을 필요했습니다. 그래서 "Attention Is All You Need. Concentration is All I..
-
[머신러닝] "불균형 데이터" 평가 지표로 "정확도"는 알맞지 않다.머신러닝 배우기 2024. 1. 3. 18:26
문제 상황 : 마케팅 부서에 있었을 때, 오픈뱅킹 가입을 유도하기 위해 기프티콘을 주는 이벤트를 했습니다. 문자를 보낸 고객 중에 가입을 한 고객은 0.5%였습니다. 기존에는 가입하지 않은 고객들을 랜덤으로 뽑아서 문자를 보냈지만 정해진 예산으로 인해 가입할 것 같은 고객을 추려서 문자를 보내기로 했습니다. 이전 마케팅했던 고객을 대상으로 성, 연령, 타행 오픈뱅킹 가입 여부, 로그인 경과일 등의 피쳐를 활용해 머신러닝 분류 모형을 만들었습니다. 그리고 마케팅하지 않았던 고객들을 모델에 넣어 가입할 것 같은 고객들에게 문자를 보냈습니다. 분류 모델의 정확도는 99%가 넘었지만 실제 가입한 고객들을 얼마되지 않았습니다. 왜 그럴까요? 문제는 왜 발생한 것일까요? : 가입율이 0.5%인 데이터는 불균형한 데..
-
[돈의 속성] 근거 있는 PER 가 높은 사람이 되자책으로 공부하기 2024. 1. 3. 16:59
마케팅을 해보고, 데이터를 통해 관찰도 하고, 프로덕트에 대해 꾸준히 생각하면서 느낀 점은 "잘되는 데에는 이유가 있다." 입니다. 사람들의 솔직한 속마음을 들여다보았거나 불편한 것을 해결해주거나 많은 사람들이 관심있는, 수요가 많은 것들입니다. 2024년 첫 책은 어떤 책을 읽어볼까? 생각하다가 "모르겠으면 큰 길로 가라." 베스트셀러에서 골랐습니다. 근데 마침 고른 책 '돈의 속성' 에도 '길을 모르겠으면 큰 길로 가라'라는 챕터가 있었습니다. 그리고 요즘 쉬는 시간에 무엇을 해야할까? 고민하다가 현재 트렌드인 자연어처리를 공부하고 있습니다. 이 또한 잘한 선택이라 믿으며 하루하루 열심히 공부해보려고 합니다. 이처럼 무언가를 시작할 때, 나의 상황에 알맞은 글귀를 보게 되면 기분이 좋아지는데요 이글을..