목록전체 글 (176)
Yours Ever, Data Chronicles
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/brRSs2/btryLGBICbq/KEk42slTt768nkZjEtmy1K/img.jpg)
당신은 ‘나는 너무 바빠’, ‘바빠서 뭘 할 시간이 없네..’ 라고 늘 말하는 사람이지 않은가? 바쁜 와중에도 뭔가를 더 해야겠다고 생각해서 이 책을 검색했을 가능성이 높다. 만약에 당신이, 시간을 들여 돈을 절약하는 것이 돈을 들여 시간을 절약하는 것보다 더 중요하다고 생각한다. (예를 들어, 특별한 상황에서도 택시타는 것은 사치라 생각해 버스를 타거나 걸어다닌다.) 돈을 더 벌기 위해서 더 많이 일하는 게 미덕이라고 생각한다. 그래서 야근과 주말 근무도 거부감이 없다. 돈만 준다면! 최저가 및 핫딜 상품, 상품 후기가 많은 상품을 사기 위해 웹서핑을 즐긴다. 게으를 때에는 죄책감을 느낀다. 요청을 받는 모든 일에 일단 “네” 라고 대답한다. 바쁘게 사는 것이 미덕이라고 생각하고, 내가 바쁜 사람이라는..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/2hHqL/btryoYiS7Qn/AsCMGy4sbeLRpFKXe8hk20/img.jpg)
이 책의 저자는 바이브컴퍼니(구 다음소프트)의 부사장인 송길영으로, 소셜 데이터를 바탕으로 인간의 마음을 읽고 해석하는 일을 하기에 자신을 ‘마인드 마이너(Mind-Miner)’ 라고 소개한다. 송길영님은 이전에도 소셜 데이터를 분석하며 트렌드와 관련한 책을 여러 권 썼기에 이름이 익숙하신 분들도 있을 것이다. 이 책이 베스트셀러인데다 저자가 나와 같은 데이터 분석을 하는 사람이기에 당연히 읽어야겠다고 생각해서 읽었는데, 생각보다 더 재밌었다 :) 그냥 하지 말라: 당신의 모든 것이 메세지다 - 송길영 지음, 북스톤(2021) 이 책에서는 지난 10년 동안 일어났던 일들을 데이터를 바탕으로 설명하는데, 에필로그에서 저자는 10년 전의 분석 자료를 다시 보니 ‘부끄러운 10년’이었다고 했다. 그때 당시엔 ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/bq183V/btrysB7boy5/Crr3n1k6C3mId2kvxZcBNK/img.jpg)
최근 감명깊게 읽은 책 『성장을 꿈꾸는 너에게』 를 읽고, 내용이 너무 좋아서 저자 우쥔 박사에 대해 관심이 많아졌다. 그러다 저자가 이 책을 내기 전 2019년도에 베스트셀러 『어떻게 살아야 할지 막막한 너에게』 책을 출간했음을 알고 바로 읽어보았다. 어떻게 살아야 할지 막막한 너에게 - 우쥔 지음, 오월구일(2019) 이 책은 우쥔 박사의 두 딸(멍화, 멍신)에게 아빠로서 인생을 살아야 하는 법에 대한 조언을 담은 편지를 엮은 책이다. 두 딸이 대학 신입생으로 입학 후, 인턴을 거쳐 졸업 후 석사에 진학하기까지의 세월 동안의 편지라, 20대, 그 중에서도 20대 초중반이 읽으면 가장 도움이 많이 될 것 같다. 나는 대학을 졸업한 이후 이 책을 읽었지만, 인생에 대한 이야기도 있어서 내가 인생을 어떤 ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/cDIJD8/btryzpGWAOh/U1IHQy5k8KTOdjFPhH6vD1/img.png)
이렇게 모델링을 위한 데이터 가공을 마쳤습니다. 이제는 모델링을 직접 해봅시다. ✔Table of Contents Tech 38. 선형회귀 모델링 모델 구축에 앞서, pred_data 전처리를 한번 더 합니다. 가입일자(start_date) 변수가 2018년 4월 이후인 데이터로만 데이터를 한정합니다. 왜냐하면 만들어둔 이용횟수 변수의 날짜가 모두 2018년 4월~2019년 3월이거든요. 너무 오래 전부터 있던 회원은 가입시기 데이터가 존재하지 않거나 이용횟수가 안정적일 가능성이 높기 때문에 비교적 신규인 회원들로만 데이터를 다시 만들어봅니다. print(pred_data.shape) pred_data = pred_data.loc[pred_data['start_date'] >= pd.to_datetime..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/bhVuTC/btryzDjUJAO/O3akgr7gv92Oi3zVQR4ZyK/img.png)
이전 포스팅에 바로 이어서, 이번에는 고객의 과거 데이터를 바탕으로 행동을 예측해봅시다. 여기서 해볼 에측은 회원의 과거 헬스장 이용 이력 데이터를 바탕으로, 다음 달의 이용 횟수가 몇 회가 될지를 예측해볼 것입니다. 이러한 예측을 위해 머신 러닝(Machine Learning, 기계학습)을 수행해볼 것인데, 여기서 사용하는 것은 지도학습 모델링입니다. 지도학습 모델링은 '정답 데이터'가 존재하는 모델링을 의미합니다. 여기서 이야기하는 정답 데이터는 종속변수(y, target)을 의미하며 이러한 정답 데이터가 없으면 비지도학습입니다. 과거 데이터를 학습 데이터(train set)로 하여 모델을 만들고, 검증 데이터(validation set)로 모델의 성능을 평가합니다. 마지막으로 정답을 모르는 테스트 ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/0NkPB/btryuWdVHol/oiFy0pUnJt0LTTZtophfb1/img.png)
안녕하세요, Everly입니다. 정말 오랫만에 '파이썬 분석 실무 테크닉' 공부한 부분을 리뷰하는데요! (3달 만이군요..) 앞으로는 좀 더 자주 업로드해보도록 하겠습니다 :) 오늘은 지난 포스팅에서 다뤘던 스포츠 센터(편의상 헬스장) 데이터를 바탕으로, 이 헬스장을 사용하는 고객이 어떤 유형이 있고, 고객의 행동을 에측하는 데이터 분석을 공부해봅니다. 이번 포스팅에서는 클러스터링(clustering)을 통해 고객의 유형을 나눠 보고, 바로 다음 포스팅에서는 고객의 과거 데이터를 기반으로 예측하는 머신러닝 모델을 만들어 봅니다. [고객의 소리] 지난번 분석으로 어느 정도 경향을 파악할 수 있었습니다. 아직 전체적인 경향밖에 파악하지 못해서, 이번에는 좀 더 구체적인 분석을 부탁드리려고 합니다. 고객별로 ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/kxLgd/btryq0NjC6N/8PzirekkbKICRB5c4sTLp1/img.jpg)
창업을 꿈꾸거나, 스타트업에 종사하는 사람이라면 한 번쯤 들어봤을 만큼 유명한 책. 2014년에 출판되어 꽤 시간이 오래 지난 책이지만, 그럼에도 불구하고 여전히 창업에 있어서 바이블이라고 여겨질 만한 책이다. 이 책의 저자는 피터 틸로, 페이팔(PayPal)의 공동창업자이다. ‘제로 투 원(ZERO to ONE)’은 피터 틸이 스탠퍼드대에서 했던 강의를 엮은 책이다. 이 책에 창업과 관련한 저자의 경험과 지혜가 들어 있으니 창업에 관심 있는 분들이라면 이 책을 통해 많은 인사이트를 얻을 수 있으리라 생각한다. 일반적인 관점으로만 여겨졌던 것들을 뒤집는 발상으로 신선한 저자의 관점이 녹아 있는 책이다. 제로 투 원 : 경쟁하지 말고 독점하라 - 피터 틸 지음, 한국경제신문(2014) 이 책의 제목처럼, ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/lQYq8/btrycDdBM2H/OfiTUpmdm4rEFFOD5Hy4Dk/img.jpg)
오늘 소개할 책은 2022년 1분기에 읽었던 책들 중에 가장 나에게 직접적으로 도움이 많이 되어준, 최고의 책이다. 이 책의 부제인 "열심이 답이 아닐 때 읽는 책"이라는 말을 보고, 열정은 많지만 어떻게 성과를 내는지가 부족한 나에게 반드시 필요한 책이라는 생각이 들었고, 내용은 나의 생각보다 훨씬 더 좋았다. 성장을 꿈꾸는 너에게: 열심이 답이 아닐 때 읽는 책 우쥔 지음, 오월구일(2021) 최근에 사람들이 좋다고 하는 많은 베스트셀러 책을 읽어봤지만, 그 중에서도 이 책은 최근 읽었던 책들 중 가장 훌륭한 책이다. 내가 너무도 궁금해했고, 듣고 싶었던 말을 저자가 이 책에서 다 말해주고 있기 때문이다. 친한 친구에게 책을 선물한다면 단연코 이 책을 선물하고 싶을 정도로 좋은 책이었다. 이 책의 저..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/dkfOsL/btrub9Pu4FQ/3jSBCkw2I11tVk8CmhUDHk/img.jpg)
타이탄의 도구들: 최고의 자리에 오른 사람들의 61가지 성공비밀 - 팀 페리스 지음, 토네이도(2017) *알라딘 단독 리커버 특별판 읽은 지는 좀 되었지만 조금 늦은 서평을 쓴다. 나는 소장하고 싶은 책이 아니면 잘 구매를 하지 않는다. 예전에는 읽고 싶은 책이 있다면 거의 구매를 하는 편이었는데, 그렇게 하니까 집에 책이 너무 많이 쌓이기도 하고 한번 보고 말 책들이 너무 많아서 이제는 되도록이면 도서관에서 책을 빌려서 보고, 추천받은 책이나 정말 읽고 싶었던 책만 구매하고 있다. 이 책 『타이탄의 도구들(Tools of Titans)』은 ‘이 시대 가장 혁신적인 아이콘’이라 평가받는 팀 페리스가 2017년 출간한 베스트셀러인데, 팀 페리스는 『나는 4시간만 일한다』, 『지금 하지 않으면 언제 하겠는..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/dL3fLN/btrubuEx1Q9/UymW8xmGnd8wc7fJXK8KU0/img.png)
안녕하세요, Everly입니다. 오늘은 1세대 데이터 사이언티스트이신 하용호 님의 패스트캠퍼스 강의 수강 후기를 포스팅해보려 합니다 :) 사실 2월 초에 다 들었었는데, 포스팅을 해야지 하다가 이제서야 올리게 되었네요. 🙃 하용호님은 1세대 데이터사이언티스트로서, SKT 및 카카오 이사를 거쳐 지금은 한 사업체를 운영 중입니다. 이 강의는 데이터 사이언티스트로서 회사에 들어가서, 어떻게 회사를 움직일 수 있는지 그 방법에 관련한 강의입니다. 특히 주도적으로 일하는 것을 좋아해서 스타트업에 데이터 직군으로 종사하고 있거나, 스타트업에 입사를 희망하시는 분들이 들으면 좋을 강의라고 생각합니다. 제가 이 강의를 들은 이유는, 작년에 회사에서 데이터 분석 업무를 하며 기술 외적으로 어려운 점을 느꼈기 때문인데요..