본문 바로가기

Data Science59

조금 늦은 2023년 회고와 2024년을 맞이하며 쓰는 글 정말 오랫만에 이렇게 블로그 포스팅을 하기 위해 자리에 앉았다. 오늘은 2024년 1월 7일로, 2024년이 시작된지도 이미 일주일이 지났다. 사실 2023년 회고 및 2024년에 어떤 것들을 다짐했는가는 나의 개인 노션에는 이미 적어두었지만, 연말연초라 다른 약속도 많고 해서 진득하게 자리에 앉아 있을 시간이 없어서 블로그에는 오랫만에 글을 남기고 있다. (그렇다 다 핑계다...ㅎ.. 올해는 블로그 포스팅도 꾸준히 하는 게 나의 2024년 목표기도 하다!) 사진처럼 오늘은 중구에 있는 한 카페에서 이 글을 쓰고 있다. 버터프레첼과 카페라떼를 시켜서 먹고 있는데 꽤 맛있다. 그리고 카페의 분위기가 잔잔해서 여유로운 일요일을 보내기에 딱인 장소였다. (사람이 많다는 건 안비밀) 2023년(벌써 작년)에 남.. 2024. 1. 7.
[커리어 시리즈 #3] 데이터 분석가 신입/인턴 면접 뽀개기! (데이터 직군 면접 후기, 준비 방법) 안녕하세요! Everly 입니다. 이번 커리어 시리즈의 마지막으로, 데이터 직군의 "면접" 준비 및 과정에 대해 포스팅해보려 합니다. 제가 인턴 및 정규직에 지원했던 것이 데이터 분석 쪽이기에, 직무적인 부분에 있어서는 분석 쪽 관련 커리어를 준비하고 계신 분들께 도움이 될 것 같아요! 처음 회사 면접을 준비하다 보면 정말 막막하기 그지없는데요. 저도 첫 데이터 분석 인턴 면접을 봤을 때를 생각해보면 아직까지도 그 때의 긴장감이 생생합니다. 대체 면접장에 가면 나에게 무슨 질문을 할지, 그리고 나는 어떻게 대답해야 합격할 수 있을지 수없이 고민하고 머리를 싸맸던 기억이 납니다. 이번 포스팅에서는 제가 면접을 준비했던 방법과, 면접에서 자주 물어보는 질문들, 마지막으로 제가 생각하는 면접 꿀팁에 대해 알려.. 2023. 8. 7.
[커리어 시리즈 #2] 데이터 분석가/인턴 서류에 합격하려면? (feat. 포트폴리오, 자소서, 이력서) 안녕하세요, Everly입니다. 오늘은 저번 포스팅에 이어 어떻게 서류 합격을 받을 수 있었는지 준비과정과 내용을 알려드릴게요. Step 3. 서류 전형 준비하기! 처음 서류를 준비하다 보면 정말 이것저것 챙길 것도 많고, 생각보다 꽤 많은 시간이 소요되었던 것 같아요. 우선 제가 지원했던 인턴은 요구한 서류가 2가지였는데, 자기소개서와 경력기술서(선택) 이었습니다. 자기소개서 - 자유 양식 경력기술서(신입의 경우 포트폴리오) - 자유 양식 [1. 자기소개서 쓰기] 자기소개서의 경우 처음엔 정말 막막하더라고요. 자유 양식인데다 대학 입시 때 썼던 자소서가 마지막이었는데..! 그래서 이 때에는 학교에서 하는 자기소개서 특강을 듣고, 강사님께서 추천해주신 자기소개서 책 『너는 생각보다 자소서를 잘 쓴다』(유.. 2023. 7. 2.
[커리어 시리즈 #1] 데이터 분석가/데이터 분석 인턴 지원 시작하기 안녕하세요, Everly입니다 :) 작년부터 쓰려고 벼르고 있었는데 드디어 블로그에 연재를 시작하네요. 많은 분들께서 저의 블로그를 보고 '데이터 분석 인턴 합격하려면 어떻게 해야 하는지', '데이터 분석가로 취업하려면 어떻게 해야 하는지' 를 많이 궁금해하시더라구요. 그래서 이번 포스팅부터는 데이터 분석가로 취업에 성공한 저의 경험담(서류, 면접 관련)을 나누어 드리려 합니다 :) 저의 개인적인 경험담이니 조언 정도로만 봐주시면 감사하겠습니다. [Start: 인턴 지원 배경] 우선 제가 첫 인턴을 지원한 시기는 2021년 3~4월로, 4학년 막학기를 다니고 있던 때였습니다. 저는 통계학과라 데이터 분석엔 어렴풋이 관심이 있었습니다. 학교 수업을 통해 R프로그래밍, 회귀분석 등을 공부하며 흥미를 쌓아갔고.. 2023. 6. 29.
Yours ever, Welcome to Everly's Blog! 안녕하세요, 저는 [Yours Ever, data log] 블로그를 운영하고 있는 Everly 입니다. 처음 블로그를 열었을 때 블로그 소개글을 남겼었는데, 새롭게 블로그 리뉴얼을 해보고자 다시 소개글을 써봅니다 :) About Everly 우선 저의 블로그에 들어와 주셔서 정말 감사드려요! 아마 이 글을 읽고 계시는 분들은 저의 글을 한번이라도 읽으셨기에, 저라는 사람에 대해 궁금해서 들어오신 거겠죠? ㅎㅎ 그래서 가장 처음으로는 저에 대해 소개하는 글로 시작해 보겠습니다. 저는 현재 데이터 분석가(Data Analyst)로 일하고 있는 직장인입니다. 사실 처음 채용 포지션은 데이터 분석가였는데, 어쩌다 보니 파이프라인이나 DW(Data Warehouse)를 만드는 엔지니어링 쪽 업무도 함께 하고 있어.. 2023. 6. 27.
회사에서 인정받는, 깔끔하게 글 쓰는 법 - 일 잘하는 사람은 단순하게 합니다 이전에 회사 내 의사소통을 잘 하는 방법에 관해서 ‘일 잘하는 사람은 단순하게 말합니다’ 라는 책(서평 바로가기)을 굉장히 감명깊게 읽었다. 읽었던 내용을 실제로 회사에서 의사소통 할 때 적용해보기도 했고 이전보다 훨씬 소통이 편해진 경험이 있었다. (처음에 회사 들어가서 했던 일들을 생각하면,,, 흑역사,,, 여러분은 이런 흑역사를 만들지 마시라고 꼭 책을 미리 읽고 회사 생활 하시길 추천드린다) 그래서 저자 박소연님에 대한 관심이 많아졌고, ‘일 잘하는 사람은 단순하게 말합니다’ 책 전에 ‘일 잘하는 사람은 단순하게 합니다’ 라는 책을 출간하셨다는 것을 알게 되어 바로 구입해 읽어보았다. 이전 책은 회사 내 의사소통에 관한 이야기라면, 이 책은 회사 내의 글쓰기에 관한 내용이다. (물론 의사소통 관련.. 2022. 9. 16.
할 일은 많고, 시간은 없다면? 회사에서의 시간관리 기술 <포커스>를 읽고 취업을 준비하면 역시 유튜브를 많이 참고하게 된다. 그 중에서도 가장 유명한 유튜버를 꼽자면 아마 “면접왕 이형” 이라는 유튜버가 아닐까 싶다. 오늘 리뷰할 이 책은 바로 “면접왕 이형” 이라는 유튜버이신 이준희 님이 쓰신 책으로, 회사생활에 있어 아주 중요한 부분인 ‘시간 관리를 어떻게 효율적으로 하는가?’ 에 대한 방법을 알려주는 책이다. 사실 면접왕 이형의 서브채널인 ‘퇴사한 이형’ 에서 이런 회사생활 관련 이야기를 다루고 있어서 영상과 겹치는 부분도 좀 있다.(개인적으로 애정하는 채널이다. 넘나 유용✨) 하지만 나는 책 형태로 깔끔하게 정리되어 있는 것을 더 좋아해서 읽게 되었다. 참고로 이형님은 이랜드그룹이라는 대기업에서 최연소 인사팀장으로 지냈으며, 현재는 따로 회사를 차려 CEO로서 유튜브 .. 2022. 9. 13.
[kaggle] 범주형 데이터 분석 - 머신러닝 2편 (로지스틱 회귀 하이퍼파라미터 튜닝) 저번 포스팅에서는 명목형 변수 중에서 nom_9 변수를 제거하여 0.804의 성능으로 향상시켰다. 이번 포스팅에서는, 사용했던 모델인 '로지스틱 회귀' 모델을 하이퍼 파라미터 튜닝하여 좀 더 성능을 향상시켜 보자! 데이터를 불러오는 과정은 앞의 포스팅과 똑같으므로 생략하고, 범주형 변수 인코딩 하는 부분과 모델 하이퍼 파라미터 튜닝하는 부분은 함수로 만들어서 좀 더 코드를 간결하게 만들어보았다. 참고로 하이퍼 파라미터 튜닝은 시간이 꽤 오래 걸리니 코드 실행 시 주의하자! (적으면 10분, 많으면 40분까지도 걸린다) 전체 코드는 이 깃허브에서 다운받을 수 있다 :) ✔Table of Contents 1. nom_9 변수 제외 & 하이퍼 파라미터 튜닝 함수화 먼저 데이터를 불러오고, 데이터 인코딩 하는 .. 2022. 8. 6.
[kaggle] 범주형 데이터 분석 - 머신러닝 1편 (변수 선택) 이전 포스팅에서는 범주형 변수를 전처리하기 위한 인코딩을 하고, 기본적인 베이스라인 모델을 만들어 제출까지 해보았다. 이번 포스팅부터는 성능을 개선하기 위한 여러 방법들을 시도해보자! 내가 시도해본 방법은 다음과 같다. 1) 명목형 변수인 nom_*의 변수 개수 조정 (nom_5~ nom_9번 변수는 의미있는 변수인지 모르니까) 2) 로지스틱 회귀의 하이퍼 파라미터 튜닝 이번 포스팅에선 1번을 해본다. 참고로 전체 코드는 나의 깃허브에서 다운받을 수 있다 :) ✔Table of Contents 1. 데이터 불러오기 import pandas as pd import numpy as np import warnings warnings.filterwarnings("ignore") train = pd.read_cs.. 2022. 8. 5.
[kaggle] 범주형 데이터 분석 - 변수 인코딩 & Baseline model 저번 EDA 포스팅을 통해 범주형 변수들이 어떤 카테고리 값을 갖고 있는지와, target과의 관계를 파악하였다. 그리고 주어진 모든 범주형 변수가 target과 유의미한 관계가 있다는 것을 알 수 있었다. (하지만 명목형 변수 nom_5~nom_9는 카테고리가 워낙 많아 검증이 필요하다.) 이번에는 베이스라인 모델을 만들어본다. 주어진 범주형 변수들을 활용해 target을 예측하는 모델을 만들어 볼 것이며, 베이스라인 모델이므로 가장 간단한 형태로 만들 것이다. 이번 포스팅에서는 범주형 변수를 전처리하는 변수 인코딩(Encoding) 방법과, 아주 간단한 로지스틱 회귀 모델을 만들어 보고 score가 얼마가 나오는지 알아보자. ✔Table of Contents 1. 범주형 변수 인코딩(Encoding).. 2022. 8. 4.