목록Data Science (60)
Yours Ever, Data Chronicles

정말 오랫만에 블로그에 들렀다.취준 기간이었던 2022년 처음 개설했던 블로그인데, 어느덧 경력 만 2년이 지난 3년차 직장인이 되었다. 2년이 넘는 기간 동안 한 회사에서 여러 프로젝트도 경험해 보고, 새로운 사람들도 만나고, 해외여행도 다녀오고, 운동을 시작하고, 식습관이 바뀌고, 새로운 취미 생활도 경험해 보는 등 많은 것이 바뀌었다고 생각하니 감회가 새롭다.. ㅎㅎ 그리고 2024년, 올해는 블로그에 자주 오지 못했다.사실 개인적으로 올해는 정말 길었던 슬럼프를 겪었던 것 같다. 솔직하게 말하자면 내 자존감도 건강하지 못했던 것 같고, 나만의 문제가 아니라 나를 둘러싼 환경도 이번엔 좋지 못했었다.그래도 올해 말 들어서 이것 저것 새롭게 시작한 것들 & 변화한 것들이 있어서, 오늘은 근황도 전해..

정말 오랫만에 이렇게 블로그 포스팅을 하기 위해 자리에 앉았다. 오늘은 2024년 1월 7일로, 2024년이 시작된지도 이미 일주일이 지났다. 사실 2023년 회고 및 2024년에 어떤 것들을 다짐했는가는 나의 개인 노션에는 이미 적어두었지만, 연말연초라 다른 약속도 많고 해서 진득하게 자리에 앉아 있을 시간이 없어서 블로그에는 오랫만에 글을 남기고 있다. (그렇다 다 핑계다...ㅎ.. 올해는 블로그 포스팅도 꾸준히 하는 게 나의 2024년 목표기도 하다!) 사진처럼 오늘은 중구에 있는 한 카페에서 이 글을 쓰고 있다. 버터프레첼과 카페라떼를 시켜서 먹고 있는데 꽤 맛있다. 그리고 카페의 분위기가 잔잔해서 여유로운 일요일을 보내기에 딱인 장소였다. (사람이 많다는 건 안비밀) 2023년(벌써 작년)에 남..

안녕하세요! Everly 입니다. 이번 커리어 시리즈의 마지막으로, 데이터 직군의 "면접" 준비 및 과정에 대해 포스팅해보려 합니다. 제가 인턴 및 정규직에 지원했던 것이 데이터 분석 쪽이기에, 직무적인 부분에 있어서는 분석 쪽 관련 커리어를 준비하고 계신 분들께 도움이 될 것 같아요! 처음 회사 면접을 준비하다 보면 정말 막막하기 그지없는데요. 저도 첫 데이터 분석 인턴 면접을 봤을 때를 생각해보면 아직까지도 그 때의 긴장감이 생생합니다. 대체 면접장에 가면 나에게 무슨 질문을 할지, 그리고 나는 어떻게 대답해야 합격할 수 있을지 수없이 고민하고 머리를 싸맸던 기억이 납니다. 이번 포스팅에서는 제가 면접을 준비했던 방법과, 면접에서 자주 물어보는 질문들, 마지막으로 제가 생각하는 면접 꿀팁에 대해 알려..

안녕하세요, Everly입니다. 오늘은 저번 포스팅에 이어 어떻게 서류 합격을 받을 수 있었는지 준비과정과 내용을 알려드릴게요. Step 3. 서류 전형 준비하기! 처음 서류를 준비하다 보면 정말 이것저것 챙길 것도 많고, 생각보다 꽤 많은 시간이 소요되었던 것 같아요. 우선 제가 지원했던 인턴은 요구한 서류가 2가지였는데, 자기소개서와 경력기술서(선택) 이었습니다. 자기소개서 - 자유 양식 경력기술서(신입의 경우 포트폴리오) - 자유 양식 [1. 자기소개서 쓰기] 자기소개서의 경우 처음엔 정말 막막하더라고요. 자유 양식인데다 대학 입시 때 썼던 자소서가 마지막이었는데..! 그래서 이 때에는 학교에서 하는 자기소개서 특강을 듣고, 강사님께서 추천해주신 자기소개서 책 『너는 생각보다 자소서를 잘 쓴다』(유..

안녕하세요, Everly입니다 :) 작년부터 쓰려고 벼르고 있었는데 드디어 블로그에 연재를 시작하네요. 많은 분들께서 저의 블로그를 보고 '데이터 분석 인턴 합격하려면 어떻게 해야 하는지', '데이터 분석가로 취업하려면 어떻게 해야 하는지' 를 많이 궁금해하시더라구요. 그래서 이번 포스팅부터는 데이터 분석가로 취업에 성공한 저의 경험담(서류, 면접 관련)을 나누어 드리려 합니다 :) 저의 개인적인 경험담이니 조언 정도로만 봐주시면 감사하겠습니다. [Start: 인턴 지원 배경] 우선 제가 첫 인턴을 지원한 시기는 2021년 3~4월로, 4학년 막학기를 다니고 있던 때였습니다. 저는 통계학과라 데이터 분석엔 어렴풋이 관심이 있었습니다. 학교 수업을 통해 R프로그래밍, 회귀분석 등을 공부하며 흥미를 쌓아갔고..
안녕하세요,"Yours Ever, Data Chronicles" 에 오신 것을 환영합니다. :) 저는 이 블로그를 만든 Everly입니다. 데이터 분석가(Data Analyst)로 일하며 데이터를 통해 세상을 읽고, 그 속에서 발견한 흥미로운 이야기와 통찰을 여러분과 나누고 싶어 이 공간을 만들었어요. '데이터 분석'의 매력은 데이터를 활용하여 더 나은 의사결정에, 그리고 문제 해결에 도움을 줄 수 있다는 점이라고 생각하는데요! 특히 데이터를 잘 활용하려면 그 '해석'을 잘 해야 한다고 생각하는데, 훌륭한 기술 블로그들은 많지만 데이터 프로젝트를 할 때 어떻게 해결까지 도출하였는지 그 과정을 상세하게 설명한 블로그들은 많이 없는 거 같아 만들었습니다. 아직 부족한 점이 많은 3년차 데이터 분석가로서 ..

이전에 회사 내 의사소통을 잘 하는 방법에 관해서 ‘일 잘하는 사람은 단순하게 말합니다’ 라는 책(서평 바로가기)을 굉장히 감명깊게 읽었다. 읽었던 내용을 실제로 회사에서 의사소통 할 때 적용해보기도 했고 이전보다 훨씬 소통이 편해진 경험이 있었다. (처음에 회사 들어가서 했던 일들을 생각하면,,, 흑역사,,, 여러분은 이런 흑역사를 만들지 마시라고 꼭 책을 미리 읽고 회사 생활 하시길 추천드린다) 그래서 저자 박소연님에 대한 관심이 많아졌고, ‘일 잘하는 사람은 단순하게 말합니다’ 책 전에 ‘일 잘하는 사람은 단순하게 합니다’ 라는 책을 출간하셨다는 것을 알게 되어 바로 구입해 읽어보았다. 이전 책은 회사 내 의사소통에 관한 이야기라면, 이 책은 회사 내의 글쓰기에 관한 내용이다. (물론 의사소통 관련..

취업을 준비하면 역시 유튜브를 많이 참고하게 된다. 그 중에서도 가장 유명한 유튜버를 꼽자면 아마 “면접왕 이형” 이라는 유튜버가 아닐까 싶다. 오늘 리뷰할 이 책은 바로 “면접왕 이형” 이라는 유튜버이신 이준희 님이 쓰신 책으로, 회사생활에 있어 아주 중요한 부분인 ‘시간 관리를 어떻게 효율적으로 하는가?’ 에 대한 방법을 알려주는 책이다. 사실 면접왕 이형의 서브채널인 ‘퇴사한 이형’ 에서 이런 회사생활 관련 이야기를 다루고 있어서 영상과 겹치는 부분도 좀 있다.(개인적으로 애정하는 채널이다. 넘나 유용✨) 하지만 나는 책 형태로 깔끔하게 정리되어 있는 것을 더 좋아해서 읽게 되었다. 참고로 이형님은 이랜드그룹이라는 대기업에서 최연소 인사팀장으로 지냈으며, 현재는 따로 회사를 차려 CEO로서 유튜브 ..

저번 포스팅에서는 명목형 변수 중에서 nom_9 변수를 제거하여 0.804의 성능으로 향상시켰다. 이번 포스팅에서는, 사용했던 모델인 '로지스틱 회귀' 모델을 하이퍼 파라미터 튜닝하여 좀 더 성능을 향상시켜 보자! 데이터를 불러오는 과정은 앞의 포스팅과 똑같으므로 생략하고, 범주형 변수 인코딩 하는 부분과 모델 하이퍼 파라미터 튜닝하는 부분은 함수로 만들어서 좀 더 코드를 간결하게 만들어보았다. 참고로 하이퍼 파라미터 튜닝은 시간이 꽤 오래 걸리니 코드 실행 시 주의하자! (적으면 10분, 많으면 40분까지도 걸린다) 전체 코드는 이 깃허브에서 다운받을 수 있다 :) ✔Table of Contents 1. nom_9 변수 제외 & 하이퍼 파라미터 튜닝 함수화 먼저 데이터를 불러오고, 데이터 인코딩 하는 ..

이전 포스팅에서는 범주형 변수를 전처리하기 위한 인코딩을 하고, 기본적인 베이스라인 모델을 만들어 제출까지 해보았다. 이번 포스팅부터는 성능을 개선하기 위한 여러 방법들을 시도해보자! 내가 시도해본 방법은 다음과 같다. 1) 명목형 변수인 nom_*의 변수 개수 조정 (nom_5~ nom_9번 변수는 의미있는 변수인지 모르니까) 2) 로지스틱 회귀의 하이퍼 파라미터 튜닝 이번 포스팅에선 1번을 해본다. 참고로 전체 코드는 나의 깃허브에서 다운받을 수 있다 :) ✔Table of Contents 1. 데이터 불러오기 import pandas as pd import numpy as np import warnings warnings.filterwarnings("ignore") train = pd.read_cs..