Yours Ever, Data Chronicles
Kaggle 프로젝트를 시작하며 (feat. 깃허브) 본문
데이터 분석은 그저 공부만 하는 것보다는, 실전 데이터를 바탕으로 적용해보는 것이 훨씬 좋다는 조언을 듣고 [Kaggle] 카테고리를 개설하였다.
앞으로 이 카테고리에는 내가 분석한 kaggle project를 종종 올릴 예정이며, 아직 내가 캐글 초보자이기 때문에 유명한 프로젝트들(이미 종료된 프로젝트들)을 위주로 분석해볼 생각이다.
아무래도 내가 혼자서 하다가 성능이 아주 안좋아지거나 할 수 있어서, 일단 혼자서 모두 해보고, 성능이 안 좋다면 다른 참여자들이 공유한 코드를 활용해 보완할 예정이다. 그리고 왜 내가 혼자 한 것이 성능이 안 좋았는지도 고민해보고.. ㅎ.ㅎ
그리고 좀 익숙해지면, 현재 열리고 있는 캐글 프로젝트에 참여한 것도 포스팅하려고 한다 :)
활용 언어는 파이썬(Python)을 사용하였다.
또한 포스팅이 매우 길어질 수 있어.. 포스팅에는 주로 분석한 내용 위주로만 올리고(어떻게 분석하였는지, 왜 그렇게 분석하였는지 등등), 어떤 코드를 사용하였는지 궁금해하시는 분들을 위해 코드는 나의 깃허브에 올려두려고 한다.
깃허브에서 코드를 다운로드 하는 것은 무료이다!
(그리고 가끔 댓글로 데이터랑 코드 어디있는지 여쭤보는 분들이 계시는데, 항상 제 깃허브에 모두 올려놓고 있습니다😀 자유롭게 다운받아 사용해주시면 감사하겠습니다!)
GitHub - suy379/Kaggle: 직접 캐글 프로젝트를 진행하고 남기는 notebook
직접 캐글 프로젝트를 진행하고 남기는 notebook. Contribute to suy379/Kaggle development by creating an account on GitHub.
github.com
참고로 캐글 홈페이지는 여기이다. 데이터 분석, 머신러닝, AI 등에 관심이 많으신 분들이 참고할 만한 competition이 많고, 꼭 굳이 대회에 참여하지 않아도 공부용으로 좋아 추천한다. :)
'Data Science > Kaggle' 카테고리의 다른 글
[kaggle] Bike Sharing Demand: ML 성능 개선 1편 (Ridge, Random Forest, LGBM) (0) | 2022.07.01 |
---|---|
[kaggle] Bike Sharing Demand: Baseline Model 2편 (pipeline, k-fold, scaling) (0) | 2022.06.30 |
[kaggle] Bike Sharing Demand: Baseline Model 1편 (데이터 전처리) (2) | 2022.06.30 |
[kaggle] Bike Sharing Demand: EDA 2편 (0) | 2022.06.25 |
[kaggle] Bike Sharing Demand: EDA 1편 (6) | 2022.06.24 |