목록전체 글 (176)
Yours Ever, Data Chronicles

오늘도 평화로운 코딩중, 이미지 인식 기술에 사용하는 opencv 라이브러리를 설치후, 이미지를 불러오는데 다음과 같은 에러가 떴다. AttributeError: 'Nonetype' object has no attribute 'shape' 라는.. 열심히 구글링을 해봤는데, 이 원인은 cv2.imread에 지정한 저 경로가 잘못되었기 때문이라는 것이다. 하지만 아무리 생각해도 이상했다. 왜냐하면 9장 폴더 안에 img 폴더가 있고, 거기에 있는 'img01.jpg' 라는 이미지를 불러오려고 한 건데..? 경로는 잘못되지 않았는데..? 이렇게 경로를 제대로 썼는데도 에러가 떴다면, 그 원인은 경로에 '한글'이 들어갔기 때문이다. 그래서 위의 코드처럼 경로를 수정해서, 영문으로만 구성되게 하면 에러 없이 잘..

오늘도 평화로운 코딩중, 파이썬 라이브러리가 설치되지 않아 설치를 하려고 Anaconda Prompt에 pip install ~ 을 치고 있었다. 그런데 자꾸만 이런 에러가 뜨는 것이다. ortoolpy라는 라이브러리를 설치하려고 pip install ortoolpy를 쳤는데, 에러 메세지는 바로 이것. WARNING: You are using pip version 21.0.1 : however, version 22.0.4 is available. 나의 pip version이 21.0.1인데, 22.0.4로 업그레이드해야 이 라이브러리를 설치할 수 있다는 것이다. 그리고 친절하게도(?) 밑에 You should consider upgrading via the 'C:\Users\user\anaconda3\..

럭키 드로우(LUCKY DRAW): 나만의 길을 찾을 때까지 인생의 레버를 당기는 법 - 드로우앤드류 지음, 다산북스(2022) 오직 운으로만 결정되는 슬롯머신에선 두려움 없이 돈을 넣고 레버를 당기면서, 왜 인생이라는 게임에서 레버를 당기는 것은 그렇게 망설이는 걸까? 이 책은 유튜버 ‘드로우앤드류’ 님이 낸 첫 책이다. 사실 나는 드로우앤드류님을 자기계발 유튜버로 알고 있어서 관련 영상을 보고 구독자가 되었는데, 원래는 인스타그램을 활용한 퍼스널 브랜딩(Personal Branding)으로 처음 콘텐츠를 시작하셨다고 한다. 『럭키 드로우(LUCKY DRAW)』 라는 책은 드로우앤드류님이 25살에 인턴을 하러 미국으로 떠났을 때부터, 32살인 지금 어떻게 유튜브 외에 여러 파이프라인을 갖고 회사 없이 ..

요즘 애들을 위한 슬기로운 재테크 생활 - 조혜경 지음, 원앤원북스(2020) 돈 관리, 지금 시작해도 늦었다! 그러니 지금 당장 시작해야 한다! 읽은 지 좀 된 책이지만, 서평을 늦게 올린다. 올해 2022년 초에는 재테크에 관심이 많아서 관련한 책도 몇 권 읽었고, 유튜브에서도 주로 재테크 콘텐츠만 봤던 거 같다. 덕분에 유튜브 알고리즘이 재테크 영상만 추천해줄 정도였다. 나는 20대 중반이지만, 대학을 졸업한 지 얼마 되지 않았고 학교를 다니면서는 재테크에 관심이 별로 없는 편이었다. 그래서 그런지 재테크를 시작하려 하는데 어디서부터 어떻게 시작해야 할지 아무것도 몰랐다. (요즘은 10대 때부터 재테크에 관심을 가진다는데, 정말 대단한 것 같다.) 주식이나 코인 열풍이라는 것은 잘 알고 있었지만 주..

앞선 포스팅에서 간단하게 물류 운송 데이터를 바탕으로 창고와 공장 간 이동관계를 네트워크화 해보았습니다. 결과는 위와 같았는데요! 어느 창고(W)에서 어느 공장(F)으로 가든지간에, 모든 경로가 있다는 점이 주목할 만한 점입니다. 이 중에서 굵기가 진한 엣지인 W2 → F3로 가는 경로는 운송량이 다른 경로에 비해서 더 많다는 것이 눈에 띄네요. 앞의 포스팅에서, 물류 회사에서 요청한 분석이 무엇이었는지 기억나시나요? "운송비용을 절약하기 위한 최적의 경로를 찾아달라"는 것이었죠. 그렇다면 위의 경로에서 운송비용을 더 효율적으로 만들고자 한다면 어떻게 경로가 바뀌면 될까요? 맞습니다. 직관적으로 생각해볼 수 있는 것처럼, 특정 경로에만 집중되는 것이 운송비용을 더 절약할 수 있을 것입니다. 어떤 경로만 ..

우리가 행복한 인생을 살기 위해 필요한 것은 무엇일까? 돈, 건강, 시간 등 다양한 것이 있겠지만 하버드대학 연구팀이 연구를 통해 증명한 바에 따르면 행복하게 살기 위해 가장 중요한 것은 ‘인간관계’라고 한다. 인간은 사회적 동물이기에, 반드시 다른 사람들과 어울려서 지낼 수밖에 없다. 혼자 지내는 게 편할 때도 있지만 언젠가는 결국 다른 사람들을 찾게 된다. 그리고 다른 사람들과의 소통과 교류를 통해 얻게 되는 행복감도 있다. 나는 지금까지 살아오면서 항상 ‘인간관계’에 대한 걱정과 고민이 많았다. 이 책에 관심을 가진 분들도 비슷하지 않을까 싶다. 10대에는 친구 문제로 인한 인간관계, 20대에도 대학 친구-지인과 직장에서의 인간관계.. 나중에 30대, 40대 그 이후가 되어서도 인간관계는 영원한 우..

이번 포스팅에서는 python networkx 라이브러리를 활용해 네트워크를 가시화하는 방법을 알아보고, 실제 물류 데이터를 적용하여 효율적으로 운송이 이루어지고 있는지를 살펴봅니다. 최적화를 시각화하는 라이브러리는 다양하지만 여기서는 networkx를 사용합니다. ✔Table of Contents Tech 53. 네트워크 가시화하기 (기초) 먼저 네트워크 시각화를 하기 위해선 다음이 필요합니다. 그래프 객체 노드(node) : 점 엣지(edge) : 점과 점을 연결하는 선 좌표 : 점의 좌표 위의 순서를 지켜, 가장 기본적인 네트워크를 만들어보겠습니다. import networkx as nx import matplotlib.pyplot as plt #그래프 객체 설정 G = nx.Graph() #노드 ..

안녕하세요, Everly입니다! 오늘부터 포스팅될 [파이썬 데이터 분석 #6장, #7장] 에서는 물류 데이터를 활용한 최적화 문제를 푸는 과정을 리뷰해보려고 합니다. 그리고 '데이터 분석 실무 테크닉 100' 책이 Tech 100까지로 이루어져 있는데, 저번 포스팅에서 벌써 Tech 50까지 왔더라구요! 이제 남은 50가지 테크닉도 잘 포스팅해보도록 할게요 :) ✔Table of Contents 최적화 문제란? 이번 포스팅부터 진행할 최적화 문제는 앞서 풀어봤던 머신러닝 문제(파이썬 데이터 분석 #4, 5장)보다도 좀 더 어렵습니다. 우선 최적화가 무엇이고, 어떤 경우에 최적화 문제를 사용하는지에 관해 알아보겠습니다. 책에서 살펴볼 최적화 문제는 '물류 데이터'를 활용합니다. 당신은 지금 어떤 기업의 창..

저번 포스팅에 이어, 조금의 전처리를 수행하고 고객 이탈을 예측하는 분류 모델링을 해봅니다. ✔Table of Contents Tech 44. 예측할 달의 재적 기간을 작성하자 앞선 포스팅에서 탈퇴회원과 지속회원의 데이터를 결합한 pred_data를 만들었습니다. 이 상태로 그대로 쓰기 전에 새로운 시계열 변수 '재적 기간'을 추가해봅니다. 재적기간(period) 변수는 [파이썬 데이터 분석 #4]에서 했던 것과 마찬가지로, 현재 연월에서 가입시기(start_date) 값을 빼서 만듭니다. period의 단위는 월(month) 입니다. pred_data['period'] = 0 #초기화 pred_data['now_date'] = pd.to_datetime(pred_data['연월'], format = '..

안녕하세요 Everly입니다 :) 지난 4장에서는 클러스터링(Clustering)을 통해 고객의 행동을 유형별로 나눴었죠. 그리고 고객의 과거 6개월 간의 데이터를 바탕으로, 바로 다음 1달 동안의 이용횟수를 선형 회귀(Linear Regression model)를 통해 예측해보았습니다. 이렇게 고객의 행동 패턴을 분석하고 예측할 수 있다면, 실무를 하는 데 있어 여러 활용도가 있을 것입니다. 고객 유형을 나눠 특정 군집에 행동을 유발할 마케팅을 해볼 수도 있고, 다음달 예상되는 이용횟수를 바탕으로 적합한 프로모션을 할 수도 있겠죠. 이를테면 헬스클럽에 수요일이 가장 적게 올 것이 예측되면 '수요일은 헬스데이!' 라는 프로모션을 만들 수도 있을 것입니다. 이렇게 머신러닝(Machine Learning)을..