Yours Ever, Data Chronicles

[서평] 앞으로 데이터 분석을 시작하려는 사람을 위한 책 본문

Data Science/Books for Career

[서평] 앞으로 데이터 분석을 시작하려는 사람을 위한 책

Everly. 2022. 6. 13. 17:04

이 책은 서점에서 책을 구경하다 우연히 발견한 보물 같은 책이다.

 

이전에 블로그에서도 여러 번 언급했었지만, 이제 막 데이터 분석을 공부하기 시작한 사람이 아닌, 데이터 분석 업무를 해봤거나 혹은 데이터 분석의 어려움과 관련한 책과 글을 읽어본 사람이라면 데이터 분석의 어려운 점은 기술적인 부분이 아님을 알 것이다.

 

나는 처음에 이런 것을 모르고, “난 코딩/분석 공부도 많이 했고, 통계학을 전공했으니 데이터 분석 일은 뭐든 할 수 있어!” 라는 오만한(?) 생각을 갖고 있다가 큰 좌절을 겪은 경험이 있다. 내가 알지 못했던 것들이자, 해결법을 몰랐던 것들을 항목화해서 써보자면 이런 것들이었다.

 

  • 데이터를 딱 보고 이에 맞는 효과적인 분석을 하려면 어떻게 해야 하는 걸까? 어디서 그런 정보를 얻는 걸까?
  • 회사에서 도움이 되는 분석을 하려면 어떻게 해야 하지? 지금까지 배운 것들로만 적용해보면 효과가 없는 경우가 많다.
  • 올바른(또는 효과적인) 분석을 하는 과정은 무엇일까? 내가 제대로 하고 있는 것이 맞을까?

 

내가 처음 데이터 분석을 했을 때를 생각해보면 정말 답답함의 연속이었던 것 같다. 분명히 알고리즘 기법이라든가, 통계 기법을 공부했었는데, 어떤 상황에 적용을 하는 게 맞는 건지를 몰랐다. 설사 내가 한 분석 과정이 맞아떨어지더라도, 회사에서 받아들여지지 않는 경우도 많았다. 회사에 도움이 되는 분석을 하는 방법은 대체 뭘까? 정말 알 수 없는 것 투성이었다.

 

그래서 경력이 있으신 분석가 분들께 조언도 구해 봤지만, 특별하게 어떤 것이 답이라는 확답을 내려 주진 않으셨다. 이런 것들은 경험이 풍부해야 알 수 있는 암묵지같은 기술이기 때문이다.

이러한 고민을 하고 있는 분들께 이 책이 나름의 해결책을 알려주는 길잡이가 되어주리라 확신한다.

 

앞으로 데이터 분석을 시작하려는 사람을 위한 책
- 구도 다쿠야 지음, 루비페이퍼(2014)

2022.05.13 완독

 

이 책에서 얻어갈 수 있는 내용은 여러 가지가 있었다. 항목으로 나누어 설명하자면 다음과 같다.

 

  • 회사에서 데이터 분석을 잘못 하고 있는 케이스 
  • 조직에서 데이터 분석을 잘 하는 방법 & 이와 관련한 예시 (⭐큰 도움이 되었다!)
  • 조직에서 데이터 분석을 하는 단계 (⭐이것도 큰 도움이 되었다!)
  • 데이터 분석을 잘 하기 위해 길러야 할 Hard skill & Soft skill
  • 기본적인 통계 지식 소개(통계를 잘 모르지만 데이터 분석가를 꿈꾸는 분들께 도움이 될 것 같다)

이 책의 내용 중에서 인상 깊었던 일부분을 소개하려고 한다 :) 

 

‘데이터 분석’을 하는 목적을 생각하자

데이터 분석을 왜 할까? 여러 그래프로 장식된 리포트를 만들고, 모델링을 잘 한다면 데이터 분석가로서 적합한 사람일까?

우리는 데이터 분석을 하는 목적을 잘 알아야 한다. 저자는 책에서 ‘데이터 분석’이란 “의사결정의 최적화를 돕는 도구”일 뿐이라고 말한다.

다시 말해, “의사결정의 최적화”를 위해 사용하는 도구가 ‘데이터 분석’ 이라는 뜻이다.

 

가장 최악은 ‘빅데이터가 최고야!’ 라면서 데이터만 잔뜩 쌓아 놓고, 알아서 분석가들에게 분석해서 결과를 가져오라는 것이다. 이렇게 아무런 목적 없이 분석을 하는 것은 의미가 없다.

‘데이터 분석’ 그 자체에는 의사결정을 최적화하거나 자동화하는 힘이 없다. 결국 의사결정을 하는 것은 사람이기 때문이다. 이 점을 꼭 기억하자.

데이터 분석의 가장 큰 효과는 모델링이나, 대용량 데이터 처리가 아니다.
의사 결정의 최적화 (O), 효율화 (O) 이다.

 

 

조직에서 데이터 분석을 잘 하는 방법 ('데이터 팀'의 방향성) ⭐

이 책에서 가장 좋았던 부분이다. 데이터 분석을 하는 현업자거나, 데이터 팀을 리드하는 리더라면 반드시 알아둬야 할 내용이다.

 

  1. 처음부터 “전체 최적”을 지향한다. (큰 그림 그리기)
    1. 단기 효과가 아닌, 장기적인 그림을 그려야 한다
    2. 예를 들어 물류 최적화를 하고자 한다면, 생산 비용이나 운송 비용 단에서만 최적화를 하는 게 아니라,  전체 물류 프로세스를 최적화해야 함을 염두에 두고 진행한다.
  2. “IMPACT가 큰 부분” 부터 시작한다. 
    1. 앞에서 큰 그림을 보고 프로세스를 바꾸려고 계획을 했지만, 결과가 어떻게 될 지 모르기 때문에 우리는 적은 비용으로 큰 효율을 내야 한다.
    2. 처음 시도한 작은 부분에서 성공을 했다면, 그 이후에 점차 적용하는 범위를 넓힌다.
  3. 데이터 분석팀의 리더는 “강력한 리더십”이 있어야 한다.
    1. 데이터 팀 구성은 반드시 리더가 개별 면접을 봐야 한다. (아웃소싱 NO)
    2. 면접은 1)필요한 전문지식이 있는가? 2) 개인이 아닌, 팀으로서 프로젝트에 몰두할 수 있는가? 만을 고려한다.
    3. 또한, 대외적으로 데이터 프로젝트가 진행 중인 것을 알리며, 다른 팀에게 도움을 구하거나 도움을 주어야 한다.
  4. 힘의 원천은 “팀 편성”에서 나온다. (팀워크의 중요성) 
    1. 상사와 부하 관계가 아닌, 모두가 “동료”라는 점을 절대 잊지 말 것
    2. 비슷한 사람들이 아니라 다양한 사람들로 팀 구성하기

 

이러한 과정을 실제 사례로 어떻게 적용하는지는 책에 나와 있으므로 참고하면 좋을 것 같다. 🙂

 


책 속에는 회사에서 데이터 분석을 하는 방법 & 단계 & 데이터 프로젝트 진행과정 뿐만 아니라 저자만의 생각이 들어 있는 '칼럼' 도 있다. 

이 코너가 참 재밌었는데, 가장 뼈를 맞은 부분은 '통계학을 공부한 엘리트 신입사원이 제 몫을 못 하는 이유' 이 부분이었다 😂

 

처음에 데이터 분석을 시작하면 누구나 어려움이 있으리라 생각한다. 당연히 처음 하는 것이니까 내가 하는 것이 맞는지, 이 순서로 하는 것이 맞는지 확신이 없을 수밖에 없다.

자신이 부족한 것이 아니라 처음 하기 때문이라는 점을 인지하고, 이 책을 통해 데이터 분석을 차근차근 하는 그 순서를 얻어갔으면 좋겠다. 나 또한 데이터 분석을 하는 순서가 이게 맞는지에 대한 확신이 부족했는데, 책을 통해 인사이트를 얻을 수 있었다. :)

좋은 내용이 많아서, 나중에 기억이 가물가물해질 때.. 또 읽어보려고 한다 😎

반응형