[BOOK] 헬로 데이터 과학 – 김진영 지음
일반적으로 개인이 쌓을 수 있는 작은 데이터를 분석하여 활용하는 방법을 설명한다. 분석에 사용하는 툴도 파이썬, R과 같은 거창한 툴이 아니다. 엑셀로 데이터를 정리해서 분석하는 방법을 친절하게 설명한다. 4장을 읽다보면 통계와 관련된 내용이 쏟아지며 조금 어려울 수 있으나 4장을 빼면 정말 쉬운 책이다. (Head First Statistics, Head First Data Analysis보다 쉬운 책이다!!) 쉽게 쌓을 수 있는 데이터와 쉬운 툴을 이용해서 누구나 데이터를 활용할 수 있도록 방법을 알려준다.
학교에서 실험을 해도 데이터가 나오고, 다이어트를 위해서 칼로리와 운동량을 기록해도 데이터가 나온다. 어떻게 활용하면 좋을지 데이터를 다뤄야 하는 사람이라면 일단 읽자.
- 데이터 과학은 테이블 놀이라고 할 수 있다. (p. 43)
- 데이터라는 렌즈를 통해 복잡다단한 현상에 대한 바르고 정확한 지식을 얻고, 이를 지렛대 삼아 주어진 문제를 해결하려는 사고방식이다. (p. 51)
- 데이터 문제는 문제 해결의 단계에 따라 적절한 도구를 조합해서 사용하는 능력을 요구한다. (p.69)
- 데이터에 기반한 문제 해결의 일반적인 단계. (p. 111)
- 데이터를 다양한 각도에서 관찰하고 이해하는 과정을 탐색적 데이터 분석이라고 부른다. (p.158)
- 표본을 바탕으로 모집단의 특성에 대한 결론을 유도하는 것을 통계적 추론이라고 부른다. (p.183)
- 기계 학습은 실제로 주어진 현상의 단편을 예측할 수 있는 통계적인 모델을 만드는 과정에 지나지 않는다. (p. 211)
- 위대한 업적을 남긴 이들은 자신의 역량에 대한 철저한 측정과 관리를 실천해왔다. (p.233)
- 공공 데이터의 특성상 사회 문제를 다루기에 적합하다. (p. 277)
- 데이터 과학자의 업무에서 세 가지 도전을 뽑는다면 모호함, 변화, 협업일 것이다. (p. 340)