SQL로 시작하는 데이터 분석
문화이야기/도서이야기☆

SQL로 시작하는 데이터 분석

2022년의 마지막 날이 얼마 남지 않았습니다. 정말 시간이 전광석화같이 매우 빠르게 흐르는 것 같습니다. 이번 시간에는 2022년 8월에 출간된 <SQL로 시작하는 데이터 분석>을 소개합니다. 이 책의 부제는 <실무에 꼭 필요한 분석 기법 총정리! 실전 데이터셋으로 배우는 시계열, 코호트, 텍스트 분석>입니다.

이 책의 저자는 캐시 타니무라(Cathy Tanimura) 님이며, 다양한 산업 분야에서 데이터를 분석했고, 여러 컨퍼런스에서 데이터 문화 구축, 데이터 기반 제품 개발 등을 주제로 강연 활동을 활발히 하고 있습니다. 그리고 역자는 박상근 님입니다. 박상근 님이 번역한 책은 읽어보지 못했지만, 번역 품질은 나쁘지 않습니다. 

이 책의 원서는 아마존에서 5점 만점에 4.6점을 받고 있으며, 원서는 2021년 10월 초에 출간되었습니다.  

<SQL로 시작하는 데이터 분석>은 약 440페이지로 구성되어 있어 휴대하면서 읽기에 크게 부담스럽지 않습니다. 전자책으로도 출간되어 있으므로, 전자책 뷰어가 있으시다면 전자책으로 만나보는 것도 좋을 것 같습니다.

이 책의 저자가 강연한 영상을 하나 보고 더 이야기를 진행해 보겠습니다.

"Data + Scale + Community = Impact" by Cathy Tanimura, Sr Dir of Analytics & Data Science @ Strava

한빛미디어 평가단에 참가하여 작성한 글이며, 한빛미디어에서 제공해준 책을 읽고 작성했음을 밝힙니다. 

 

이 책의 매력은?

<SQL로 시작하는 데이터 분석>은 9장으로 구성되어 있습니다. 1장 SQL을 활용한 데이터 분석부터 9장 결론으로 마치기까지 SQL을 활용하여 데이터를 분석하는 방법을 알려줍니다. 실제 데이터 셋을 활용하여 예제를 진행하므로 거부감 없이 저자가 전달하는 지식을 자연스럽게 습득할 수 있습니다. 

이 책의 특징 중 하나는 SQL을 활용하여 데이터 분석합니다. SQL을 기반으로 구성한 책을 찾는 것은 쉽지 않습니다. 조금 생각해보면 그 이유를 알 수 있는데 SQL은 시각화를 위한 별도의 도구가 필요하므로 데이터 분석 책에서 다루기는 쉽지 않을 것입니다. 이런 문제로 데이터 분석을 다루는 대부분의 책은 파이썬이나 R 등을 활용하고 있습니다. 결과 데이터를 다양한 방법으로 도식화가 가능하고 SQL보다 파이썬과 R 등의 문법과 개념에 익숙한 개발자가 많기 때문입니다.

개인적으로 이 책을 보는 데 어렵지 않았습니다. 이 책의 저자에게 바람이 있다면, 이 책을 시리즈화하여 조금 더 고급 기법 등을 다루는 책이 출간되었으면 좋겠습니다. 그럼 더 재미있게 탐구하면서 읽을 수 있을 것 같습니다. 

이 책에서 다루는 내용을 꼼꼼히 학습하여 내재화한다면 하나의 무기를 더 가질 수 있을 것입니다. 필자는 데이터를 좋아하므로 이 책을 재미있게 읽었고, 평소에 후배들에게 강조하며 전달하는 지식들을 이 책의 여기 저기에 깔끔하게 정리해 두고 있어 세미나 교재로 활용하기에도 적합한 것 같습니다. 

 

마치면서

이 책은 SQL을 활용하여 데이터를 분석하는 방법을 소개합니다. 이 책의 소개 페이지에 'SQL 데이터 분석이 익숙하지 않은 초급자와 더 나은 쿼리 및 분석 방법을 찾는 SQL 숙련자 모두를 위한 가이드'라고 언급하고 있는데, 이 책을 잘 요약한 문장이라고 생각합니다. 단, SQL 입문서라는 의미는 아닙니다. SQL을 모르는 분들이 보기에 적합한 책은 아닙니다. 

애플리케이션을 개발하는 과정에서 SQL은 매우 중요합니다. 하지만 생각보다 그 중요성을 인지한 분들은 많지 않은 것 같습니다. SQL을 처음 접하는 분들에게는 추천하기 어렵겠지만, SQL을 학습한 후 다양한 응용에 도전하고 싶은 분들은 이 책이 꽤(?) 재미있게 다가올 것 같습니다. 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."