데이터 분석을 위한 SQL 레시피
문화이야기/도서이야기☆

데이터 분석을 위한 SQL 레시피

최근 데이터의 폭발적인 증가로 말미암아 다양한 응용 서비스에서 데이터 분석은 매우 중요한 위치를 차지합니다. 데이터 분석을 효과적으로 진행하려면 준비사항이 많은데, 그 중에서도 필수적인 요건 중 하나가 SQL 활용법입니다.


과거 필자의 블로그 글을 읽은 분은 아시겠지만, 필자의 주요 관심사가 데이터 분야이므로 평소에 SQL 활용법에 많은 관심을 갖고 있습니다. <데이터 분석을 위한 SQL 레시피>에는 간결하면서도 실제 환경에서 활용할 수 있는 유용한 예제가 포함되어 있습니다. 아주 재미있는 책을 리뷰하는 데 도움을 주신 한빛미디어 관계자님께 깊은 감사의 말씀을 전합니다.


The Book INSIDE

[제목] 데이터 분석을 위한 SQL 레시피

[평점] ★★★★


[저자] 가사키 나가토, 다미야 나오토 지음

[링크] 도서소개 | 미리보기


한빛미디어 | 2018-04-01

600쪽 | ISBN(13) : 9791162240601



가사키 나가토

게이오대학 대학원과 학생 벤처에서 멀티미디어 데이터베이스를 대상으로 한 검색 및 추천 알고리즘의 연구와 서비스를 개발했습니다. 현재는 (주)DMM.com 연구소에서 빅데이터를 활용하기 위한 기반 시스템 구축, 스파크와 SQL on Hadoop을 이용한 추천 기능 및 빅데이터 활용에 대한 연구와 개발을 하고 있습니다.


다미야 나오토

대형 신문사에서 구인 서비스와 커뮤니티 서비스를 개발하다가 (주)사이버에이전트로 이직하면서 데이터 애널리스트로 변신했습니다. (주)DMM.com 연구소에서는 빅데이터 부서를 세웠고 현재는 데이터 컨설턴트 프리랜서로 활약 중입니다. 데이터 분석은 물론 데이터 분석 환경의 설계와 구축, 로그 설계, 추천 API 작성 등 데이터 관련 업무를 전반적으로 다룹니다.


이 책에서 다루는 내용은?

SQL은 관계형 데이터베이스 관리 시스템과 대화하는 데 꼭 필요한 언어입니다. SQL을 처음 접해보면 다른 언어와 비교했을 때 학습하기 어렵지 않다고 느끼신 분들이 많을 것으로 생각합니다. 실제로 언어에 감각이 있으신 분들이라면 일주일 안에 모든 문법적인 요소를 학습할 수 있을 것입니다. 하지만 SQL을 학습하는 것과 효율적으로 사용하는 것은 완전히 다른 문제입니다. SQL을 효율적으로 활용할 수 있다면, 성능의 희생 없이 데이터 분석 응용 프로그램에서 발생하는 다양한 요구사항을 간단하게 만족할 수 있을 것입니다.


<데이터 분석을 위한 SQL 레시피>는 일본의 저자가 작성한 책입니다. 일본에서 많이 활용하는 오픈소스 데이터베이스 관리 시스템인 PostgreSQL을 기반으로 설명합니다. 오라클을 기준으로 설명했다면 국내 독자들이 더 좋아했을 것 같습니다만, 필자는 PostgreSQL을 많이 사용해봐서 친근하면서도 재미있게 읽을 수 있었습니다.


PostgreSQL을 비롯하여 Apache Hive, Amazon Redshift, Google BigQuery, SparkSQL 등 다양한 데이터 관리 시스템에서 활용하는 사례도 함께 소개하고 있어 RDBMS가 아닌 다른 영역으로 도메인을 넓히는 기회도 얻을 수 있습니다. 데이터 분석에 관심이 많은 분이라면, 데이터 분석에 매우 유용한 프레임워크인 Spark를 꼭 한 번 살펴보셨으면 좋겠습니다.


<데이터 분석을 위한 SQL 레시피>에서 소개하는 큰 주제 목록은 다음과 같습니다.


- 데이터 가공을 위한 SQL

- 매출을 파악하기 위한 데이터 추출

- 사용자를 파악하기 위한 데이터 추출

- 웹 사이트에서 사용자 행동을 파악하는 데이터 추출

- 데이터 활용의 정밀도를 높이는 분석 기술

- 데이터를 무기로 삼기 위한 분석 기술


위 내용은 데이터를 가공 및 추출하고 분석하는 기법에 대해 소개를 했다면, 필자가 가장 인상 깊었던 부분은 이 책의 마지막 챕터입니다. 실제 업무에 활용하는 방법에 대해 소개를 하고 있으며, 이 책을 읽기 전에 이 챕터부터 읽는 것도 나쁘지 않은 선택인 것 같습니다.


<데이터 분석을 위한 SQL 레시피>는 SQL을 많이 활용한 경험이 있으신 분들에게 추천합니다. SQL에 대한 기본 문법만 이해하고 있는 사람이 읽기에는 다소 어려울 수 있습니다. 기존에 SQL을 사용한 개발자가 이 책을 읽는다면, 한 단계 더 나아가는 개발자가 될 수 있을 것입니다.


마치면서...

<데이터 분석을 위한 SQL 레시피>를 읽은 후, 필자는 이 책을 읽은 독자의 SQL 활용 기술을 한 단계 높여줄 수 있는 책이라고 확신합니다.


SQL 문법을 소개하는 책이 아니므로 이 책에서 소개하는 문법들의 설명이 조금 불친절하다고 느낄 수 있습니다. 하지만 어려운 문법은 아니므로 매뉴얼을 참조하여 관련 문법을 이해하는 데 큰 어려움은 없을 것으로 생각합니다.