데이터 분석가의 일 : 데이터 분석 프로세스(4) - 마무리
데이터 분석 프로세스 시리즈
데이터 분석가의 일 : 데이터 분석 프로세스(1) - 기획&EDA
데이터 분석가의 일 : 데이터 분석 프로세스(2) - 데이터 적재 feat SQLite3
데이터 분석가의 일 : 데이터 분석 프로세스(3) - 분석&시각화
데이터 분석가의 일 : 데이터 분석 프로세스(4) - 마무리
리포트는 그래프로만 구성되지 않는다. 그래프를 설명하는 텍스트도 필요하며, 데스크 서치를 벗어날 수도 없다. 이제 만들어진 그래프에 설명을 더하면서 필요한 것만 추가적인 리서치를 하면 된다. 그리고 찾는 자료들은 파워포인트에 출처를 꼬박꼬박 표기하기만 해도 수집한 자료를 정리하는데 정말 많은 도움이 될 것이다
그래프에 대한 설명이 필요할 수 있다. 매출이 100억인데 그래프에는 증가율이 표시되어있지 않다. 증가율을 설명하기 위해선 증가율을 산출해야 하며, 이럴 때 Jupyter Notebook을 사용하면 빠르게 내가 필요한 숫자들만 산출해서 사용할 수가 있다
데이터를 분석하고 리포트를 작성하는 과정에서 다시 앞 순서로 돌아가는 상황이 발생할 수 있다. 함수의 순서가 바뀌거나 새로운 데이터를 데이터베이스에 적재해야 하는 순간이 올지도 모른다. 하지만 너무 짜증 내지 마시라, 엑셀로만 작업하던 시절에도 이런 상황은 비일비재했다.
소스코드가 수정될 때마다 여간 번거로운 일이 아니지만, 향후 다시 재활용하는 데에는 엑셀보다 훨씬 더 많은 도움이 된다. 함수만 잘 관리해도 시간이 지날수록 엑셀과 파워포인트에 의존하는 것보다는 훨씬 더 빠르게 작업을 할 수 있다
Python에는 pptx라는 파워포인트를 조작하는 패키지가 있다. 사실 이 패키지를 사용해서 페이지의 타이틀, 본문, 이미지, 차트 등을 추가하고 페이지를 조작할 수도 있다. 하지만 아직 이를 권장하지 않는 이유는 pptx에는 추가한 요소 또는 페이지를 지우는 함수가 없다. 때문에 한번 실수하면 처음부터 다시 시작하거나, 그때그때 코드를 수정해야 하는 번거로움이 있다. 30-40페이지의 리포트를 만들어야 하는 사람들에게는 더더욱
증권사에서 발간하는 위클리, 데일리 리포트는 포맷이 정해져있기 때문에 pptx를 활용해도 좋을 것이다. 하지만 클라이언트의 의뢰를 받아 커스터마이징 하게 제작되는 리포트라면 번거롭더라도 파워포인트는 수작업으로 하길 바란다