보통날의/데이터 공부

데이터 분석가(데이터 사이언티스트)에게 왜 통계가 필요할까?

알 수 없는 사용자 2020. 8. 24. 23:47

대기업이나 스타트업들의 데이터 분석가 채용 공고 JD는 제품과 서비스의 성과 지표를 측정하고 의사결정 지원에 필요한 데이터와 인사이트를 제공하는 역할로 기술되어있다. 그렇다. 기업이 데이터 분석가에 기대는 역할은 제공하는 서비스의 성과를 좀 더 객관적으로 측정해 줄 사람이다

 

그리고 이런 기업들은 한 가지 공통점이 있다. 웹이나 앱 기반 서비스를 제공한다는 점이다. 인터넷 환경이 아닌 실물 제품을 파는 회사들은 왜 데이터 분석가를 뽑지 않는 걸까? 이유는 생각보다 간단했다. 제약회사에는 이미 수많은 연구진들이 매일같이 데이터를 가지고 실험을 한다. 생산 공장 또한 스마트 팩토리 시스템을 구축하기 위해 솔루션을 활용한다. 포드와 테일러가 고안한 시스템들도 과학적인 근거에 기반한 것 임을 잊지 말자. 데이터 분석가의 역사는 이미 유구하다

 

다시 본론으로 돌아오자. 그럼 요즘 각광받고 있는 데이터 분석가는 어떤 사람일까? 말 그대로 웹이나 앱 기반의 서비스를 제공하면서 축적된 데이터를 활용해 더 나은 서비스를 만드는 데 필요한 분석을 하는 사람이다

 

데이터 분석가에겐 통계가 왜 필요할까? 그건 바로 인터넷 서비스를 통해 축적된 데이터가 마치 방대한 실험실과 같기 때문이다

 

데이터 분석가에게 통계지식이 필요한 이유는 단순히 머신러닝 같은 모델을 활용하기 위함이 아니었다. 머신러닝 또한 실험 속 결과를 찾기 위해 필요한 도구일 뿐, 분석가는 주어진 데이터를 마치 실험처럼 설계하고 분석하는 능력이 필요하다. 물론 다루는 데이터 또한 실험실과 유사한 조건과 특징을 갖추는 것도 전제 조건이다

 

데이터 분석가가 되고자 하는 이들이라면, 주어진 데이터를 마치 방대한 실험이라 생각하고 PPDAC(Problem → Plan → Data → Analysis → Conclusion) 단위로 행동하는 것을 배웠으면 한다. 그리고 서비스의 성과를 특정하기 위해 필요한 데이터 수집 기술, 데이터 분석 기술, 데이터 문해력 등을 키우기 위해 끊임 없이 공부를 해야 한다

 

만약 통계를 배우고 싶은 마음이 없어도 데이터 애널리스트가 될 수 있다. 나처럼 리서치펌같은 회사에서 애널리스트가 되어도, 클라이언트들은 숫자를 잘 보는 사람을 데이터 애널리스트라고 부른다. 뭐, 실험이 필요 없는 분석도 많으니까

 

다만, 문과생도 할 수 있다며 R이나 Python을 배우고, 심지어 나처럼 퇴사해서 국비지원 교육과정에 참여할 정도라면, 목표하고자 하는 데이터 분석가(데이터 사이언티스트)는 분석가보다는 과학자에 더 가까운 사람이라는 것을 알았으면 좋겠다