데이터분석가(Data scientist)의 자격요건 및 필요역량
- 쇼셜이노베이션융합전공
- 조회수523
- 2021-04-13
빅데이터전문가는 크게 개발분야와 분석분야로 나뉘어지게 됩니다.
빅데이터전문가 개발분야는 빅데이터 플랫폼을 구축하여 수집된 데이터를 저장하고 분석프로그램을 통해 분석업무를 수행하며, 분석분야에서는 처리된 결과값을 분석하여 새로운 가치있는 정보를 생산하게 됩니다.
데이터 분석가라고 불리우는 직업군이 주목을 받게 된 것도 빅데이터 분석을 통해 무궁무진한 비즈니스 기회를 찾아낼 수 있기 때문입니다. Job market에서도 데이터분석가에 대한 수요가 점점 커짐에 따라 이들의 몸값도 올라가는 추세입니다. Harvard Business Review에서는 수년 전에 이미 Data scientist를 “The sexist job in the 21st century“로 규정하면서, 2020년대가 되면 특정 영역에서는 데이터 분석가에 대한 수요가 공급을 훨씬 초과하는 현상이 발생할 것이라고 예측한 바 있습니다.
Source: www.techjuice.pk
기업 마다 조금씩 다르겠지만, 데이터 분석가의 가장 중요한 역할은 의사결정자가 data-informed decision을 할 수 있도록 적절한 시기에 정보를 제공하는 역할일 것입니다. 여기서의 정보는 기술 통계적인 데이터(평균, 합계 등)에서 부터, 보다 복잡한 현상을 해석하고 예측하는 모델에 이르기 까지 다양합니다. 데이터 분석가의 전문성이 높아질 수록 보다 정교하면서도 설명력/예측력이 높은 모델을 제공할 수 있습니다.
· DB에 쌓인 데이터 또는 대시보드 또는 애널리틱스 도구(Google Analytics, Facebook Analytics, ...)를 통해 전사적 의사결정에 도움이 될 데이터 분석을 실시
· 가설에 기반한 데이터 분석
· 타 부서의 요청 데이터 처리
· 주로 Business 팀, Operation 팀, Data 팀에 속함
· 신규 이벤트 로그 설계 ex) 새로 추가되는 A 화면에서 회원가입하는 경우 로그 추가
· 기획자적 성향 존재 (가설 검증 및 결론 도출)
· 대시보드 생성 및 관리
· KPI(Key Performance Indicator : 핵심 성과 지표) 설정
최근 데이터분석가 채용 공고에 자주 언급되는 자격 요건은 주로 로그 설계, 데이터 추출 및 분석, 통계모델링, SQL, 전사적 의사결정, 데이터에 기반한 KPI 기획, 가설을 통한 분석, 데이터마이닝, 애널리틱스 도구, 데이터 시각화 등이 있습니다.
Source: https://www.slideshare.net 서비스 기획자를 위한 데이터분석 시작하기
■ 데이터 분석가에게 필요한 역량
데이터 분석가는 의사 결정을 위한 “정보”를 제공하는 사람을 말합니다. 즉, 데이터 분석가에게는 이러한 말씀드린 정보(기술 통계적인 정보에서 예측 모델까지를 통칭해서)를 제공하기 위한 역량이 핵심적입니다.
첫째, 데이터에 대한 이해
가트너는 빅데이터의 특징을 3V (양Volume, 다양성Variety, 속도Velocity)의 세가지로 정의한 바 있습니다. 데이터가 복잡하고 방대해 졌다는 뜻인데요, 그렇기 때문에 데이터 자체에 대한 이해 없이는 좋은 분석가가 되기 어렵습니다. 데이터 분석가는 데이터베이스에서 자신이 원하는 데이터를 추출할 수 있어야 합니다. 회사마다 DB구조가 다르고, 주로 분석하는 영역이 다르기는 하지만 대부분 RDBMS를 사용하기 때문에 어떤 분야던지 SQL에 대한 이해는 필수적이라고 할 수 있습니다.
둘째, 통계 및 분석 방법에 대한 이해
제대로 된 데이터 분석을 하기 위해서는 통계적 지식이 필수적입니다. 물론 기존의 통계학에만 정통해서는 데이터 분석 업무를 잘 수행해 내기 힘듭니다. 계속해서 다양한 분석 기법들이 쏟아져 나오고, 기존의 분석 기법들이 업그레이드 되기 때문입니다. 데이터 분석 방법은 분야도 다양하고, 점점 깊어지는 추세이기 때문에 대략적인 분석 방법을 아는 것 만큼이나 자신의 전문 영역을 확보하는 것도 중요합니다. 이 부분은 데이터 분석가가 된 이후에도 계속 습득해 나가야 하는 부분입니다.
셋째, 분석 Tool에 대한 이해
MS Excel은 다양한 기능이 있고, 사용하기 매우 편리하지만, 위에서 언급한 분석 기법을 모두 지원하지는 않습니다. 따라서 데이터 분석가는 분석을 위한 전용 Tool을 사용할 수 있어야 합니다. 데이터 분석을 위한 다양한 Tool이 있는데, 자신과 잘 맞는다고 생각하는 Tool을 하나 정해서 익히면 됩니다. 가장 자주 사용되는 분석 Tool에는 아래와 같은 것들이 있습니다.
· 오픈소스: R, Python
· 유료: SAS, SPSS
유료 Tool의 경우 보다 사용하기 쉬운 UI를 제공하지만 코딩이 익숙하지 않은 분들이 비교적 쉽게 습득할 수 있다는 장점이 있습니다. 오픈소스는 무료라는 점, 사용자가 다양하기 때문에 다양한 기능이 지원된다는 점이 매력적입니다.
넷째, 커뮤니테이션 및 결과 전달 능력
데이터 분석가에게는 커뮤니케이션을 잘 하는 것이 다른 직업군 보다 더욱 중요합니다. 데이터가 다른 여러 부서와 관련이 되어 있기 때문이기도 하고, 분석 결과 또한 다른 부서, 의사 결정자가 활용하기 때문입니다. 내가 분석한 데이터의 결과를 필요한 사람/부서에서 잘 이해하도록 전달하는 능력도 필수적인 스킬입니다. 이를 위해서는 잘 구성된 Storyline을 적절히 시각적으로 보여주는 것이 필요합니다. 스토리텔링의 영역에서는, 데이터가 어떻게 받아들여 질지, 이해관계자 입장에서 쉽게 이해할 수 있도록 계속 고민하는 것이 필요합니다. 데이터 시각화 영역에서는, 간단한 데이터 분석의 결과를 전달할 때는 PPT나 엑셀 그래프도 여전히 자주 사용되지만, 최근에는 tableau나, R의 ggplot2 패키지 등 보다 다양한 시각화 기능을 지원해 주는 Tool들을 점점 더 많이 활용하는 추세입니다.
* 서비스 기획자를 위한 데이터 분석 시작하기: 주니어 기획자를 위한 데이터분석 입문
https://www.slideshare.net/leoyang991/ss-90038927
* 데이터 분석가
https://github.com/Team-Neighborhood/I-want-to-study-Data-Science/wiki/%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B0%80
* 출처: 데이터 분석가(Data scientist)에게 꼭 필요한 4가지 역량: http://www.dodomira.com/2016/02/26/%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B0%80%EC%97%90%EA%B2%8C-%ED%95%84%EC%9A%94%ED%95%9C-4%EA%B0%80%EC%A7%80/ |