데이터 분석 개요
데이터를 사용하여 스토리를 전달하기 전에 먼저 스토리에서 데이터를 사용할 수 있도록 만드는 프로세스를 거쳐야 합니다. 데이터 분석은 의미 있고 유용한 정보를 검색하기 위해 데이터를 파악하고 정리하며 변환 및 모델링하는 프로세스입니다. 그런 다음 중요한 의사 결정 프로세스를 지원하기 위한 분석용 보고서를 통해 데이터를 스토리로 만듭니다.
세계가 점점 더 데이터 중심이 되어 감에 따라 데이터 분석을 통한 스토리텔링은 모든 규모의 비즈니스에서 매우 중요한 구성 요소이자 측면으로 자리 잡고 있습니다. 이런 이유로 조직에서는 데이터 분석가를 지속적으로 고용하고 있습니다.
데이터 기반 기업은 데이터가 전달하는 스토리를 바탕으로 의사 결정을 내립니다. 오늘날의 데이터 기반 환경에서 대부분의 기업이 직면한 문제는 데이터의 잠재력을 최대한 활용하지 못하고 있다는 점입니다. 고객 감정 평가, 시장 및 제품 연구 수행, 추세 파악 또는 기타 데이터 인사이트를 포함한 데이터 분석은 모든 조직에서 비즈니스에 미치는 영향을 판단하는 데 중요한 부분을 차지합니다.
데이터 분석 프로세스는 데이터 정리, 모델링 및 시각화 작업에 중점을 두고 있지만 데이터 분석의 개념과 비즈니스에 중요한 이유도 간과해서는 안 됩니다. 데이터를 분석하기 위해 분석의 핵심 구성 요소는 다음 범주로 구분합니다.
- 설명적
- 진단적
- 예측적
- 처방적
- 인지적
설명적 분석(Descriptive analytics)
설명적 분석은 기록 데이터를 기반으로 발생한 상황에 관한 질문에 답변하는 데 도움이 됩니다. 설명 분석 기술은 대규모 의미 체계 모델을 요약하여 관련자에게 결과를 설명합니다.
이러한 전략은 KPI(핵심 성과 지표)를 개발하여 주요 목표의 성공 또는 실패를 추적하는 데 도움이 됩니다. ROI(투자 수익률)와 같은 메트릭은 많은 업계에서 사용됩니다. 특수 메트릭은 특정 업계의 성과를 추적하기 위해 개발됩니다.
설명적 분석의 예로는 조직의 판매 및 재무 데이터에 대한 보기를 제공하는 보고서를 작성하는 것을 들 수 있습니다.
진단적 분석(Diagnostic analytics)
진단적 분석을 통해 사건이 발생하는 이유에 대한 질문에 답변할 수 있습니다. 진단적 분석 기술은 기본적인 설명적 분석을 보완하며, 설명적 분석의 결과를 사용하여 사건의 원인을 파악합니다. 사건이 더 개선되거나 악화된 이유를 찾기 위해 성과 지표를 추가로 조사합니다. 이는 일반적으로 다음 세 단계로 수행됩니다.
데이터의 비정상 상태를 파악합니다. 이러한 변칙은 메트릭이나 특정 시장의 예기치 않은 변경 사항일 수 있습니다.
이러한 예외와 관련된 데이터를 수집합니다.
통계학적 기술을 사용하여 이러한 비정상을 설명하는 관계 및 추세를 검색합니다.
예측적 분석(Predictive analytics)
예측적 분석은 향후 발생하는 상황에 관한 질문에 답변하는 데 도움이 됩니다. 예측적 분석 기술은 기록 데이터를 사용하여 추세를 파악하고 이를 되풀이할 가능성이 있는지 판단합니다. 예측 분석 도구는 향후 발생할 수 있는 문제에 대해 유용한 인사이트를 제공합니다. 기술에는 인공신경망, 의사 결정 트리 및 회귀와 같은 다양한 통계학적 기술 및 기계 학습 기술이 포함됩니다.
처방적 분석(Prescriptive analytics)
처방적 분석은 목표를 달성하기 위해 수행해야 하는 작업이 무엇인지에 대한 질문에 답변하는 데 도움이 됩니다. 조직에서는 규범적 분석의 인사이트를 사용하여 데이터 기반 의사 결정을 내릴 수 있습니다. 이 기술을 통해 기업은 불확실한 상황에서도 합리적인 의사 결정을 내릴 수 있습니다. 규범적 분석 기술은 대규모 의미 체계 모델에서 패턴을 찾기 위한 전략 중 하나로 기계 학습을 사용합니다. 조직에서는 과거의 의사 결정 및 이벤트를 분석하여 다양한 결과의 가능성을 예측할 수 있습니다.
인지적 분석(Cognitive analytics)
인지적 분석은 기존 데이터 및 패턴에서 추론을 시도하고 기존 지식 기반을 바탕으로 결론을 도출한 다음, 이러한 결과를 지식 기반에 추가하여 향후 추론에 활용하는 자가 학습 피드백 루프입니다. 인지적 분석을 사용하면 상황이 변경될 때 발생할 수 있는 상황과 이러한 상황에 대응하는 방법을 알 수 있습니다.
추론은 규칙 데이터베이스를 기반으로 하는 정형 쿼리가 아니라 여러 원본에서 수집되고 다양한 정도의 신뢰도로 표현되는 비정형 가설입니다. 효과적인 인지적 분석은 기계 학습 알고리즘에 의존합니다. 여러 자연어 처리 개념을 사용하여 콜 센터 대화 로그 및 제품 리뷰와 같은 이전에 사용하지 않았던 데이터 원본을 해석합니다.
예제
한 소매 기업이 보고 및 데이터 시각화를 사용하도록 설정하여 설명적 분석을 통해 이전 연도의 구매 패턴을 검토하고 내년에 인기 있을 제품을 판단합니다. 이 기업은 특정 제품이 많이 판매된 이유와 이 추세가 지속될지 파악하기 위해 지원 데이터를 확인하여 해당 제품의 재고를 유지해야 하는지 여부를 판단하려고 합니다.
한 기업이 일정한 제품이 특정 기간에 많이 판매되었다고 판단할 수 있습니다. 그다음에 분석을 통해 마케팅 활동 또는 온라인 소셜 활동이 매출 증가에 기여했는지 여부를 판단할 수 있습니다.
데이터 분석의 기본 측면은 기업에서 데이터를 신뢰할 수 있어야 한다는 점입니다. 실제 데이터 분석 프로세스는 신뢰할 수 있는 원본에서 데이터를 가져와서 활용할 수 있고 의미가 있으며 해석할 수 있는 형태로 만들어 비즈니스 의사 결정을 내릴 수 있도록 합니다. 기업은 데이터 분석을 활용하여 데이터 기반 프로세스 및 의사 결정을 통해 데이터를 완벽하게 해석할 수 있으며 의사 결정에 확신을 가질 수 있습니다.
데이터의 양이 증가하면서 데이터 분석가에 대한 수요도 증가하고 있습니다. 데이터 분석가는 정보를 구성하고 관련 있고 이해할 수 있는 정보로 정제하는 방법을 알고 있습니다. 데이터 분석가는 적절한 데이터를 수집하는 방법과 이를 사용하여 할 수 있는 작업을 알고 있습니다. 즉, 쌓여 있는 데이터를 해석할 수 있습니다.