데이터 분석 살펴보기
데이터 분석은 데이터를 검토하고 변환하고 정렬하는 것과 관련되며 유용한 정보를 검토하고 추출할 수 있도록 해줍니다. 데이터 분석은 데이터 관리 작업의 전체 범위를 포함하는 분야입니다. 이러한 작업에는 분석뿐만 아니라 데이터 컬렉션, 조직, 스토리지, 사용되는 모든 도구 및 기법이 포함됩니다.
‘데이터 분석’이라는 용어는 각각 자체적인 중점 및 목표를 가진 다양한 작업을 포괄합니다. 이러한 활동은 ‘설명적’, ‘진단적’, ‘예측’, ‘처방적’ 및 ‘인지적’ 분석 등으로 분류할 수 있습니다.
이 단원에서는 이러한 데이터 분석 범주에 대해 알아봅니다.
설명적 분석(Descriptive analytics)
설명적 분석은 기록 데이터를 기반으로 발생한 상황에 관한 질문에 대답하는 데 도움이 됩니다. 설명적 분석 기술은 관련자에게 결과를 설명하기 위해 대규모 데이터 세트를 요약합니다.
이러한 전략은 KPI(핵심 성과 지표)를 개발하여 주요 목표의 성공 또는 실패를 추적하는 데 도움이 됩니다. ROI(투자 수익률)와 같은 메트릭은 많은 업계에서 사용됩니다. 특수 메트릭은 특정 업계의 성과를 추적하기 위해 개발됩니다.
설명적 분석의 예로는 조직의 판매 및 재무 데이터에 대한 보기를 제공하는 보고서를 작성하는 것을 들 수 있습니다.
진단적 분석(Diagnostic analytics)
진단적 분석을 통해 현상이 발생하는 이유에 대한 질문에 답변할 수 있습니다. 진단적 분석 기술은 더 기본적인 기술 분석을 보완합니다. 설명적 분석의 결과를 확인하고 더 심층적으로 분석하여 원인을 파악합니다. 더 개선되거나 악화된 이유를 찾기 위해 성과 지표를 추가로 조사합니다. 이는 일반적으로 다음 세 단계로 수행됩니다.
- 데이터의 비정상 상태를 파악합니다. 이는 메트릭이나 특정 시장의 예기치 않은 변경 사항일 수 있습니다.
- 이러한 예외와 관련된 데이터를 수집합니다.
- 통계학적 기술을 사용하여 이러한 비정상을 설명하는 관계 및 추세를 검색합니다.
예측적 분석(Predictive analytics)
예측적 분석은 향후 발생하는 상황에 관한 질문에 답변하는 데 도움이 됩니다. 예측적 분석 기술은 기록 데이터를 사용하여 추세를 파악하고 이를 되풀이할 가능성이 있는지 판단합니다. 예측 분석 도구는 향후 발생할 수 있는 문제에 대해 유용한 인사이트를 제공합니다. 기술에는 인공신경망, 의사 결정 트리 및 회귀와 같은 다양한 통계학적 기술 및 기계 학습 기술이 포함됩니다.
처방적 분석(Prescriptive analytics)
처방적 분석은 목표를 달성하기 위해 수행해야 하는 작업이 무엇인지에 대한 질문에 답변하는 데 도움이 됩니다. 예측적 분석의 인사이트를 사용하여 데이터 기반 의사 결정을 내릴 수 있습니다. 이 기술을 통해 기업은 불확실한 상황에서도 합리적인 의사 결정을 내릴 수 있습니다. 처방적 분석 기술은 대규모 데이터 세트에서 패턴을 찾기 위해 기계 학습 전략을 사용합니다. 과거의 의사 결정 및 이벤트를 분석하여 다양한 결과의 가능성을 예측할 수 있습니다.
인지적 분석(Cognitive analytics)
인지적 분석은 기존 데이터 및 패턴에서 추론을 시도하고 기존 지식 자료를 바탕으로 결론을 도출한 다음, 이러한 결과를 지식 자료에 추가하여 향후 추론에 활용하는 자가 학습 피드백 루프입니다. 인지적 분석을 사용하면 상황이 변경될 때 발생할 수 있는 상황과 이러한 상황에 대응하는 방법을 알 수 있습니다.
추론은 규칙 데이터베이스를 기반으로 하는 정형 쿼리가 아니라 많은 원본에서 수집되고 다양한 정도의 신뢰도로 표현되는 비정형 가설입니다. 효과적인 인지적 분석은 기계 학습 알고리즘에 의존합니다. 여러 NLP(자연어 처리) 개념을 사용하여 콜 센터 대화 로그 및 제품 리뷰와 같은 이전에 사용하지 않았던 데이터 원본을 해석합니다.
이론적으로는 대규모 병렬/분산 컴퓨팅의 이점을 활용하고 데이터 스토리지 및 컴퓨팅 성능의 비용을 감소시키면 이러한 시스템에서 달성할 수 있는 인지적 개발은 무한합니다.