의사결정 Flashcards
BI 3.0
[리드] 비즈니스 의사결정 지원
[정의] 비즈니스에서 과거 성과 데이터는 물론 각종 데이터로부터 의사결정에 필요한 정보를 실시간으로 획득 및 분석, 활용하기 위한 체제
[특징] 실시간 데이터 분석 가능, Big Data 도 분석대상에 포함, 기존 BI 의 한계 개선
[구성요소] (전분확인정)
- 전략 BI : 경영성과 관리, 전략실행 모니터링 (SEM, VBM, BSC)
- 분석 BI : 분석을 위한 다양한 정보를 생성, 제공 (OLAP, 데이터마이닝)
- 확장 BI : 기업 내,외부 이해 관계자와 생성되는 데이터를 분석 (CRM, SCM)
- 인프라 : 인텔리전스를 구현하기 위한 다양한 기술 (ETT, DW, Data Mart)
- 정보전달 : 사용자의 요구에 맞게 인텔리전스 정보를 통합하여 제공 (포탈, 경보 솔루션)
[주요 핵심기술]
- 수집 : ETL, Collector(정형, 비정형)
- 처리 : ODS(운영데이터 저장), Hadoop
- 저장 : Big Data, HDFS, Data Lake, Data Mart, In-Memeory DB
- 분석 : DW, OLAP, Text 마이닝, Data 마이닝, SaaS
- 시각화 : 대시보드, 보고서
OLTP
[정의] 트랜젝션 중심으로 거래 데이터의 정확한 처리 기능 제공
[주요기능] Insert, Update, Commit, Rollback
[구현기술] TP-monitor, CS, EJB, ODBC
OLAP
[정의] 최종 사용자가 다차원 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용하는 과정 및 도구
[주요기능] Drill Down/Up, Pivot, Slice, Dice
[구축과정] OLTP (ETL, 내부/외부 데이터) → DW(통합 Repository → Data Mart(부서, 업무 단위) → OLAP(다차원 질의어)
[유형] MOLAP(다차원), ROLAP(RDBMS), HOLAP(MOLAP+ROLAP), DOLAP(클라이언트 저장)
* 데이터 마이닝을 통해 체계적이고 보다 효율적인 데이터 정제 및 통계 작업 지원
데이터 마이닝
[정의] 대용량 데이터을 관계패턴 탐색, 모델링하여 의미있는 정보로 변환, 기업 의사결정에 활용하는 기법
[대상] 수치화 및 범주화된 데이터, 정형 데이터/비정형 데이터
[프로세스]
- KDD (추전변마해평) : Selection(추출) → Pre-Processing(전처리) → Transformation (변환) → Data Mining(모델링선택) → Interpretation(해석) → Evaluation(평가)
- SEMMA : Sample, Explore, Modify, Model, Access
- CRISP-DM : (업데준모평전)업무 이해 → 데이터 이해 → 데이터 준비 → 모델링 → 평가 → 전개
[정형 데이터 마이닝] (연연분데특신의)
- 연관성 규칙 : 지지도(Support), 신뢰도(Confidence), 향상도(lift)
- 연속성 분석 : 시계열 분석, Apriori AL
- 분류 분석 : Decision Tree, 신경망 분석, 베이지안, 로지스틱 회귀, 앙상블
- 데이터 군집 분석 : K-Means, EM Clustering, 계층적 군집, SOM
- 특성화(개인화 추천) : 협업 필터링
- 신경망 분석 : MLP, CNN, RNN
- 의사결정트리 : (변수) 순도, 불순도, 불확실성 (과정) 재귀적분기, 가지치기
[비정형 데이터 마이팅]
- 텍스트 마이닝, 오피니언 마이닝
[차별화] 체계적, 자동화 기반 빅데이터 분석 방안 → 빅데이터 프레임워크 구축, DataOPs
프로세스 마이닝
[정의] 정보시스템 로그를 분석하여 업무수행 결과에 대한 정보 및 지식을 추출하여 업무 프로세스를 분석하는 활동 및 방법론
[필요성] 비즈니스 지속적 변화 적용, BPA/CPM 한계 탈피, 프로세스 비가시성/복잡성 해소
[특징] 인터뷰 없이 데이터로부터 도출 [목적] 프로세스 식별, 가시화, 개선
[기법] 1.프로세스 도출(모델 발견) 2.적합도 검사(진단,개선) 3.향상(신규 모델)
[기술요소] 1.도출식별 관점(알파/휴리스틱/퍼지 마이닝), 2.조직 관점(소셜 네트워크/조직/스탭 어사인먼트 마이닝), 3.업무성과 관점(Petri Net 기반 퍼포먼스 분석, 시퀀스 패턴, 도티드 차트분석)
웹 마이닝
[정의] 웹 환경에서 고객 데이터를 추출,저장,분석하여 특정 행위/패턴 등 가치 있는 정보를 도출 의사 결정에 활용하는 마이닝
[구성] 추출(시멘틱,HTML,웹로그,웹크롤링) 2.저장(DW,DM) 3.분석(연관,연속,분류,군집)
오피니언 마이닝
[정의] SNS의 대량의 리뷰로부터 사용자가 원하는 정보를 빠르게 분석해 주고, 유의미한 정보를 지능적으로 유추해내는 Mining 기술
[배경] 소셜 네트워크(영향력 확대), 기업의 잠재위기 감지(브랜드 이미지, 서비스 후기)
* 웹 상에서 다양한 의견 데이터를 수집하여 긍정/부정 감정적인 요소를 분석하여 결과 도출
[메커니즘]
1. 크롤러 : 수집환경, 수집데이터, Hadoop HDFS, HBASE
2. NLP & Text Mining : 카테고리 자동분류, 감성분석, 키워드 분석
3. 검색 & 서비스 API : 색인, 검색&요약, 서비스API
4. 대용량 지원 : HDFS, 대용량 데이터 저장
* 사용자에게 신뢰도 높은 종합적인 평판 정보 제공을 목표
텍스트 마이닝
[정의] 비정형, 반정형 텍스트 데이터를 자연어 처리 기술에 기반하여 유용한 정보를 추출하여 가공하는 것을 목적으로 하는 기술
[기능] 문서 요약, 문서 분류, 문서 군집, 특성 추출
[대상] SNS 메시지, E-Mail, WEB Page
[절차]
1. 문서 수집 : 크롤링, API, HTML 파싱
2. 문서 전처리 : 문장 부호 제거, 특정 패턴 제거, 대체
3. 텍스트 분석(자연어 처리) : NPL, GPT
4. 결과 해석 및 정제 : 시각화 표시, 오피니언 마이닝
AHP
[리드] 계층화 분석법
[정의] 우선순위 도출위해 두 Factor 간 Pare-wise, 행렬화 연산 이용한 가중치 산정 기반 의사결정 도구
[원칙] Hierarchies(복잡한 상황의 구조화), Priorities(상대적 가중치 도출), Consistency(논리적 타당성 검증)
[특징] Pare-wise(행렬 곱 연산, 중요도 도출), 정량적 우선순위 도출(정량적 가중치 산정)
* 이론 단순성, 명확성, 적용 용이성 장점 활용, 범용적 적용 기법
[분석단계] 계쌍부일최
1. 계층적 모형 구축 : 의사결정 계층 구성
2. Pare-wise 수행 : 쌍대 비교 수행/입력
3. 부분 우선순위 도출 : 상대적 가중치 추정/계산, 행렬곱 연산
4. 일관성 검사(CR) : CR < 0.1 : 일관적, CR>=0.1 : 재비교
5. 최종 우선 순위 계산 : 모든 비교행렬 가중치, 최댓값 의사 결정
* AHP의 경우 구성요소간 독립성 가정, 수평적 상호관계 고려 부족
[차별화] AHP 수평적 상호관계 고려한 개선 방안
- ANP : 1) 네트워크 구조, 각 구성요소간 상관관계 고려, 2) 내,외부 종속성 대행렬 표현, 군집내, 사이 교호작용/피드백 포함