데이터 활용 Flashcards

1
Q

인공지능 학습 데이터

A

[특성]
- 데이터 측면 : 비정형 데이터 다수(텍스트, 음성,이미지), 파일단위 관리 (DB가 아닌 학습 데이터 파일 단위)
- 상이한 품질 측면 : 데이터 획득(획득,정제, 라벨링 과정 필요), 데이터 정제 (정제 과정을 통해 학습 데이터로 가공), 데이터 학습(학습을 위한 참값 부여)
- 품질 결정 특성 : 구축 과정에서 품질 결정
- 평가 특성 : 모델의 성능 측정 결과로 데이터 품질 수순을 평가 하려는 특성
[구축절차] 임무정의 → 획득 → 정제 → 라벨링 → 학습 → 저장
[획득방법]
- 공통 데이터 획득(원시 데이터 직접 제작, 내/외부 기관 데이터 수집), - 텍스트 데이터(API, 웹크롤링), - 음성/영상 데이터(녹음, 촬영) -이미지 데이터 (촬영,스캔)
[라벨링&어노테이션]
- 라벨링 : 학습에 이용할 수 있도록 기능이나 목적에 부합하는 정보를 원천 데이터에 부착 활동
- 어노테이션 : 데이터 라벨링시 원천데이터에 주석을 표시하는 작업 (클래스 라벨, 단어 라벨, 바운딩 박스)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly