AIDE 2급 · D-11

AI·ML·DL 기본 개념 정리

AI 서비스 흐름 · 머신러닝 학습 방법 · 딥러닝 비교 · 실습 5유형 핵심 기준

01

인공지능 서비스 전체 흐름

데이터 획득
IoT · Mobile
M2M
데이터 가공
라벨링 · 전처리
⚠️ 가장 많은 시간
모델 생성
신경망 설계
학습 실행
실시간 서비스
API 개발
예측 · 배포
빅데이터 영역 — 데이터 획득 + 데이터 가공
인공지능 영역 — 모델 생성 + 실시간 서비스
⚠️ 시험 포인트
  • 데이터 가공(전처리)이 가장 중요하고 가장 많은 시간이 소요되는 단계
  • 빅데이터 영역 ≠ 인공지능 영역 — 구분 문제 자주 출제
02

데이터 라벨링 & 가공

라벨링 가능 데이터 유형

이미지Image
텍스트Text
영상Video
음성 ✕불포함

데이터 가공 4단계

1
데이터 라벨링
AI가 학습할 수 있는 형태로 데이터를 가공
2
구분 · 선별
사용 가능한 데이터와 불필요한 데이터를 분류
3
포맷 변경
학습에 적합한 형식으로 변환
4
결합 · 변형
데이터를 합치거나 변형하여 활용도 높임
⚠️ 최빈출 함정

음성(Audio)은 라벨링 대상이 아닙니다. 보기에 '이미지·텍스트·음성·영상' 4개가 나오면 → 음성을 제거한 3개가 정답

03

머신러닝 3가지 학습 방법

지도학습
Supervised Learning
  • 레이블(정답)이 지정된 데이터 사용
  • 분류(Classification)
  • 회귀(Regression)
비지도학습
Unsupervised Learning
  • 정답 없이 패턴 스스로 발견
  • 연관규칙(Association)
  • 군집(Clustering)
강화학습
Reinforcement Learning
  • 보상(Reward) 기반 학습
  • 에이전트·환경 상호작용
  • 최적 행동 정책 습득
04

머신러닝 vs 딥러닝

머신러닝 (ML)
Machine Learning
  • 특징 추출: 사람이 직접 분석·판단
  • 데이터로 스스로 학습하여 성능 향상
  • 정형·반정형 데이터에 강점
VS
딥러닝 (DL)
Deep Learning
  • 특징 추출: 기계가 자동으로
  • 인간 뉴런 모방 — 인공신경망 기반
  • 대용량 비정형 데이터에 강점
핵심 구분: 특징 추출 주체가 사람이면 ML · 기계(자동)이면 DL
05

AI 프로그램 개발 5단계

1
라이브러리 읽기
개발 시간·비용 절감
2
데이터 읽기 · 전처리
라벨링 데이터 필요 — 핵심 단계
3
신경망 만들기
AI 라이브러리 이용 / 성능 미달 시 이 단계로 복귀
4
모델 만들기 (학습)
시간 소요 · 반복 가능
5
모델 적용 (예측)
성능 평가 → 미달 시 3단계로 되돌아가 반복
📌 반복 구조

예측(5단계) 결과가 불만족스러우면 → 신경망 만들기(3단계)로 돌아가 구조를 수정하고 재학습

06

실습 5유형 핵심 기준

이미지 분류보통
  • 가이드라인 기준 우선 (개인 판단 금지)
  • 조건 미충족 시 → 부적합
  • 미분류 항목 → 기타
텍스트 분류보통
  • 전체 문장의 주된 감정·주제 기준
  • 가이드라인 카테고리 외 → 기타
  • 부정어 포함 ≠ 무조건 부정
바운딩높음
  • 잘린 객체 → 보이는 부분만 박스
  • 겹친 객체 → 각각 개별 박스
  • 50% 이상 가려짐 → 제외
OCR높음
  • 기울어진 텍스트도 가로 박스
  • 공백이 글자 높이 50% 미만 → 통합
  • 50%↑ 가려진 글자 → 불명확 태그
랜드마크높음
  • 보이지 않는 포인트 → 절대 추정 금지
  • 대칭 추정도 불가
  • 포인트는 중심에 정확히
07

핵심 키워드 (한·영)

Data Labeling
데이터 라벨링
AI 학습용으로 데이터를 가공
Supervised
지도학습
정답(레이블) 있는 데이터로 학습
Unsupervised
비지도학습
정답 없이 패턴·군집을 스스로 발견
Reinforcement
강화학습
보상 기반 최적 행동 학습
Machine Learning
머신러닝 (ML)
사람이 특징 추출
Deep Learning
딥러닝 (DL)
신경망이 자동 특징 추출
Clustering
군집분석
비슷한 데이터끼리 묶기
Regression
회귀
연속 값 예측 (지도학습)
Neural Network
인공신경망
딥러닝의 기반, 뉴런 모방
Preprocessing
전처리
AI 가공에서 가장 중요한 단계
08

오늘의 함정 3가지

⚠️ D-11 핵심 함정
  • 라벨링 가능 데이터 — 이미지·텍스트·영상(3가지), 음성 제외
  • 빅데이터 영역 vs 인공지능 영역 — 획득+가공 / 모델+서비스 구분
  • ML vs DL — 특징 추출 주체: 사람(ML) vs 기계 자동(DL)
09

오늘의 체크리스트