1. 기계 학습이란?
1) 정의
데이터를 기반으로 학습하여 새로운 패턴을 인식하거나, 예측하는 기술
데이터의 패턴을 식별하여 모델을 학습하고, 새로운 데이터에 대한 예측을 수행
2) 학습 방법
▪ 지도 학습(Supervised Learning): 정답이 알려진 데이터를 통해 학습
▪ 비지도 학습(Unsupervised Learning): 정답이 알려지지 않은 데이터를 통해 학습
▪ 강화 학습(Reinforcement Learning): 보상과 처벌을 통해 학습
3) 데이터
주로 머신러닝을 위해 모델에 학습하기 위한 데이터
2. 지도 학습
1) 정의
지도 학습은 정답이 있는 데이터를 사용하여 학습하는 방법이며, 알고리즘은 데이터의 정답을 사용하여 모델을 학습하고 새로운 데이터에 대한 예측을 할 수 있도록 한다.
2) 예시
▪ 회귀: 미래의 어떤 값을 예측 하는 방법
ex) 날씨를 예측하거나, 주식의 주가를 예측
▪ 분류: 범주형 값을 예측하는 방법
ex) 이메일을 스팸 메일과 정상 메일로 분류, 이미지 속의 물체를 사람, 동물, 사물 등으로 분류
3) 주요 알고리즘
▪ 회귀: 선형 회귀, 로지스틱 회귀, 회귀나무
▪ 분류: K-최근접 이웃, 의사결정나무, SVM, 신경망 등
4) 지도 학습 예시
3. 비지도 학습
1) 정의
비지도 학습은 정답이 없는 데이터를 사용하여 학습하는 방법이며, 데이터의 패턴을 실벽하여 모델을 학습하고 새로운 데이터에 대한 예측을 할 수 있도록 한다.
2) 예시
▪ 군집화: 유사한 데이터를 그룹으로 나누는 방법
ex) 고객을 관심사별로 그룹으로 구분하기, 이미지 속의 물체를 유사한 특징을 가진 그룹으로 나누기 등
▪ 차원축소: 데이터의 차원을 줄이는 방법
ex) 이미지 속의 픽셀 수를 줄이기, 고객의 데이터를 몇 가지 주요 특징으로 요약하기
3) 주요 알고리즘
▪ 군집화: K-평균, 계측적 군집화 등
▪ 차원축소: PCA(주성분분석), LDA(선형판별분석)
4) 비지도 학습 예시
4. 강화 학습
1) 정의
강화 학습은 에이전트가 환경과 상호작용하면서, 보상을 최대화하는 정책을 학습하는 방법이다.
- 환경의 상태를 관찰하고, 행동을 선택(에이전트는 환경과 상호작용하며 보상을 최대화하기 위해 행동을 선택하는 주체) 환경은 에이전트의 행동에 따라 상태와 보상을 변화시키고, 에이전트는 이러한 경험을 통해 보상을 최대화하는 정책을 학습한다.
2) 예시
▪ 게임: 게임에서 캐릭터를 이용하여 점수를 최대화하거나, 게임을 승리하는 방법을 강화 학습으로 해결
▪ 자율 주행: 자율 주행 차량이 안전하게 목적지에 도달하는 방법을 강화 학습으로 해결
▪ 로봇 제어: 로봇이 물건을 집거나, 장애물을 피하는 방법을 강화 학습으로 해결
3) 주요 알고리즘
▪ Q-Learning: 이산전인 상태와 행동 공간에서 작동, 각 상태-행동에 대한 쌍의 가치를 추정(Q-table을 사용하여 최적의 행동을 추정)
▪ Deep Q network(DQN): Q-Learning을 신경망으로 확장한 것, 연속적인 상태와 행동 공간에서 작동
4) 강화 학습 예시
▪ 게임
알파고(AlphaGo): 알파고는 딥러닝과 강화학습을 이용하여 개발된 바둑 프로그램, 알파고는 대량의 바둑 기보를 학습하고, 자체적으로 대국하며 실력을 향상
▪ 로봇
자율주행 자동차: 자율주행 자동차는 주변 환경을 인식하고 안전하게 주행하는 방법을 강화학습을 통해 학습
▪ 금융
주식 거래: 강화학습을 이용하여 주식 시장의 변동성을 분석 및 수익률을 극대화하는 투자 전략을 수립
▪ 의료
진단 및 치료: 강화학습을 통해 의료 영상 데이터를 분석하고, 질병을 정확하게 진단하며 환자에게 맞춤형 치료 방법을 제
4. 마무리
1) 요약
∎ 기계학습
▪ 컴퓨터 시스템이 데이터를 기반으로 학습하고 예측하는 인공 지능의 한 분야
▪ 지도 학습, 비지도 학습, 강화 학습으로 구분
2) 활용분야
의료 분야에서는 환자 진단, 금융 분야에서는 사기 탐지, 이미지 인식, 언어 처리, 자율 주행 자동차 등 다양한 분야에 활용
'AI & 딥러닝' 카테고리의 다른 글
[6강] 군집화: 유사한 데이터 그룹화하기 (2) | 2024.11.26 |
---|---|
[5강] 회귀 분석: 데이터 예측을 위한 기본 원리 (0) | 2024.11.26 |
[4강] 분류모델: 무엇인지와 어떻게 동작하는지 (0) | 2024.11.26 |
[3강] 딥 러닝과 신경망의 기본 개념 (0) | 2024.11.26 |
[1강] 인공지능과 기계 학습 소개 (0) | 2024.11.25 |