머신러닝, 즉 기계학습(Machine Learning)이란 인공지능의 한 분야이다.
머신러닝은 인공지능의 하위 개념이며, 딥러닝(Deep Learning)은 머신러닝의 한 분야이다.
인공지능(AI :Arttifical Inteligence)은 인간의 지능을 기계나 소프트웨어를 이용해 모방하여 분석된 데이터를 기반으로 문제를 해결하는 모델을 의미한다.
머신러닝(기계학습 :Machine Learning)은 인공지능의 한 분야로 데이터를 분석하고 학습해 패턴을 찾는 알고리즘을 만드는 것이다.
주어진 데이터에서 패턴, 일정한 규칙을 찾는 것을 학습이라고 하며 데이터를 기반으로 예측, 분류, 군집화 등 작업을 수행한다.
<머신러닝 7단계>
1. 문제 정의하기 : 머신러닝으로 해결하려는 문제를 정의하고, 목표를 설정한다.
2. 데이터 수집 : 문제를 해결하기 위해 필요한 데이터를 수집한다.
3. 데이터 전처리 : 수집한 데이터를 분석하기 쉽게 처리하고, 결측치나 이상치를 제거하거나 보완한다.
4. 모델 선택 : 문제의 성격에 따라 적절한 머신러닝 모델을 선택한다.
5. 모델 학습 : 선택한 모델을 학습시켜 최적의 파라미터를 찾습니다.
6. 모델 평가 : 학습한 모델을 검증 데이터셋을 통해 평가하고, 성능을 개선하기 위해 수정한다.
7. 모델 배포 : 학습된 모델을 실제 환경에 적용하고, 유지보수한다.
이러한 머신러닝은 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning) 3가지 종류가 있다
1. 지도학습(Supervised Learning)
지도학습은 정답을 알려주며 학습시키는 것이다.
예를들면 고양이 사진 X 를 주고(input data), 이 사진은 고양이라고 분류해주어 Y 값 Label을 알려준다.
따라서 기계가 정답을 잘 맞췄는지 아닌지 쉽게 알 수 있다.
지도학습에는 크게 분류(classification)과 회귀(regression)이 있다.
1-1. 분류(classification)
- 미리 정의된 여러 클래스 레이블 중 하나를 예측하는 것
- 속성 값을 입력, 클래스 값을 출력으로 하는 모델
- 이중분류(Y or N), 다중 분류 등
1-2. 회귀(Regression)
- 어떤 데이터들의 특징(feature)을 토대로 값을 예측하는 것.
- 결과 값은 실수 값을 가질 수 있다.
- 그리고 그 값은 연속성을 갖는다(ex. 그래프)
2. 비지도학습(Unsupervised Learning)
정답을 따로 알려주지 않고(label이 없다), 비슷한 데이터들을 군집화 하는 것. 일종의 그룹핑 알고리즘.
라벨링 되어있지 않은 데이터로부터 패턴이나 형태를 찾아야 하기 때문에 지도학습 보다 좀 더 난이도가 있다.
실제 지도학습에서 적절한 feature을 찾아내기 위한 전처리 방법으로 비지도 학습을 이용하기도 한다.
대표적인 종류로 클러스터링(Clustering), Dimentionality Reduction, Hidden Markov Model을 사용한다.
2-1. 클러스터링
2-2.Dimentionality Reduction
2-3. Hidden Markov Model
3. 강화학습(Reinforcement Learning)
Agent가 현재 Environment에서 높은 reward을 얻기 위해 action하는 학습 방법.
특정 학습 횟수를 초과하면 높은 reward를 획득할 수 있는 전략이 형성된다.
단, action을 위한 행동 목록이 사전 정의 되어야 한다.
'알고리즘' 카테고리의 다른 글
과대적합(overfitting)과 과소적합(underfitting) (0) | 2023.08.27 |
---|---|
딥러닝과 인공신경망 (2) | 2023.08.26 |
검색 알고리즘 (0) | 2023.08.23 |