AI/Machine Learning

[Python] 머신러닝 기초-2 K-Neighbors (최근접)알고리즘을 통한 연습- 분류

Jeong Jeon
반응형

이어서 훈련세트와 테스트세트를 나누어 훈련을 시키고, 테스트를 하는 방식을 공부해보자

 

코드는 기존이랑 많이 달라지지 않지만, Numpy를 이용해서 데이터를 구분, Shuffle 하며 코드를 짜볼 것이다.

 

1). 데이터 준비

2). Numpy객체로 변환

3). Index를 만든 후 순서 섞기

=> 기존 bream 과 smelt데이터는 섞여있지 않고 bream먼저+ smelt로 데이터가 형성되어있다

하지만 테스트세트와 훈련세트를 만들려면 데이터들이 무작위로 섞여있어야 하는것은 당연하다.

그러므로 데이터를 섞어 Indexing하여 input과 target의 index를 맞춰주는 과정이다.

4). 테스트세트와 훈련 세트를 따로 만들어주자

5). 훈련 및 예측

100%확률의 훈련 결과를 얻고, 예측값과 정답을 비교했을때 정답이 나오게되었다.

 

혼자 공부하는 머신러닝+ 딥러닝 아주 이해하기 쉽게 만들어져있다..

반응형