supervised learning 3

[인공지능] AI-2.3 지도 학습시 주의점 '표준편차를 고려한 데이터 전처리'

[데이터 전처리]훈련 데이터를 입력하기 전에 가공하는 단계 [표준편차]데이터들이 평균값에 모여있는 정도를 나타낸다.값과 평균의 차이를 제곱한 값들을 모두 더한 값의 제곱근(루트)이 표준편차 값이다.서로 다른 단위와 규모를 가진 데이터들을 동일한 기준으로 맞춰서 공정하게 비교하기 위하여 필요하다. [예시]작은 도미(25cm, 150g)가 잡혔다고 가정하였을 때 다른 도미들(약 33.Xcm, 617.Xg)보다다른 빙어들(약 11.Xcm, 11.Xg)이 더 근사한 경우 단순 숫자만 비교하는 것이 아닌 표준편차를 활용한 표준화 데이터 전처리하여 학습한다. [샘플코드]https://colab.research.google.com/drive/1C_QPp8lp9HIGnRb_1ot2DHt8STLOUhb6?usp=shar..

[인공지능] AI-2.2 지도 학습시 주의점 '샘플링 편향'

[샘플링 편향]인공지능에게 주어진 문제와 정답을 '훈련 세트'라고 하고,이후에 잘 학습했는지 확인하기 위한 문제와 정답을 '테스트 세트'라고 한다. 이때 훈련 세트의 정답이 다양하지 않을 경우 '샘플링 편향'으로 이러한 경우 학습이 잘 진행되지 않은 상태이므로 테스트 결과가 이상하게 나올 수 있다. [예시]AI에게 이러한 데이터를 가진 생선은 도미다. 라고 열심히 학습시켜봤자빙어 데이터를 보여주어도 AI가 아는것은 도미뿐이라 도미라고 결과를 낼 수 있다. [샘플코드]https://colab.research.google.com/drive/1H07RotzoBlJGz2D61DbJ61fJKUL0irar?usp=drive_link참조전체 : 혼자 공부하는 머신러닝+딥러닝생선데이터 : kagglehttps://ww..

[인공지능] AI-2.1 지도 학습과 비지도 학습

[정의]지도 학습은 인공지능에게 문제와 정답을 주고 지도하여 학습하게 하는 것.비지도 학습은 인공지능에게 문제만 주고 지도하지 않으며 인공지능 스스로 패턴을 분석하여 학습하게 하는 것. [예시]지도학습에는 KNN(K-Nearest Neighbors, K-최근접 이웃 알고리즘)이 있고,비지도학습에는 K-Mean(K-평균) : 데이터를 K개의 군집(Cluster)으로 묶는(Clusting) 알고리즘이 있다.참조전체 : 혼자 공부하는 머신러닝+딥러닝이전다음[인공지능] AI-1.2 K-최근접 이웃 알고리즘[인공지능] AI-2.2 지도 학습시 주의점 '샘플링 편향'