: 타깃을 모르는 상태에서 모델을 훈련하는 방법 ex) 군집, 차원축소
- 군집: 비슷한 샘플끼리 그룹으로 모으는 작업
- 클러스터: 군집 알고리즘에서 만든 그룹
- 맷플롯립 패키지: 다양한 종류의 그래프를 그릴 수 있는 데이터 시각화 라이브러리
import matplotlib.pyplot as plt
- load(): 넘파이에서 npy 파일을 로드하는 메서드, 매개변수로 파일 이름 전달
- 넘파이 배열의 크기: (샘플의 개수, 이미지 높이, 이미지 너비)
- 첫번째 이미지의 첫번째 행 출력하기
print([fruits[0, 0, :])
-> 첫번째 행에 있는 픽셀 100개에 들어있는 값 출력
- 첫번째 이미지를 그림으로 그려 위 숫자와 비교하기 : 맷플롯립의 imshow( ) 함수 사용
plt.imshow(fruits[0], camp='gray')
plt.show()
-> 0에 가까울수록 검게, 높은 값은 밝게 표시됨
흑백 이미지는 넘파이 배열로 변환할때 색을 반전시켜 바탕을 검게(0), 중요한 관심 대상을 밝게(255) 반전시킴
-> cmap = 'gray_r'
로 지정하면 다시 반전 가능
- 한번에 여러개의 이미지 그리기 : 맷플롯립의 subplots( ) 함수 사용, 매개변수는 행, 열
: mean( ) 메서드가 평균을 계산할 축 지정(axis=1 일땐 열방향, axis=0 일땐 행방향으로 계산)
print(apple.mean(axis=1))
- 히스토그램으로 평균값 분포 확인 : hist( )함수 사용, 매개변수 alpha로 투명도 조절, legend( ) 함수로 범례 표시 -> 확인 어려울시 샘플의 평균값이 아니라 픽셀별 평균값으로 비교: axis = 0으로 지정
- 막대그래프 그리기 : bar( )함수 사용
: 배열에 있는 모든 샘플에서 특정 사진의 평균값을 뺀 절댓값의 평균을 계산
- 절댓값 계산 : abs( ) 함수 사용
abs_diff = nb.abs(fruits - apple_mean)
abs_mean = np.mean(abs_diff, axis=(1,2))
print(abs_mean.shape)
- 오차가 가장 적은 샘플 100개 고르기 : np.argsort( ) 함수 사용