2021년 빅데이터분석기사 2회차 24번 - 기출문제 및 해설
문제 1
다음 중 머신러닝에서 훈련 데이터의 클래스가 불균형한 문제를 처리하는 방법에 대한 설명으로 가장 옳지 않은 것은 무엇인가?
1.
과소 표집(Under-Sampling)은 많은 클래스의 데이터 일부만 선택하는 기법으로 정보가 유실되는 단점이 있다.
2.
과대 표집(Over-Sampling)은 소수 데이터를 복제해서 많은 클래스의 양만큼 증가시키는 방법이다.
3.
불균형 문제를 처리하지 않으면 정확도 (Accuracy)는 낮아지고 작은 클래스의재현율(Recall)은 높아진다.
4.
클래스가 불균형한 훈련 데이터를 그대로 이용할 경우 과대적합 문제가 발생할 수 있다.
💡 로그인하면 학습 진행률이 자동으로 저장되고, 북마크와 오답노트를 사용할 수 있습니다.
이전
다음