일반적인 정의
[머신러닝은] 명식적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구 분야다.
- 아서 사무엘Arthur Samuel, 1959
공학적인 정의
어떤 작업 T에 대한 컴퓨터 프로그램의 성능을 P로 측정했을 때 경험 E로 인해 성능이 향상됐다면, 이 컴퓨터 프로그램은 작업 T와 성능 측정 P에 대해 경험 E로 학습한 것이다.
- 톰 미첼 Tom Mitchell, 1997
ex) 스팸 필터 = (스팸 메일 + 일반 메일) 샘플
시스템이 학습하는 데 사용하는 샘플 -> 훈련 세트(training set)
훈련 데이터 -> 훈련 사례(training instance, 혹은 샘플)
작업 T = 새로운 메일 스팸인지 구분 경험 E는 훈련 데이터(training data) 성능 측정 P는 직접 정의 이 성능 측정을 정확도(accuracy)라고 부르며 분류 작업에 자주 사용
댓글 없음:
댓글 쓰기