인공지능의 시스템은 수집된 데이터 세트로부터 모델을 학습하고, 이 모델을 이용한 응용 시스템을 개발하게 됩니다.
따라서, 실제 이용될 시스템의 성능을 결정하는 모델의 정확도가 시스템 전체의 성능에 큰 영향을 미치게 됩니다.
데이터 세트(영상, 소리, 텍스트 등)로부터 목표로 하는 작업을 수행하기 위해
기계학습 알고리즘을 이용하여 추출된 특정 패턴을 인공지능 모델이라고 합니다.
이렇게 만들어진 인공지능 모델은 학습된 패턴에 대한 저장 파일과 수학적으로 모델링된 알고리즘으로 구성되어 지며,
학습에 이용되지 않은 새로운 데이터 세트에 대한 예측을 만들 수 있습니다.
AI 모델 개요
개념
인공지능 모델은 학습된 데이터와 학습 알고리즘으로 구성이 됩니다.
단일 모델에 대한 평가는 데이터 셋을 학습용 데이터, 테스트 데이터, 검증 데이터 형태로 구분하여 학습 알고리즘을 수행하고 AI 모델의 성능을 평가하게 됩니다.
학습된 모델은 학습용 알고리즘에 따라 다양한 형태로 구분되어질 수 있습니다.
수치형태의 신경망 노드의 가중치 값으로 표현되거나, 통계 수치값으로 표현이되거나, 규칙형태 등으로 표현이 될 수 있습니다.
또한, 특징에 대한 패턴을 저장한 값이 아닌 학습 알고리즘만으로 이루어진 모델도 존재할 수 있습니다.
최근 주로 이용되는 딥러닝 알고리즘들의 경우, 인공지능 학습 모델은 네트워크의 구조와 학습된 가중치 값이 됩니다.
인공지능 모델의 정확도를 높이기 위해서는 데이터 부족, 편향의 문제, 알고리즘 복잡도, 성능저하 극복기술 구현이 필요.
데이터
품질개선
AI 모델의 활용성 강화를 위해서는 편향성 및 노이즈 극복과 학습량 확보를 위한 고품질 데이터의 확보가 필수 입니다. 인공지능 학습데이터 구축과정에서 확보된 품질이 전체의 품질을 결정하기 때문에 데이터의 획득, 정제, 라벨링 등 구축 과정에서 원시데이터, 원천데이터, 라벨링데이터의 품질개선이 필요합니다.