효율적인 기술로 기계 성능 향상
MIT 뉴스 오피스 웹사이트에서 다운로드할 수 있는 이미지는 Creative Commons Attribution Non-Commercial No Derivatives 라이센스에 따라 비영리 단체, 언론 및 일반 대중에게 제공됩니다. 제공된 이미지를 크기에 맞게 자르는 것 외에는 변경할 수 없습니다. 이미지를 복제할 때는 크레디트 라인을 사용해야 합니다. 아래에 제공되지 않은 경우 이미지를 "MIT"로 표시하십시오.
이전 이미지 다음 이미지
강력한 머신러닝 모델은 사람들이 의료 이미지에서 질병을 식별하거나 자율주행차의 도로 장애물을 감지하는 등 어려운 문제를 해결하는 데 도움을 주고 있습니다. 그러나 기계 학습 모델은 실수할 수 있으므로 위험이 큰 환경에서는 인간이 언제 모델의 예측을 신뢰해야 하는지 아는 것이 중요합니다.
불확실성 정량화는 모델의 신뢰성을 향상시키는 도구 중 하나입니다. 모델은 예측이 정확하다는 신뢰 수준을 표현하는 예측과 함께 점수를 생성합니다. 불확실성 정량화가 유용할 수 있지만 기존 방법에서는 일반적으로 해당 기능을 제공하기 위해 전체 모델을 재교육해야 합니다. 훈련에는 모델이 작업을 학습할 수 있도록 수백만 개의 예시를 보여주는 것이 포함됩니다. 재교육에는 수백만 개의 새로운 데이터 입력이 필요하며, 이는 비용이 많이 들고 얻기 어려울 수 있으며 엄청난 양의 컴퓨팅 리소스도 사용합니다.
MIT 연구원과 MIT-IBM Watson AI Lab은 이제 모델이 다른 방법보다 훨씬 적은 컴퓨팅 리소스를 사용하고 추가 데이터를 사용하지 않으면서도 보다 효과적인 불확실성 정량화를 수행할 수 있는 기술을 개발했습니다. 사용자가 모델을 재교육하거나 수정할 필요가 없는 그들의 기술은 많은 응용 분야에 충분히 유연합니다.
이 기술에는 불확실성을 추정할 때 원본 기계 학습 모델을 지원하는 더 간단한 동반 모델을 만드는 작업이 포함됩니다. 이 작은 모델은 다양한 유형의 불확실성을 식별하도록 설계되었으며, 이는 연구자가 부정확한 예측의 근본 원인을 자세히 조사하는 데 도움이 될 수 있습니다.
"불확실성 정량화는 기계 학습 모델의 개발자와 사용자 모두에게 필수적입니다. 개발자는 불확실성 측정을 활용하여 보다 강력한 모델을 개발하는 데 도움을 줄 수 있으며, 사용자에게는 실제 세계에 모델을 배포할 때 신뢰와 신뢰성을 한 층 더 추가할 수 있습니다. 이 연구는 불확실성 정량화를 위한 보다 유연하고 실용적인 솔루션으로 이어집니다."라고 전기 공학 및 컴퓨터 과학 대학원생이자 이 기술에 대한 논문의 주요 저자인 Maohao Shen은 말합니다.
Shen은 전자 연구소(RLE)의 전 박사후 연구원이자 현재 플로리다 대학의 조교수인 Yuheng Bu와 함께 논문을 썼습니다. MIT-IBM Watson AI Lab의 연구원인 Prasanna Sattigeri, Soumya Ghosh 및 Subhro Das; 신호, 정보 및 알고리즘 연구소 RLE를 이끌고 있으며 MIT-IBM Watson AI Lab의 멤버인 수석 저자 Gregory Wornell, 스미토모 공학 교수. 이 연구는 AAAI 인공지능 컨퍼런스에서 발표될 예정이다.
불확실성의 정량화
불확실성 정량화에서 기계 학습 모델은 해당 예측의 정확성에 대한 신뢰도를 반영하기 위해 각 출력에 대해 수치 점수를 생성합니다. 처음부터 새로운 모델을 구축하거나 기존 모델을 재교육하여 불확실성 정량화를 통합하려면 일반적으로 많은 양의 데이터와 비용이 많이 드는 계산이 필요하며 이는 종종 비실용적입니다. 게다가 기존 방법은 모델 예측의 품질을 저하시키는 의도하지 않은 결과를 낳는 경우도 있습니다.
따라서 MIT와 MIT-IBM Watson AI Lab 연구원들은 다음 문제에 초점을 맞췄습니다. 사전 훈련된 모델이 주어지면 어떻게 효과적인 불확실성 정량화를 수행할 수 있습니까?
그들은 더 크고 사전 훈련된 모델에 연결되고 더 큰 모델이 이미 학습한 기능을 사용하여 불확실성 정량화 평가를 수행하는 데 도움이 되는 더 작고 간단한 모델(메타모델이라고 함)을 생성하여 이 문제를 해결합니다.