banner
홈페이지 / 소식 / 연구에 힘을 실어주는 머신러닝
소식

연구에 힘을 실어주는 머신러닝

Jan 18, 2024Jan 18, 2024

인공 지능, 즉 기계 학습은 복잡한 분석을 지원하고 고품질 연구를 발전시킬 수 있지만 신중하게 사용해야 합니다. John F. Wu는 기계 학습이 연구자에게 어떻게 힘을 실어줄 수 있는지에 대한 조언을 공유합니다.

당신은 또한 좋아할 수도 있습니다

인기 있는 리소스

인공지능(AI), 즉 머신러닝은 요즘 어디에나 있는 것 같습니다. 연구자라면 해당 분야의 학술 문헌에서 이러한 용어가 점점 더 많이 등장하는 것을 본 적이 있을 것입니다. 하지만 이 중 실제로 얼마나 유용한가요? 머신러닝도 활용해야 할까요?

이 글에서는 제가 속한 천문학 분야에서 영감을 얻어 머신러닝이 연구에 유용한 경우와 그렇지 않은 경우에 대한 몇 가지 사례를 설명하겠습니다.

기계 학습은 "데이터 기반" 연구 문제에 가장 큰 가치를 제공합니다. 즉, 데이터가 너무 많아서 수동으로 검사할 수 없는 경우입니다. 이러한 시나리오에서는 기계 학습을 통해 작업 부하를 줄이고 연구 분야에 집중할 수 있습니다. 그러나 머신러닝을 채택하는 데에는 함정과 숨겨진 비용이 없는 것은 아닙니다.

회의론자의 관점에서 머신러닝을 주의 깊게 적용하면 그렇지 않으면 실행 불가능할 연구 프로그램을 활성화할 수 있습니다. 광범위하게 말하면, 머신러닝은 네 가지 방식으로 연구자에게 힘을 실어줄 수 있습니다.

때로는 데이터 세트를 사용하여 다른 것을 결정할 수 있는지 알고 싶을 때가 있습니다. 예를 들어, 의학 분야의 기계 학습이 의사의 암 검진에 어떻게 도움이 되는지 들어보셨을 것입니다. 내 천문학 분야에서는 수백만 개의 은하계의 이미지를 찍는 것이 상당히 간단하지만, 전통적으로 은하계가 어떻게 진화하는지 자세히 이해하려면 전문적인 관찰을 취하고 분석해야 했습니다. 저와 공동 작업자들은 기계 학습을 사용하여 이미지만을 사용하여 이러한 은하계를 실제로 연구할 수 있다는 사실을 발견했습니다.

사물이 어떻게 작동해야 하는지에 대한 새로운 모델을 만드는 것은 쉽지만 모든 모델의 실제 테스트는 모델에 예측력이 있는지 여부입니다. 데이터 내의 연결을 식별함으로써 모델을 공식화할 수 있으며, 머신러닝도 가능합니다. 과학자들은 기계 학습을 사용하여 이러한 연결을 수학 언어로 요약하고 우주 규모에 따른 물질 분포를 설명하는 새로운 공식을 찾아냈습니다.

기계 학습을 사용하여 일반적인 추세를 찾을 수 있다면 기계 학습이 또한 변칙적인 것을 탐지하는 데 능숙합니다. 많은 연구 분야에서 철저한 분석을 통해 이점을 얻을 수 있습니다.희귀한 현상에 대한 조사와 머신러닝은 "건초 더미 속의 바늘"을 찾는 데 도움이 될 수 있습니다.천문학에서는 중력파와 같은 희귀한 현상을 탐지하는 데에도 머신러닝이 사용되었습니다.사건, 초신성, 중력렌즈 은하, 잘못 처리된 데이터, 훨씬 더. 이상치 은하에 대한 한 분석에서 많은 흥미로운 현상이 발견되었습니다.(전혀 은하가 아니었던 많은 "은하"를 포함하여)

솔직히 말해서 연구의 일부 측면은 지루하고 시간이 많이 걸립니다. 전파천문학에서는 인공 신호와 손상된 데이터를 제거하는 데 막대한 계산 리소스와 많은 시간이 필요합니다. 기계 학습은 훨씬 적은 비용과 시간을 사용하여 이러한 작업을 수행할 수 있습니다.

연구의 지루한 부분을 가속화함으로써 머신러닝 다른 방법으로는 불가능했던 새로운 종류의 분석도 가능해집니다. 많은 연구 문제는 다음 문제를 해결하려고 시도합니다. 관찰된 결과가 주어지면 그러한 결과를 생성한 모델의 매개변수는 무엇입니까? 이러한 소위 역 문제는 기계 학습을 사용하여 효율적으로 해결할 수 있습니다. 자세한 내용은 시뮬레이션 기반 추론을 읽어보세요.

데이터세트는 점점 더 커지고 있지만 기능을 압축된 버전으로 결합하는 방법은 많습니다. 차원 축소 방법에는 PCA(Principal Component Analysis), t-SNE(t-distributed Stochastic Neighbor Embedding), UMAP(Uniform Manifold Approximation and Projection)와 같은 고전적인 접근 방식이나 사전 훈련된 신경망 또는 이와 유사한 기계 학습 기술이 포함됩니다. 데이터를 요약된 버전으로 변환하기 위한 알고리즘.