banner
홈페이지 / 블로그 / 생성적 AI: 작동 방식, 역사, 장단점
블로그

생성적 AI: 작동 방식, 역사, 장단점

Jun 15, 2023Jun 15, 2023

이 인공지능 기술은 몇 초 만에 프롬프트에 응답하여 새로운 콘텐츠를 생성할 수 있습니다.

제너레이티브 AI(Generative AI)는 오디오, 텍스트, 코드, 비디오, 이미지, 기타 데이터 등의 콘텐츠를 생산할 수 있는 인공 지능의 한 유형입니다. 기존 AI 알고리즘을 사용하여 훈련 데이터 세트 내의 패턴을 식별하고 예측할 수 있는 반면, 생성 AI는 기계 학습 알고리즘을 사용하여 훈련 데이터 세트를 기반으로 출력을 생성합니다.

Generative AI는 프롬프트가 표시되는 것과 동일한 매체(예: 텍스트-텍스트) 또는 주어진 프롬프트와 다른 매체(예: 텍스트-이미지 또는 이미지-비디오)에서 출력을 생성할 수 있습니다. 생성 AI의 인기 있는 예로는 ChatGPT, Bard, DALL-E, Midjourney 및 DeepMind가 있습니다.

생성적 AI(Generative AI)는 기계 학습의 한 유형으로, 기본적으로 소프트웨어 모델을 훈련하여 명시적인 프로그래밍 없이도 데이터를 기반으로 예측을 수행하는 방식으로 작동합니다.

특히, 생성적 AI 모델에는 방대한 양의 기존 콘텐츠가 제공되어 모델을 훈련시켜 새로운 콘텐츠를 생성합니다. 그들은 확률 분포를 기반으로 데이터 세트의 기본 패턴을 식별하는 방법을 배우고, 프롬프트가 제공되면 유사한 패턴(또는 이러한 패턴을 기반으로 한 출력)을 생성합니다.

딥 러닝이라고 불리는 기계 학습의 우산 범주에 속하는 생성적 AI는 기존 기계 학습보다 더 복잡한 패턴을 처리할 수 있는 신경망을 사용합니다. 인간의 두뇌에서 영감을 받은 신경망은 훈련 데이터의 차이점이나 패턴을 구별하기 위해 반드시 인간의 감독이나 개입이 필요하지 않습니다.

생성적 AI는 다양한 메커니즘을 사용하여 AI를 훈련하고 출력을 생성하는 다양한 모델에서 실행될 수 있습니다. 여기에는 GAN(생성적 적대 신경망), 변환기 및 VAE(변형 자동 인코더)가 포함됩니다.

널리 확산된 AI 애플리케이션은 이미 사용자가 세상과 상호 작용하는 방식을 변화시켰습니다. 예를 들어, 음성 인식 AI는 이제 많은 전화기, 스피커 및 기타 일상 기술에 사전 설치되어 제공됩니다.

마찬가지로 사용자는 다양한 소프트웨어 인터페이스를 통해 생성 AI와 상호 작용할 수 있습니다. 이는 더 많은 청중에게 생성 AI에 대한 액세스를 개방하고 사용을 촉진하는 주요 혁신 중 하나였습니다. 초기 버전의 생성 AI에서는 소프트웨어와 상호 작용하기 위해 기술 또는 데이터 과학 지식이 필요했지만, AI 개발자는 이제 프롬프트가 제공되고 상호 작용이 일반 언어로 이루어질 수 있는 사용자 경험을 설계하고 있습니다.

다음은 생성적 AI 인터페이스의 가장 인기 있는 최근 사례 중 일부입니다.

OpenAI에서 만든 ChatGPT는 텍스트 간 생성 AI의 한 예입니다. 본질적으로 자연어 대화를 통해 사용자와 상호 작용하도록 훈련된 AI 기반 챗봇입니다. 사용자는 ChatGPT에 질문을 하고, 앞뒤로 대화에 참여하고, 시, 에세이, 이야기, 레시피 등 다양한 스타일이나 장르의 텍스트를 작성하도록 유도할 수 있습니다.

2022년 11월에 출시된 ChatGPT 무료 버전을 온라인에서 사용할 수 있습니다. OpenAI는 또한 기타 기업 구독 및 임베딩 옵션 중에서 ChatGPT용 애플리케이션 프로그래밍 인터페이스(API)를 판매합니다.

DALL-E는 OpenAI가 2021년 1월에 출시한 텍스트-이미지 생성 AI의 예입니다. 텍스트 설명이 포함된 이미지에 대해 훈련된 신경망을 사용합니다. 사용자는 설명 텍스트를 입력할 수 있으며 DALL-E는 프롬프트를 기반으로 사실적인 이미지를 생성합니다. 또한 생성된 이미지를 다양한 스타일과 관점에서 변형할 수도 있습니다.

DALL-E는 이미지 내에서 변경(소프트웨어에서는 Inpainting이라고 함)을 수행하거나 원래 비율이나 경계를 넘어 이미지를 확장(Outpainting이라고 함)하여 이미지를 편집할 수도 있습니다.

Bard는 Google의 대규모 언어 모델 LaMDA(대화 응용 프로그램을 위한 언어 모델)를 기반으로 하는 텍스트-텍스트 생성 AI 인터페이스입니다. ChatGPT와 마찬가지로 Bard는 질문에 답하거나 사용자가 제공한 프롬프트를 기반으로 텍스트를 생성할 수 있는 AI 기술로 구동되는 챗봇입니다. Google은 이를 "Google 검색에 대한 보완적인 경험"으로 청구합니다.