이번 포스팅에서는 2023년 초 오픈 AI의 샘 알트먼이 주창한, 아이폰 이후 어쩌면 가장 혁명적인 기술 혁신인 챗 GPT와 이와 관련된 생성형 AI(generative AI)에 대해 알아보겠습니다.
목 차
생성형 AI 개요
작년 초부터 오픈 AI의 샘 알트먼이 창조한 챗 GPT로 인해 세상에 모습을 드러낸 생성형 AI란, 프롬프트에 대응하여 텍스트, 이미지, 기타 미디어를 생성할 수 있는 인공지능 시스템을 말합니다.(가장 널리 알려진 건 한글 등 인간의 언어를 입력하면 자동으로 답변해 주는 대화형 AI라고 할 수 있습니다) 생성형 AI는 입력 트레이닝 데이터의 패턴과 구조를 학습한 다음, 유사 특징이 있는 새로운 데이터를 만들어냅니다. 이러한 생성형 AI는 예술, 작문, 소프트웨어 개발, 의료, 금융, 게이밍, 마케팅, 패션 등 다양한 산업 부문에 걸쳐 잠재적으로 응용될 수 있으며, 이러한 잠재적 폭발성과 가능성을 인정받아 2020년대 초 이후 굴지의 빅테크들은 생성형 AI에 투자하고 연구해 왔습니다. 특히 미국의 마이크로소프트, 구글, 오픈 AI, 중국의 바이두와 같은 혁신적 기업들과 생성형 AI 모델을 개발하는 수많은 규모가 더 작은 기업들이 참여했습니다.(국내의 네이버, LG AI연구원, 뤼튼 테크놀로지가 대표적 예입니다) 그러나 생성형 AI의 잠재적 오용에 대한 우려도 있는데, 예를 들어 사람을 속이기 위해 사용할 수 있는 가짜뉴스나 딥페이크를 만드는 것을 들 수 있습니다. 이러한 할루시네이션(현실에 없는 내용을 답변하기 위해 창조하는 생성형 AI의 행위)은 앞으로 생성형 AI가 확대되는데 꼭 해결해야 할 선결 과제로 꼽힙니다.
생성형 AI 주요 모델
생성형 AI의 종류는 보통 AI가 생성하는 데이터, 즉 콘텐츠의 종류에 따라 구분되며, 크게 대화형 AI와 이미지 생성 AI, 음악과 귀를 즐겁게 하는 작곡 AI, 작문 및 산문 AI, 코딩 AI 다섯 가지가 있습니다. 대화형 AI는 문장으로 된 텍스트를 생성하여 이용자와 자연스럽게 대화하는 AI이며, 'bing copilot', ‘chatGPT’, ‘bard’, ‘Ask Up’ 등이 있습니다. 이미지 생성 AI는 사용자의 프롬프트 입력값에 맞춰 이미지를 생성하는 AI로 ‘미드저니’, ‘DALL-E’, ‘Firefly’ 등이 있습니다. 작곡 AI는 사용자의 요청사항에 따라 곡의 느낌, 분위기를 맞추어 작곡을 해주는 AI이며, ‘이봄’ 등이 있습니다. 작문 AI는 시, 소설, 산문 등의 작문 형식에 맞춰 스토리라인을 작성해주는 AI로 ‘뤼튼’ 등이 있습니다. 마지막으로 코딩 AI는 앱 개발 등 원하는 개발 언어, 원하는 기능에 맞춰 코딩을 해주는 AI이며 ‘chatGPT’가 그 기능도 함께 하고 있습니다.
주요 생성형 AI 모델에 대한 내용은 다음과 같습니다. 대표적인 오픈 ai의 챗 gpt와 구글의 바드, 마이크로소프트의 bing, 미국 이외의 인공지능 최강자 중국의 바이두 어니봇까지 포함되었습니다.(기반 ai를 다루기 때문에, 글의 취지상 이 기반 모델을 단지 커스터마이징해서 쓰는 수준인 삼성 가우스 ai, 뤼튼, 카카오, 네이버 등의 국내기업은 제외했습니다)
빙 | MS | 텍스트 | 검색 엔진을 기반으로 한 대화형 AI 모델 | 검색 결과를 요약하고, 다양한 주제와 형식에 대응할 수 있음 |
바드 | 구글 | 텍스트 | 구글 AI의 대규모 언어 모델로, 실시간 구글 검색을 통해 최신 정보를 제공하는 대화형 AI 모델 | 최신 정보를 제공하고, 개인 콘텐츠와의 상호 작용 기능을 제공함 |
어니봇 | 바이두 | 텍스트, 이미지, 오디오 | 바이두의 대화형 AI 플랫폼으로, 다양한 콘텐츠를 생성하고, 사용자의 요청에 따라 응답하는 AI 모델 | 다양한 콘텐츠를 생성하고, 사용자의 요청에 따라 응답할 수 있음 |
챗GPT | 오픈AI | 텍스트, 코드 | 오픈AI의 대규모 언어 모델로, 텍스트와 코드를 생성하는 AI 모델 | 창의적인 텍스트와 코드를 생성할 수 있음 |
DALL-E | 오픈AI | 텍스트, 이미지 | 텍스트를 입력하면 이미지를 생성하는 AI 모델 | 텍스트에 맞는 이미지를 정확하고 다양하게 생성할 수 있음 |
제미나이 | 구글 | 텍스트, 이미지, 오디오, 동영상, 코드 | 다양한 유형의 정보를 일반화하고, 원활하게 이해하며, 여러 정보를 동시에 조합하여 활용할 수 있는 범용적인 AI 모델 | 다양한 유형의 정보를 생성하고, 조합하고, 활용할 수 있음 |
이마젠2 | 구글 | 텍스트, 이미지 | 텍스트를 입력하면 이미지를 생성하고, 생성된 이미지에 대한 설명도 제공하는 AI 모델 | 텍스트에 맞는 이미지를 정확하고 다양하게 생성하고, 설명할 수 있음 |
추가적으로 각 모델에 대한 설명은 다음과 같습니다.
chatGPT : 챗gpt 사이트에서 회원가입 후 원하는 질문이나 대화를 입력하면 됩니다. chatGPT는 당신의 질문에 대답하거나, 당신과 재미있는 대화를 나누거나, 당신의 코딩을 도와줄 수 있습니다.
bing : 빙 웹사이트에서 회원가입 또는 로그인 후 화면 상단 가운데의 chat을 클릭하면 대화를 시작합니다. 창의적 답변을 원하는 경우 옵션 클릭이 가능하며, 이 때는 gpt 4 버전(챗 gpt에선 유료로 이용하는 그 것)이 적용되어 무료로 이용 가능합니다.
bard : 구글에서 작문 아이콘을 클릭하고, 원하는 작문 형식과 주제를 입력하면 됩니다. bard는 당신의 요구사항에 맞춰 적절한 스토리라인을 작성해줄 것입니다.
DALL-E : DALL-E는 오픈AI가 개발한 텍스트를 입력하면 이미지를 생성하는 생성형 인공지능 모델입니다. DALL-E는 다음과 같은 특징을 가지고 있습니다. 이 모델은 오픈AI의 대규모 언어 모델인 GPT-3와 비슷한 구조를 가지고 있으며, 12억 개의 파라미터를 바탕으로 텍스트에 맞는 이미지를 정확하고 다양하게 생성할 수 있으며, 복잡한 개념이나 추상적인 표현도 잘 이해하고 반영할 수 있습니다. 즉, 텍스트를 이미지로 변환해 주는 기능을 제공합니다.
제미나이 : 구글에서 콘텐츠 생성 아이콘을 클릭하고, 원하는 정보의 유형과 내용을 입력하면 됩니다. 제미나이는 사용자의 입력값에 맞는 콘텐츠를 생성해줄 것입니다.
이마젠2 : 구글에서 이미지 생성 아이콘을 클릭하고, 원하는 텍스트를 입력하면 됩니다. 이마젠2는 당신의 텍스트에 맞는 이미지를 생성해주고, 생성된 이미지에 대한 설명도 제공해 줄 것입니다.
어니봇 : 어니봇은 바이두의 오픈소스 딥러닝 플랫폼인 패들패들에서 개발되었습니다. 이 모델은 언어 이해, 언어 생성, 텍스트-이미지 생성 등 광범위한 작업을 처리할 수 있는 대규모 언어 모델로 진화했으며, 중국산 AI답게 중국어와 관련된 역사적 사실이나 문학 작품 등을 잘 설명하거나 생성할 수 있습니다.
향후 전망
생성형 AI는 현재 많은 관심과 투자를 받고 있는 기술로, 향후 10년간 글로벌 GDP의 7% 성장을 이끌고, 3억 개에 달하는 일자리에 영향을 미칠 것으로 전망됩니다. 또한, 생성형 AI는 의료, 과학, 교육, 미디어, 엔터테인먼트 등 다양한 분야에서 혁신적인 서비스와 콘텐츠를 제공할 것으로 기대됩니다. 그러나 생성형 AI의 발전은 동시에 새로운 도전과 위험을 수반하는데, 가령 생성형 AI의 오용이나 오류로 인한 사회적, 윤리적, 법적 문제가 발생할 수 있으며, 생성형 AI의 편향이나 할루시네이션으로 인한 신뢰성 저하가 우려됩니다. 따라서, 생성형 AI의 책임감 있는 개발과 사용을 위해 AI 거버넌스 수립, 데이터 품질 관리, 사용자 교육 등의 노력이 필요할 것입니다.
모두 아시다시피 생성형 AI는 인공지능의 새로운 패러다임으로, 인간의 창의성을 모방하고 확장하는 놀라운 기술입니다. 생성형 AI는 이미 우리의 삶과 사회에 많은 영향을 미치고 있으며, 앞으로도 더 많은 가능성과 가치를 제공할 것입니다. 하지만, 생성형 AI의 장점만을 강조하지 말고, 그에 따른 위험과 책임도 함께 고민하고 대비해야 합니다. 생성형 AI는 우리의 파트너이자 도구일 뿐이며 다시 말해서 우리의 창작물을 만드는 의지는 결국 우리 스스로의 내면에서 발로한 것입니다. 따라서 생성형 AI를 적절하게 활용하되 그 결과물을 비판적으로 평가하고 자신만의 형태로 만드는 과정이 생성형 AI를 활용하는 데 있어서 가장 중요한 포인트라고 하겠습니다. 읽어주셔서 감사합니다.
'IT & Tech 정보' 카테고리의 다른 글
[opinion] 90년대 인터넷 기술이 금융사에 미친 영향 (0) | 2024.02.12 |
---|---|
2022년 1분기 전 세계 스마트폰 점유율(제조사 국적별 포함) (0) | 2024.02.12 |
올해 아이폰 16 주요 정보 (디스플레이 더 커진다) (0) | 2024.02.12 |
데이터 라벨링 알바 방법 및 사이트 정보, 단가(재택 부업) (0) | 2024.02.12 |
2023년 연간 세계 스마트폰 점유율(제조사별 및 국적별) (0) | 2024.02.11 |