인공지능/생성형AI

[생성형 AI 기초] 인공지능의 이해

CodeLoomer 2024. 5. 13. 21:34
K-ICT 빅데이터센터 온라인연수원에서 수강 중인 내용을 요약했습니다. 
최근 화두가 되는 AGI, 생성형 AI에 관한 기초 개념과 실습, 향후 전망에 관해 알 수 있습니다.

목차 

  1. 인공지능의 이해
  2. 생성형 AI의 산업 동향
  3. 생성형 AI별 특징 알기
  4. AI와 대화하기, 기술이 필요해
  5. 생성형 AI 업무 활용하기 (1)
  6. 생성형 AI 업무 활용하기 (2)
  7. 이미지 생성형 AI 이해와 실습
  8. 생성형 AI로 동영상 제작하기
  9. 생성형 AI툴 둘러보기
  10. AI 산업 전망

출처 : Pixabay - 인공 지능 뇌 생각 - @geralt님

인공지능의 이해 

1. 생성형 AI의 현재

  • AGI, 생성형 AI는 최근 Chat-GPT로 대변되고 있습니다. 
  • 모바일 인터넷의 혁명을 가져왔던 애플의 iPhone에 상응하는 혁명을 가져왔다고 평가됩니다. 
  • AGI가 주목받는 이유는 단순 데이터가 아닌 창조의 영역에 진입했기 때문입니다. 
  • AGI의 발전 속도는 기하급수적으로 짧아지고 있습니다. 

2. 대표적인 AGI

  • LLM(대형 언어 모델)을 중심으로 수 많은 AI 애플리케이션과 서비스가 출시되며 AI의 산업화 시대가 본격적으로 시작되었습니다.
  • 대표적인 AGI인 Chat-GPT는 출시 5일만에 일일사용자 수(DAU) 100만 명을 달성했으며 1,000만 명까지는 단 40일이 소요되었습니다.
  • Chat-GPT는 개개인들이 삶에 활용하여 급진적으로 확산되어 기업의 문제를 해결하는 것까지 영향력이 가속화되고 있습니다. 
  • 기존 AI는 인간이 하는 질문의 본질적인 내용을 이해할 수 없었으나, AGI는 질문의 본질을 이해하고, 사진, 영상이나 음성, 문서로 답변을 생성하여 응답합니다. 

2.1 채팅형 인터페이스

  • AGI는 채팅(대화형 인터페이스) 기술과 GPT 모델이 맞물려서 사용되고 있습니다. 
    • GPT 모델 + 대화형 인터페이스 = Chat-GPT
    • GPT 모델은 트랜스포머라는 기술을 사용합니다. 
      • 문장과 문액의 단어들 간의 관계를 파악하여 맥락과 의미를 학습하고, 다음 단어를 예측하는 방식입니다. 
  • Chat-GPT의 성능
    • 미국 변호사 시험 상위 10%, 미국 대학/대학원 입학시험 언어부문 상위 7% 이내 고득점
    • 50개 이상의 언어 구사 (전문적/학술적 시험 정확도 영어 85.5%, 한국어 77%)
  • 특징
    • 마치 사람과 대화하는 듯함.

3. 파급력

  • IT 분야에서 큰 이슈가 되는 메타버스와 클라우드 기술을 GPT와 비교했을 때, GPT > 클라우드 > 메타버스 순서대로 영향력이 큽니다.

4. 역사

  • 초기 인공지능은 체스, 수학 문제 풀이 등 특정 작업을 위한 간단한 알고리즘과 모델 중심이었습니다.
  • 점차 AI가 정교해지며 딥 러닝 기술과 대량의 데이터를 통해 더 복잡한 문제 해결이 가능해졌습니다.
  • 자연어 처리 및 컴퓨터 비전(Vision) 등의 영역에서 큰 발전을 이루었습니다.
1950 ~ 1990 2010 ~ 2020
용어 등장 규칙기반 인공지능 머신러닝 딥러닝 다양한 개념 등장 대규모 언어 모델
다트머스 회의에서 인공지능 사용 규칙을 사람이 설계 데이터로 자동 학습 인간의 신경세포 모방하여 신경망 기반 모델 기법 발전 자연어 처리, 컴퓨터 비전등 다양한 영역으로의 확대 생성AI기반의 발전된 인공지능 모델 
정해진 규칙의 경우의 수로 대응
지식 데이터베이스를 구축하여 컴퓨터가 이를 활용하는 방식
데이터에서 패턴을 찾아 학습시켜 해결
인공 신경망과 딥러닝 모델인 CNN으로 스스로 특징 학습
데이터로부터 데이터의 특징을 자동으로 학습해 냄

 

5. 개념

인공지능 기계가 인간의 지능을 따라하여 그 능력을 발휘 하도록 함
머신러닝 기계가 데이터를 학습하고 패턴을 발견해내어 추론하는 기술
딥러닝 기계가 데이터를 인간의 뇌 신경망을 모방한 모델로 학습하고 그를 통한 추론하는 기술
생성형 AI 사람의 요구에 따라 결과를 생성해 내는 인공지능 (LLM, GAN, VAE)

 

6. 최근 10년간의 변화

2012 CNN 등장 (이미지 처리 딥러닝)
2014 GAN 등장 (생성 AI 혁신)
2015 Tensorflow 등장 (프로그래머를 위한 오픈소스 AI 개발 도구)
2016 알파고 등장 (인공지능 바둑 대회, 인공지능의 대중화)
2017 트랜스포터 등장 (언어 모델의 혁신)
2018 자기 지도 학습 부각 (스스로 학습)
2019 GPT-2 및 BERT 모델 등장 (언어 모델의 표준 역할)
2020 GPT-3 및 알파폴드 2 (초대규모 모델의 범용화, 단백질 구조 예측 분석 뛰어난 성과 달성)
2021 AI 반도체 및 DALL-E 등장 (GPU의 급부상, 텍스트로 이미지 생성)

 

7. 트랜스포머의 등장

  • 2017년 구글의 Attention is all you need 논문으로 자연어 처리 분야에서 혁신적 방법, 트랜스포머 모델의 구조를 제시했습니다. 
  • 대규모 데이터를 그동안 순차적으로 학습했다면, 병렬로 학습할 수 있게 됩니다.
  • 기존에는 RNN 모델을 사용하였으며 단어의 순서대로 순차적으로 학습했다면, 트랜스포머는 그럴 필요가 없습니다.
  • 트랜스포머 모델에서 데이터를 학습할 때 입력되는 문장에서 등장하는 단어 간의 의미를 찾는 방식을 셀프어텐션(Self-attention) 기법이라고 합니다.
  • 기계 번역은 단어 사이의 관계를 가깝고 먼 관계를 알아내는 셀프어텐션 확립에 좋은 수단이었고, 이는 언어 학습 도구로 포지셔닝되었습니다.
  • 다양한 연구를 통해 트랜스포머의 규모가 클수록 성능이 좋아진다는 사실이 확인되었습니다.

8. 트랜스포머의 발전

  • 트랜스포머 공개 후 빅테크 기업들이 모두 이를 이용한 언어 모델을 연구하고 공개하기 시작했습니다.
  • 언어 모델의 표준으로 여겨지는 BERT, GPT 등은 트랜스포머 기반으로 개발됐습니다.
  • 국내에도 마찬가지로 트랜스포머 기술을 탑재하고 있습니다.
  • 기존에는 번역, 감성분석 등 각 분야별로 모델개발을 따로 했다면, 현재는 대규모 언어 이해모델을 하나 구축하고 상세한 분야별로 미세 학습(Fine-tunig)을 통해 모델을 개발했습니다.
  • 기존 이미지 분야는 CNN, 언어는 트랜스포머가 주류였으나 이제는 트랜스포머 방식으로 통합되는 실정입니다.

8. GPT(Generative Pre-trained Transformer)의 등장

  • 생성적 사전학습 트랜스포머라는 뜻으로 주어진 단어의 다음 단어를 예측하는 문제를 학습했습니다.