인공지능/생성형AI

[생성형 AI 기초] 생성형 AI의 산업 동향

CodeLoomer 2024. 5. 14. 14:51
K-ICT 빅데이터센터 온라인연수원에서 수강 중인 내용을 요약했습니다. 
최근 화두가 되는 AGI, 생성형 AI에 관한 기초 개념과 실습, 향후 전망에 관해 알 수 있습니다.

목차 

  1. 인공지능의 이해
  2. 생성형 AI의 산업 동향
  3. 생성형 AI별 특징 알기
  4. AI와 대화하기, 기술이 필요해
  5. 생성형 AI 업무 활용하기 (1)
  6. 생성형 AI 업무 활용하기 (2)
  7. 이미지 생성형 AI 이해와 실습
  8. 생성형 AI로 동영상 제작하기
  9. 생성형 AI툴 둘러보기
  10. AI 산업 전망

출처 : Pixabay - 채팅 gpt 스크래블 타일 - @viarami님

생성형 AI의 산업 동향

1. 생성형 AI 전쟁의 시작, GPT-3 등장

  • 1.1억 개의 매개변수에서 현재 1,750개로 확대되었습니다.
  • 각 버전별 모델의 구조는 동일하지만 모델의 용량의 크기와 학습 데이터에서 차이가 있습니다.
  • 2020년 상반기까지 언어모델의 크기에 변화가 미비했지만, GPT-3에서 초거대 모델이 등장하게 된 것입니다.
  • 특히 추가 데이터의 파인튜닝(미세조정) 없이 몇 개의 샘플만으로 특정 분야의 업무를 수행할 수 있는 퓨샷 러닝(Few-shot learning)의 성능이 대폭 향상되었습니다.
GPT-1 GPT-2 GPT-3 GPT-3.5 (Chat-GPT)
1.17억개 15억개 1,750억개 1,750억개 + 인간피드백을 통한 강화학습
2018.5.11 2019.2.14 2020.6.11 2022.11.30

 

2. Open AI 창업자

  • Chat-GPT는 Open AI가 개발한 서비스입니다.
  • 6명이 공동으로 설립했음. (Elon Musk, Sam Altman, Greg Brockman, Ilya Sutskever Wojciech Zaremba John Schulman)
  • Open AI의 현 CEO는 샘 알트만(Sam Altman)입니다.
  • Open AI는 영리 기업인 OpenAI와 비영리 기업인 OpenAI LP  두 개의 회사로 운영되고 있음

3. ChatGPT 무엇인가?

  • Chat + Generative + Pretrained + Transformer 
    • 대화형 + 생성형 + 사전학습한 + 다음 단어 예측 모델
  • 거의 모든 지식 노동에 영향력을 미치고 있습니다.
    • 아이디어 발상 능력, 콘텐츠 생성 능력 (카피라이딩, 구조화된 글쓰기), 정리 요약 능력, 패턴화 및 유형화 수준의 해석 기능입니다.

4. ChatGPT가 일으킨 파장

  • 다른 AI 언어 모델과 다른 점은 방대한 학습데이터와 이를 처리할 수 있는 모델의 구조에 있습니다. 
    • 3,000억 개의 토큰과 1,750개의 매개변수를 갖추었습니다.
    • AI의 기술 발전은 매개변수의 수를 늘리는 것이라고 할 정도입니다. 
  • 모델 자체의 새로움이 아니라 양적 변화가 AI의 질적인 차원의 변화를 가져온다는 점이 중요합니다. 
  • GPT-3가 "나는 인간을 파괴할 생각이 없다"는 기고문을 쓰며 주목받게 됨. 실제 칼럼니스트의 글과 크게 다르지 않았다고 합니다. 
  • GPT-3가 작성한 글을 사람이 작성한 것인지 판별하는 실험에서 평균 52%만이 구분에 성공했다고 함. 최저 12%만이 AI가 작성한 기사임을 알아차린 실험도 있었습니다. 

5. ChatGPT가 주목받는 이유

  • 인간 피드백 강화 학습 때문임. (Reinforcement Learnig From Human Feedback)
    • GPT-3.5와 GPT-3는 성능면에서 차이가 없었으나, RLHF 덕분에 대화에 최적화됩니다.

6. 인간 피드백 강화학습 RLHF 

  • 1단계 : 사람이 질문과 답변의 세트를 아주 많이 만들어 둡니다. (Prompts dataset)
    • Supervised Fine-tuned model (SFT)
  • 2단계 : 사람이 하나의 질문을 선택하면, 인공지능이 여러 개의 답변을 생성함, 사람이 이 답변의 순위를 선택해서 모델에게 다시 알려줍니다. 
  • 3단계 : 2단계의 도출 결과를 다시 모델에 새로운 데이터로 다시 학습을 시켜 결과를 개선합니다. (강화 학습)

7. 돈이 많이 드는 생성형 AI

  • AI가 MLP(Multi-layer Perception) 모델을 수십 배씩 확장시키는 방법으로 발전하므로, AI 학습에 드는 비용은 기하급수적으로 증하고 있습니다.
  • 또한 유지하고 사용하는데 학습보다 훨씬 더 큰 비용이 소요됩니다.
  • 조지 워싱턴 대의 데이비드 카프 부교수는 "돈이 챗GPT의 마법을 끝장낼 것이다"라며 비용 지적을 했습니다. 
    • 샘 알트만은 " ChatGPT 비용은 눈물 날 정도로 비싸다"라고 했습니다. 
    • 하루 클라우드 운영비가 10억 원 이상일 것이라고 추정됩니다.
  • 기본적으로 무료 사용하지만, 월 20달러 유료 사용 상품을 출시했음. 
  • 하지만 저작권법 및 개인정보보호규정을 위반했다는 의심을 받고 있음. 

8. 생성형 AI 생태계의 확대

  • 파운데이션 모델 기반의 서비스 활성화
    • 이미 완성되어 있는 기초 모델을 활용하고 있습니다. (수행 목표가 정해지지 않은 모델)
    • 기초 모델을 중심으로 각자 구체적 목적에 맞게 파인 튜닝(미세 조정)하여 새로운 서비스를 만들어 내고 있습니다.
    • 다양한 애플리케이션과 서비스가 출시되고 있습니다.

9. GPT 생태계 주요 참여자

  • 크게 애플리케이션, 모델, 인프라 유형으로 구성되어 있습니다.
  • 애플리케이션 : 파인 튜닝 기술력 보유 여부가 경쟁력, 스타트업 위주로 활성화되고 있습니다.
  • GPT 모델 : 모델의 데이터 학습 능력이 경쟁력, 빅데크를 주축으로 초거대 AI모델이 경쟁하고 있습니다.
  • 인프라 : 모델 구동을 위한 하드웨어와 서비스를 위한 클라우드 인프라 필요. GPT 모델 처리 능력이 경쟁력입니다.

9. GPT와 비즈니스

마케팅/영업 운영 IT,엔지니어링 법률 인사 인력 최적화
콘텐츠 생성
피드백 요약/분석
고객 문의 해결
상품 결함 파악
코딩 문제 해결
코드 생성
특허 계약 검토
규제 변화 추적
면접 질문 생성
인사 업무 자동화
소통기능 최적화
발표자료 생성

10. 비즈니스의 진화 (API 비즈니스)

  • 원래 잘하는 서비스에 더 똑똑한 비서(AI)가 탑재되는 형태 
  • 패션 기업의 경우 크리에이티브 디렉터 및 머천다이저 기능을 AI에게 맡기는 형태
  • 금융의 경우 음성으로 명령하면 송금하도록 자동화하거나, 투자 상담도 AI와 하는 형태.
  • 사회 복지의 경우 1인 가구 어르신을 대상으로 말벗 서비스를 AI로 제공하는 형태