K-ICT 빅데이터센터 온라인연수원에서 수강 중인 내용을 요약했습니다.
최근 화두가 되는 AGI, 생성형 AI에 관한 기초 개념과 실습, 향후 전망에 관해 알 수 있습니다.
목차
- 인공지능의 이해
- 생성형 AI의 산업 동향
- 생성형 AI별 특징 알기
- AI와 대화하기, 기술이 필요해
- 생성형 AI 업무 활용하기 (1)
- 생성형 AI 업무 활용하기 (2)
- 이미지 생성형 AI 이해와 실습
- 생성형 AI로 동영상 제작하기
- 생성형 AI툴 둘러보기
- AI 산업 전망
생성형 AI의 산업 동향
1. 생성형 AI 전쟁의 시작, GPT-3 등장
- 1.1억 개의 매개변수에서 현재 1,750개로 확대되었습니다.
- 각 버전별 모델의 구조는 동일하지만 모델의 용량의 크기와 학습 데이터에서 차이가 있습니다.
- 2020년 상반기까지 언어모델의 크기에 변화가 미비했지만, GPT-3에서 초거대 모델이 등장하게 된 것입니다.
- 특히 추가 데이터의 파인튜닝(미세조정) 없이 몇 개의 샘플만으로 특정 분야의 업무를 수행할 수 있는 퓨샷 러닝(Few-shot learning)의 성능이 대폭 향상되었습니다.
GPT-1 | GPT-2 | GPT-3 | GPT-3.5 (Chat-GPT) |
1.17억개 | 15억개 | 1,750억개 | 1,750억개 + 인간피드백을 통한 강화학습 |
2018.5.11 | 2019.2.14 | 2020.6.11 | 2022.11.30 |
2. Open AI 창업자
- Chat-GPT는 Open AI가 개발한 서비스입니다.
- 6명이 공동으로 설립했음. (Elon Musk, Sam Altman, Greg Brockman, Ilya Sutskever Wojciech Zaremba John Schulman)
- Open AI의 현 CEO는 샘 알트만(Sam Altman)입니다.
- Open AI는 영리 기업인 OpenAI와 비영리 기업인 OpenAI LP 두 개의 회사로 운영되고 있음
3. ChatGPT 무엇인가?
- Chat + Generative + Pretrained + Transformer
- 대화형 + 생성형 + 사전학습한 + 다음 단어 예측 모델
- 거의 모든 지식 노동에 영향력을 미치고 있습니다.
- 아이디어 발상 능력, 콘텐츠 생성 능력 (카피라이딩, 구조화된 글쓰기), 정리 요약 능력, 패턴화 및 유형화 수준의 해석 기능입니다.
4. ChatGPT가 일으킨 파장
- 다른 AI 언어 모델과 다른 점은 방대한 학습데이터와 이를 처리할 수 있는 모델의 구조에 있습니다.
- 3,000억 개의 토큰과 1,750개의 매개변수를 갖추었습니다.
- AI의 기술 발전은 매개변수의 수를 늘리는 것이라고 할 정도입니다.
- 모델 자체의 새로움이 아니라 양적 변화가 AI의 질적인 차원의 변화를 가져온다는 점이 중요합니다.
- GPT-3가 "나는 인간을 파괴할 생각이 없다"는 기고문을 쓰며 주목받게 됨. 실제 칼럼니스트의 글과 크게 다르지 않았다고 합니다.
- GPT-3가 작성한 글을 사람이 작성한 것인지 판별하는 실험에서 평균 52%만이 구분에 성공했다고 함. 최저 12%만이 AI가 작성한 기사임을 알아차린 실험도 있었습니다.
5. ChatGPT가 주목받는 이유
- 인간 피드백 강화 학습 때문임. (Reinforcement Learnig From Human Feedback)
- GPT-3.5와 GPT-3는 성능면에서 차이가 없었으나, RLHF 덕분에 대화에 최적화됩니다.
6. 인간 피드백 강화학습 RLHF
- 1단계 : 사람이 질문과 답변의 세트를 아주 많이 만들어 둡니다. (Prompts dataset)
- Supervised Fine-tuned model (SFT)
- 2단계 : 사람이 하나의 질문을 선택하면, 인공지능이 여러 개의 답변을 생성함, 사람이 이 답변의 순위를 선택해서 모델에게 다시 알려줍니다.
- 3단계 : 2단계의 도출 결과를 다시 모델에 새로운 데이터로 다시 학습을 시켜 결과를 개선합니다. (강화 학습)
7. 돈이 많이 드는 생성형 AI
- AI가 MLP(Multi-layer Perception) 모델을 수십 배씩 확장시키는 방법으로 발전하므로, AI 학습에 드는 비용은 기하급수적으로 증하고 있습니다.
- 또한 유지하고 사용하는데 학습보다 훨씬 더 큰 비용이 소요됩니다.
- 조지 워싱턴 대의 데이비드 카프 부교수는 "돈이 챗GPT의 마법을 끝장낼 것이다"라며 비용 지적을 했습니다.
- 샘 알트만은 " ChatGPT 비용은 눈물 날 정도로 비싸다"라고 했습니다.
- 하루 클라우드 운영비가 10억 원 이상일 것이라고 추정됩니다.
- 기본적으로 무료 사용하지만, 월 20달러 유료 사용 상품을 출시했음.
- 하지만 저작권법 및 개인정보보호규정을 위반했다는 의심을 받고 있음.
8. 생성형 AI 생태계의 확대
- 파운데이션 모델 기반의 서비스 활성화
- 이미 완성되어 있는 기초 모델을 활용하고 있습니다. (수행 목표가 정해지지 않은 모델)
- 기초 모델을 중심으로 각자 구체적 목적에 맞게 파인 튜닝(미세 조정)하여 새로운 서비스를 만들어 내고 있습니다.
- 다양한 애플리케이션과 서비스가 출시되고 있습니다.
9. GPT 생태계 주요 참여자
- 크게 애플리케이션, 모델, 인프라 유형으로 구성되어 있습니다.
- 애플리케이션 : 파인 튜닝 기술력 보유 여부가 경쟁력, 스타트업 위주로 활성화되고 있습니다.
- GPT 모델 : 모델의 데이터 학습 능력이 경쟁력, 빅데크를 주축으로 초거대 AI모델이 경쟁하고 있습니다.
- 인프라 : 모델 구동을 위한 하드웨어와 서비스를 위한 클라우드 인프라 필요. GPT 모델 처리 능력이 경쟁력입니다.
9. GPT와 비즈니스
마케팅/영업 | 운영 | IT,엔지니어링 | 법률 | 인사 | 인력 최적화 |
콘텐츠 생성 피드백 요약/분석 |
고객 문의 해결 상품 결함 파악 |
코딩 문제 해결 코드 생성 |
특허 계약 검토 규제 변화 추적 |
면접 질문 생성 인사 업무 자동화 |
소통기능 최적화 발표자료 생성 |
10. 비즈니스의 진화 (API 비즈니스)
- 원래 잘하는 서비스에 더 똑똑한 비서(AI)가 탑재되는 형태
- 패션 기업의 경우 크리에이티브 디렉터 및 머천다이저 기능을 AI에게 맡기는 형태
- 금융의 경우 음성으로 명령하면 송금하도록 자동화하거나, 투자 상담도 AI와 하는 형태.
- 사회 복지의 경우 1인 가구 어르신을 대상으로 말벗 서비스를 AI로 제공하는 형태
'인공지능 > 생성형AI' 카테고리의 다른 글
[생성형 AI 기초] 이미지 생성형AI 이해와 실습 (0) | 2024.05.18 |
---|---|
[생성형 AI 기초] 생성형 AI 업무 활용하기 (1,2) (0) | 2024.05.17 |
[생성형 AI 기초] AI와 대화하기, 기술이 필요해 (0) | 2024.05.16 |
[생성형 AI 기초] 생성형AI별 특징알기 (0) | 2024.05.15 |
[생성형 AI 기초] 인공지능의 이해 (0) | 2024.05.13 |