본문 바로가기
#개발 이야기 - 개발, IT 트렌드/AI 이야기

GPT-4 나왔다! ChatGPT의 GPT-3.5와 달라진 점은? | OpenAI의 GPT-4 소개 페이지 리뷰

by DrinkAloneTogether 2023. 3. 16.
728x90
반응형

GPT-4 AI 이야기
AI 이야기

GPT-4?

 작년 11월부터 전 세계를 떠들썩 하게 만들었던 ChatGPT. ChatGPT는 OpenAI의 GPT-3.5 엔진을 기반으로 만들어진 대화형 인공지능 서비스이다. 그렇다면 GPT-4는 이 GPT-3.5 엔진에서 더 발전한 버전이겠지? OpenAI의 GPT-4 소개 사이트를 하나 하나 훑어보면서 어떤 부분이 가능하게 되었는지, 어떤 부분이 바뀌었는지 알아보자.

스크린샷 출처: OpenAI GPT-4 (openai.com)
 

GPT-4

GPT-4 is more creative and collaborative than ever before. It can generate, edit, and iterate with users on creative and technical writing tasks, such as composing songs, writing screenplays, or learning a user’s writing style.

openai.com


소개

GPT-4는 OpenAI의 가장 진보된 시스템으로 보다 안전하고 유용한 응답을 제공합니다.

 간결하게 소개를 하고 있다. Security 측면에서 보완이 되었고, 조금 더 똑똑해졌다라고 해석하면 될까?

1


어려운 문제 해결 가능

GPT-4는 폭넓은 일반 지식과 문제 해결 능력 덕분에 어려운 문제를 더 정확하게 풀 수 있습니다.

 더 많은 데이터를 외운 것인지, 검색 능력이 강화된 것인지 모르겠지만 일반 지식을 많이 갖췄다고 하고 (골든벨이나 장학퀴즈 나가도 되겠다.) 문제 해결 능력가지 갖췄다고 한다. 와우! 좋겠다.

 아래와 같이 세 가지 예시를 들었는데.

2

창의력

 문자를 반복하지 않고 A부터 Z까지 알파벳의 다음 문자로 각 단어가 시작되어야 하는 문장으로 신데렐라의 줄거리를 설명합니다.

이거 너무 어려운 거 아닌가? 한글로 예를 들면, 이렇게 되는 건가?

난한 람쥐가 디오를 음대로 꾸는 람의 기에게 신의 니발에 라고 이팅 였다.

말도 안 되는데 진짜 너무 힘들기 까지 하다. 사람이 해도 이런데, 이걸 AI가 해낸다고?

A beautiful Cinderella, dwelling eagerly, finally gains happiness; inspiring jealous kin, love magically nurtures opulent prince; quietly rescues, slipper triumphs, uniting very wondrously, xenial youth zealously.

와우! 이걸 해낸다고? 이 정도면 문제 풀이나 시험에 활용할 것이 아니라 예능 프로그램에 나가도 될 것 같다. 방송이나 유튜브 작가 역할을 대신 해줄 수도 있을 것 같다.


3

시각적 입력

GPT-4는 이미지를 입력으로 받아들이고 캡션, 분류 및 분석을 생성할 수 있습니다.
이 재료들로 무엇을 만들 수 있을까요?
이 재료로 무엇을 만들 수 있는지에 대한 많은 옵션이 있습니다! 몇 가지 가능성은 다음과 같습니다.

- 팬케이크 또는 와플
- 크레페
- 프렌치 토스트
- 오믈렛 또는 프리타타
- 키시
- 커스터드 또는 푸딩
- 케이크 또는 컵케이크
- 머핀 또는 빵 - 쿠키 또는 비스킷

이것은 단지 몇 가지 예일 뿐이지만 가능성은 무한합니다!

 이제 영상 분석이 GPT-4로 인해 더 쉬워질 것 같다. 그림 속의 객체들을 구분하고 인식할 수 있다는 것이 놀랍다. 어느 정도의 학습량을 가져야 가능한 것인지, 혹은 학습량 없이 0-based로 추론이 가능한 것인지 모르겠지만 말이다.


4

더 긴 문맥

GPT-4는 25,000단어 이상의 텍스트를 처리할 수 있어 긴 형식의 콘텐츠 생성, 확장된 대화, 문서 검색 및 분석과 같은 사용 사례를 허용합니다.
[출처: https://en.wikipedia.org/wiki/Rihanna]

그녀의 슈퍼볼 공연과 그것이 특별했던 이유를 설명하십시오.
리한나의 슈퍼볼 LVII 하프타임 쇼 공연은 여러 가지 이유로 특별했습니다. 우선, 그것은 5년 만에 그녀의 첫 라이브 공연이었고, 슈퍼볼 하프타임 쇼의 헤드라인을 장식한 것은 그녀가 처음이었습니다. 또한 그녀는 임신 중에 슈퍼볼에서 공연한 최초의 사람이 되어 역사를 만들었습니다. 쇼 자체는 비평가들의 찬사를 받았으며 많은 사람들이 그녀의 에너지 넘치는 퍼포먼스와 인상적인 보컬을 칭찬했습니다. 또한 엄청난 시청률을 기록하며 역사상 두 번째로 가장 많이 본 하프타임 쇼가 되었습니다.

 이것이 왜 놀라운지 이해가 안 가시는 분은, Rihanna의 위키피디아 페이지에 방문해 보길 바란다. 어마어마하게 길다.

https://en.wikipedia.org/wiki/Rihanna
 

Rihanna - Wikipedia

Barbadian singer, actress, and businesswoman (born 1988) Robyn Rihanna Fenty NH[2] ( ree-AN-ə;[3][4][n 1] born February 20, 1988) is a Barbadian singer, actress, and businesswoman. Born in Saint Michael and raised in Bridgetown, Barbados, Rihanna audition

en.wikipedia.org


ChatGPT를 능가하는 고급 추론

5

질문

Andrew는 오전 11시부터 오후 3시까지, Joanne은 정오부터 오후 2시까지 그리고 오후 3시 30분부터 오후 5시까지 무료입니다. Hannah는 정오에 30분 동안, 그리고 오후 4시부터 6시까지 이용할 수 있습니다. Andrew, Hannah 및 Joanne의 30분 회의 시작 시간에 대한 몇 가지 옵션은 무엇입니까?

ChatGPT (GPT-3.5)

사용 가능한 목록은 다음과 같습니다.
- 앤드류: 오전 11시 ~ 오후 3시
- 조앤: 정오~오후 2시, 오후 3시 30분~오후 5시
- 한나: 정오~오후 12시 30분, 오후 4시~오후 6시

이용 가능 여부에 따라 오후 4시부터 오후 4시 30분까지 세 가지 모두 이용 가능한 30분 창구가 있습니다. 따라서 회의는 오후 4시에 예약할 수 있습니다.

GPT-4

앤드류: 오전 11시 - 오후 3시
조앤: 오후 12시 - 오후 2시, 오후 3시 30분 - 오후 5시
한나: 오후 12시 - 오후 12시 30분, 오후 4시 - 오후 6시

30분 회의 공통 가용성: 오후 12시 - 오후 12시 30분

 

  11 12 13 14 15 16 17 18
Andrew O       O O       O O       O O       O        
Joanne   O       O O       O            O O       O    
Hannah   O       X       O       O O       O  

 위와 같이 표로 만들어 보면, 3명이 모두 가능한 시간이 겹치는 구간은 12시 ~ 12시 반이다. ChatGPT는 이를 맞추지 못하였고, GPT-4는 이를 맞추어냈다. 대단하다.


6

시험 잘 봄

GPT-4는 응시자 사이에서 더 높은 대략적인 백분위수 점수를 획득하여 ChatGPT를 능가합니다.

Uniform Bar Exam (통합 변호사 시험)

ChatGPT는 하위 10%, GPT-4는 상위 10% 인 것으로 보인다. 백분위 점수라고 하니깐 90등은 아니겠지.

Biology Olympiad (생물학 올림피아드)

ChatGPT는 하위 31%, GPT-4는 상위 1% (이 정도면 생물학은 꿰뚫고 있네.)


7

딥 러닝으로 점점 발전

GPT, GPT-2 및 GPT-3의 연구 경로를 따라 딥 러닝 접근 방식은 더 많은 데이터와 계산을 활용하여 점점 더 정교하고 유능한 언어 모델을 만듭니다.

 여기에는 딱히 예시가 나와있지는 않고, 저 초록색 하얀색 줄이 좌우로 흐르는 듯한 효과를 주면서 계속 변하고 있다는 것을 보여준다.


8

우리가 개고생해서 장기간 튜닝했더니 더 안전하고 정확해졌다.

우리는 GPT-4를 더 안전하고 정렬되도록 6개월을 보냈습니다. GPT-4는 허용되지 않는 콘텐츠에 대한 요청에 응답할 가능성이 82% 적고 내부 평가에서 GPT-3.5보다 사실에 입각한 응답을 할 가능성이 40% 더 높습니다.

안전 및 정렬

  • 사람의 피드백을 통한 교육
    • GPT-4의 동작을 개선하기 위해 ChatGPT 사용자가 제출한 피드백을 포함하여 더 많은 사람의 피드백을 통합했습니다. 또한 AI 안전 및 보안을 포함한 도메인의 초기 피드백을 위해 50명 이상의 전문가와 협력했습니다.
  • 실제 사용을 통한 지속적인 개선
    • 우리는 이전 모델의 실제 사용에서 얻은 교훈을 GPT-4의 안전 연구 및 모니터링 시스템에 적용했습니다. ChatGPT와 마찬가지로 더 많은 사람들이 사용함에 따라 정기적으로 GPT-4를 업데이트하고 개선할 것입니다.
  • GPT-4 지원 안전성 연구
    • GPT-4의 고급 추론 및 지시에 따른 기능은 우리의 안전 작업을 가속화했습니다. GPT-4를 사용하여 모델 미세 조정을 위한 훈련 데이터를 생성하고 훈련, 평가 및 모니터링 전반에 걸쳐 분류기를 반복했습니다.

 앞으로 GPT에 대해 사람들이 더 기대할 수 있도록 희망적인 메시지를 담았다.


9

GPT-4를 활용하여 제작된 서비스/제품

우리는 GPT-4로 혁신적인 제품을 구축하는 조직과 협력했습니다.

라고 하면서, Duolingo, Be My Eyes와 같은 많은 협력사가 있다는 것을 보여준다. 전체 목록은 해당 페이지에 가셔서 스크롤을 내려보시길 바란다.


10

기타 사항

연구

GPT-4는 OpenAI의 딥 러닝 확장 노력의 최신 이정표입니다.
GPT-4 연구 보기
 

GPT-4

We’ve created GPT-4, the latest milestone in OpenAI’s effort in scaling up deep learning. GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhi

openai.com

 앞으로도 계속 발전할 것을 시사하는 듯 하다. 어떻게 연구가 이루어지고 있는지, 저 페이지에서 볼 수 있는 것 같다. 어려워서 난 패스.

Infrastructure

GPT-4는 Microsoft Azure AI 슈퍼컴퓨터에서 교육을 받았습니다. Azure의 AI 최적화 인프라를 통해 전 세계 사용자에게 GPT-4를 제공할 수도 있습니다.

너도 사...사교육?

한계

GPT-4에는 여전히 사회적 편견, 환각, 적대적 프롬프트와 같이 우리가 해결하기 위해 노력하고 있는 많은 알려진 한계가 있습니다. 우리는 사회가 이러한 모델을 채택함에 따라 투명성, 사용자 교육 및 광범위한 AI 활용 능력을 장려하고 촉진합니다. 우리는 또한 우리 모델을 형성하는 데 사람들이 입력할 수 있는 방법을 확장하는 것을 목표로 합니다.

 이 한계를 극복한다면 정말 사람인지 아닌지 구분할 수 없을지도? 지금도 구분하기 어렵긴 하다. 나보다 더 똑똑하고 잘난 듯. 돈도 많겠...(?)

사용 가능

GPT-4는 ChatGPT Plus에서 사용할 수 있으며 개발자가 애플리케이션 및 서비스를 구축하기 위한 API로 사용할 수 있습니다.

위에서 보았듯이 이미 GPT-4 API를 서비스에 사용하고 있는 곳이 많다.


11

마치며

우리는 모두에게 힘을 실어주는 기술을 개발하기 위해 노력하면서 사람들이 GPT-4를 어떻게 사용하는지 보게 되어 기쁩니다.
ChatGPT Plus를 사용해 보세요
API 대기자 명단에 가입

 결국 돈 내라는 얘기였니? 가격만 조금 저렴하면 써볼만 할 텐데, 요즘 달러도 비싼데 한 달에 20달러라니. 내가 알기로 API 사용은 사용 건당 요금을 내는데, 0.01$ 정도였던 것으로 알고 있다. API를 사용하는 방법에 능숙한 개발자라면 GPT-4를 활용해서 멋진 무언가를 만들어 보는 것도 좋을 것 같다.


12

여담

OpenAI에서 메일이 왔다. 본인들은 SVB(실리콘밸리은행) 파산 사태에 영향을 받지 않는다는 내용인 것 같다. 더불어, 자신들을 사칭한 금전 요구 사기에 넘어가지 말라는 내용으로 보인다.

조심하자.

"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

728x90
반응형

댓글