GPT-4 나왔다! ChatGPT의 GPT-3.5와 달라진 점은? | OpenAI의 GPT-4 소개 페이지 리뷰

728x90

GPT-4?

작년 11월부터 전 세계를 떠들썩 하게 만들었던 ChatGPT. ChatGPT는 OpenAI의 GPT-3.5 엔진을 기반으로 만들어진 대화형 인공지능 서비스이다. 그렇다면 GPT-4는 이 GPT-3.5 엔진에서 더 발전한 버전이겠지? OpenAI의 GPT-4 소개 사이트를 하나 하나 훑어보면서 어떤 부분이 가능하게 되었는지, 어떤 부분이 바뀌었는지 알아보자.

스크린샷 출처: OpenAI GPT-4 (openai.com)

GPT-4

GPT-4 is more creative and collaborative than ever before. It can generate, edit, and iterate with users on creative and technical writing tasks, such as composing songs, writing screenplays, or learning a user’s writing style.

openai.com

소개

GPT-4는 OpenAI의 가장 진보된 시스템으로 보다 안전하고 유용한 응답을 제공합니다.

간결하게 소개를 하고 있다. Security 측면에서 보완이 되었고, 조금 더 똑똑해졌다라고 해석하면 될까?

어려운 문제 해결 가능

GPT-4는 폭넓은 일반 지식과 문제 해결 능력 덕분에 어려운 문제를 더 정확하게 풀 수 있습니다.

더 많은 데이터를 외운 것인지, 검색 능력이 강화된 것인지 모르겠지만 일반 지식을 많이 갖췄다고 하고 (골든벨이나 장학퀴즈 나가도 되겠다.) 문제 해결 능력가지 갖췄다고 한다. 와우! 좋겠다.

아래와 같이 세 가지 예시를 들었는데.

창의력

문자를 반복하지 않고 A부터 Z까지 알파벳의 다음 문자로 각 단어가 시작되어야 하는 문장으로 신데렐라의 줄거리를 설명합니다.

이거 너무 어려운 거 아닌가? 한글로 예를 들면, 이렇게 되는 건가?

가난한 나의 다람쥐가 라디오를 마음대로 바꾸는 사람의 아기에게 자신의 차인 카니발에 타라고 파이팅 하였다.

말도 안 되는데 진짜 너무 힘들기 까지 하다. 사람이 해도 이런데, 이걸 AI가 해낸다고?

A beautiful Cinderella, dwelling eagerly, finally gains happiness; inspiring jealous kin, love magically nurtures opulent prince; quietly rescues, slipper triumphs, uniting very wondrously, xenial youth zealously.

와우! 이걸 해낸다고? 이 정도면 문제 풀이나 시험에 활용할 것이 아니라 예능 프로그램에 나가도 될 것 같다. 방송이나 유튜브 작가 역할을 대신 해줄 수도 있을 것 같다.

시각적 입력

GPT-4는 이미지를 입력으로 받아들이고 캡션, 분류 및 분석을 생성할 수 있습니다.

이 재료들로 무엇을 만들 수 있을까요?

이 재료로 무엇을 만들 수 있는지에 대한 많은 옵션이 있습니다! 몇 가지 가능성은 다음과 같습니다.

- 팬케이크 또는 와플
- 크레페
- 프렌치 토스트
- 오믈렛 또는 프리타타
- 키시
- 커스터드 또는 푸딩
- 케이크 또는 컵케이크
- 머핀 또는 빵 - 쿠키 또는 비스킷

이것은 단지 몇 가지 예일 뿐이지만 가능성은 무한합니다!

이제 영상 분석이 GPT-4로 인해 더 쉬워질 것 같다. 그림 속의 객체들을 구분하고 인식할 수 있다는 것이 놀랍다. 어느 정도의 학습량을 가져야 가능한 것인지, 혹은 학습량 없이 0-based로 추론이 가능한 것인지 모르겠지만 말이다.

더 긴 문맥

GPT-4는 25,000단어 이상의 텍스트를 처리할 수 있어 긴 형식의 콘텐츠 생성, 확장된 대화, 문서 검색 및 분석과 같은 사용 사례를 허용합니다.

[출처: https://en.wikipedia.org/wiki/Rihanna]

그녀의 슈퍼볼 공연과 그것이 특별했던 이유를 설명하십시오.

리한나의 슈퍼볼 LVII 하프타임 쇼 공연은 여러 가지 이유로 특별했습니다. 우선, 그것은 5년 만에 그녀의 첫 라이브 공연이었고, 슈퍼볼 하프타임 쇼의 헤드라인을 장식한 것은 그녀가 처음이었습니다. 또한 그녀는 임신 중에 슈퍼볼에서 공연한 최초의 사람이 되어 역사를 만들었습니다. 쇼 자체는 비평가들의 찬사를 받았으며 많은 사람들이 그녀의 에너지 넘치는 퍼포먼스와 인상적인 보컬을 칭찬했습니다. 또한 엄청난 시청률을 기록하며 역사상 두 번째로 가장 많이 본 하프타임 쇼가 되었습니다.

이것이 왜 놀라운지 이해가 안 가시는 분은, Rihanna의 위키피디아 페이지에 방문해 보길 바란다. 어마어마하게 길다.

https://en.wikipedia.org/wiki/Rihanna

Rihanna - Wikipedia

Barbadian singer, actress, and businesswoman (born 1988) Robyn Rihanna Fenty NH[2] ( ree-AN-ə;[3][4][n 1] born February 20, 1988) is a Barbadian singer, actress, and businesswoman. Born in Saint Michael and raised in Bridgetown, Barbados, Rihanna audition

en.wikipedia.org

ChatGPT를 능가하는 고급 추론

질문

Andrew는 오전 11시부터 오후 3시까지, Joanne은 정오부터 오후 2시까지 그리고 오후 3시 30분부터 오후 5시까지 무료입니다. Hannah는 정오에 30분 동안, 그리고 오후 4시부터 6시까지 이용할 수 있습니다. Andrew, Hannah 및 Joanne의 30분 회의 시작 시간에 대한 몇 가지 옵션은 무엇입니까?

ChatGPT (GPT-3.5)

사용 가능한 목록은 다음과 같습니다.
- 앤드류: 오전 11시 ~ 오후 3시
- 조앤: 정오~오후 2시, 오후 3시 30분~오후 5시
- 한나: 정오~오후 12시 30분, 오후 4시~오후 6시

이용 가능 여부에 따라 오후 4시부터 오후 4시 30분까지 세 가지 모두 이용 가능한 30분 창구가 있습니다. 따라서 회의는 오후 4시에 예약할 수 있습니다.

GPT-4

앤드류: 오전 11시 - 오후 3시
조앤: 오후 12시 - 오후 2시, 오후 3시 30분 - 오후 5시
한나: 오후 12시 - 오후 12시 30분, 오후 4시 - 오후 6시

30분 회의 공통 가용성: 오후 12시 - 오후 12시 30분

	11	12	13	14	15	16	17	18
Andrew	O O	O O	O O	O O
Joanne		O O	O O		O	O O
Hannah		O X				O O	O O

위와 같이 표로 만들어 보면, 3명이 모두 가능한 시간이 겹치는 구간은 12시 ~ 12시 반이다. ChatGPT는 이를 맞추지 못하였고, GPT-4는 이를 맞추어냈다. 대단하다.

시험 잘 봄

GPT-4는 응시자 사이에서 더 높은 대략적인 백분위수 점수를 획득하여 ChatGPT를 능가합니다.

Uniform Bar Exam (통합 변호사 시험)

ChatGPT는 하위 10%, GPT-4는 상위 10% 인 것으로 보인다. 백분위 점수라고 하니깐 90등은 아니겠지.

Biology Olympiad (생물학 올림피아드)

ChatGPT는 하위 31%, GPT-4는 상위 1% (이 정도면 생물학은 꿰뚫고 있네.)

딥 러닝으로 점점 발전

GPT, GPT-2 및 GPT-3의 연구 경로를 따라 딥 러닝 접근 방식은 더 많은 데이터와 계산을 활용하여 점점 더 정교하고 유능한 언어 모델을 만듭니다.

여기에는 딱히 예시가 나와있지는 않고, 저 초록색 하얀색 줄이 좌우로 흐르는 듯한 효과를 주면서 계속 변하고 있다는 것을 보여준다.

우리가 개고생해서 장기간 튜닝했더니 더 안전하고 정확해졌다.

우리는 GPT-4를 더 안전하고 정렬되도록 6개월을 보냈습니다. GPT-4는 허용되지 않는 콘텐츠에 대한 요청에 응답할 가능성이 82% 적고 내부 평가에서 GPT-3.5보다 사실에 입각한 응답을 할 가능성이 40% 더 높습니다.

안전 및 정렬

사람의 피드백을 통한 교육
- GPT-4의 동작을 개선하기 위해 ChatGPT 사용자가 제출한 피드백을 포함하여 더 많은 사람의 피드백을 통합했습니다. 또한 AI 안전 및 보안을 포함한 도메인의 초기 피드백을 위해 50명 이상의 전문가와 협력했습니다.
실제 사용을 통한 지속적인 개선
- 우리는 이전 모델의 실제 사용에서 얻은 교훈을 GPT-4의 안전 연구 및 모니터링 시스템에 적용했습니다. ChatGPT와 마찬가지로 더 많은 사람들이 사용함에 따라 정기적으로 GPT-4를 업데이트하고 개선할 것입니다.
GPT-4 지원 안전성 연구
- GPT-4의 고급 추론 및 지시에 따른 기능은 우리의 안전 작업을 가속화했습니다. GPT-4를 사용하여 모델 미세 조정을 위한 훈련 데이터를 생성하고 훈련, 평가 및 모니터링 전반에 걸쳐 분류기를 반복했습니다.

앞으로 GPT에 대해 사람들이 더 기대할 수 있도록 희망적인 메시지를 담았다.

GPT-4를 활용하여 제작된 서비스/제품

우리는 GPT-4로 혁신적인 제품을 구축하는 조직과 협력했습니다.

라고 하면서, Duolingo, Be My Eyes와 같은 많은 협력사가 있다는 것을 보여준다. 전체 목록은 해당 페이지에 가셔서 스크롤을 내려보시길 바란다.

기타 사항

연구

GPT-4는 OpenAI의 딥 러닝 확장 노력의 최신 이정표입니다.
GPT-4 연구 보기

GPT-4

We’ve created GPT-4, the latest milestone in OpenAI’s effort in scaling up deep learning. GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhi

openai.com

앞으로도 계속 발전할 것을 시사하는 듯 하다. 어떻게 연구가 이루어지고 있는지, 저 페이지에서 볼 수 있는 것 같다. 어려워서 난 패스.

Infrastructure

GPT-4는 Microsoft Azure AI 슈퍼컴퓨터에서 교육을 받았습니다. Azure의 AI 최적화 인프라를 통해 전 세계 사용자에게 GPT-4를 제공할 수도 있습니다.

너도 사...사교육?

한계

GPT-4에는 여전히 사회적 편견, 환각, 적대적 프롬프트와 같이 우리가 해결하기 위해 노력하고 있는 많은 알려진 한계가 있습니다. 우리는 사회가 이러한 모델을 채택함에 따라 투명성, 사용자 교육 및 광범위한 AI 활용 능력을 장려하고 촉진합니다. 우리는 또한 우리 모델을 형성하는 데 사람들이 입력할 수 있는 방법을 확장하는 것을 목표로 합니다.

이 한계를 극복한다면 정말 사람인지 아닌지 구분할 수 없을지도? 지금도 구분하기 어렵긴 하다. 나보다 더 똑똑하고 잘난 듯. 돈도 많겠...(?)

사용 가능

GPT-4는 ChatGPT Plus에서 사용할 수 있으며 개발자가 애플리케이션 및 서비스를 구축하기 위한 API로 사용할 수 있습니다.

위에서 보았듯이 이미 GPT-4 API를 서비스에 사용하고 있는 곳이 많다.

마치며

우리는 모두에게 힘을 실어주는 기술을 개발하기 위해 노력하면서 사람들이 GPT-4를 어떻게 사용하는지 보게 되어 기쁩니다.

ChatGPT Plus를 사용해 보세요

API 대기자 명단에 가입

결국 돈 내라는 얘기였니? 가격만 조금 저렴하면 써볼만 할 텐데, 요즘 달러도 비싼데 한 달에 20달러라니. 내가 알기로 API 사용은 사용 건당 요금을 내는데, 0.01$ 정도였던 것으로 알고 있다. API를 사용하는 방법에 능숙한 개발자라면 GPT-4를 활용해서 멋진 무언가를 만들어 보는 것도 좋을 것 같다.

여담

OpenAI에서 메일이 왔다. 본인들은 SVB(실리콘밸리은행) 파산 사태에 영향을 받지 않는다는 내용인 것 같다. 더불어, 자신들을 사칭한 금전 요구 사기에 넘어가지 말라는 내용으로 보인다.

조심하자.

"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."

728x90

저작자표시 비영리 변경금지 (새창열림)

'#개발 이야기 - 개발, IT 트렌드 > AI 이야기' 카테고리의 다른 글

구글 Bard 출시 임박! ChatGPT를 이길 수 있을까? \| 대 AI 시대 (0)	2023.04.04
ChatGPT로 Pixabay에서 원하는 이미지 보는 파이썬 프로그램 만들기 \| 비개발자도 가능 (1)	2023.03.28
ChatGPT로 원하는 무료 이미지/비디오 다운로드 하는 프로그램 만들기 \| 비개발자도 가능! \| pexels, Pixabay (0)	2023.03.02
ChatGPT와 함께 사용하면 좋은 확장 프로그램 2가지 \| 프롬프트 지니, AIPRM (0)	2023.03.01
ChatGPT로 2023년도 미국 주식 예측하는 프로그램 만들기 #1 \| 비개발자도 가능 (0)	2023.02.27

GPT-4 나왔다! ChatGPT의 GPT-3.5와 달라진 점은? | OpenAI의 GPT-4 소개 페이지 리뷰

GPT-4?

소개

어려운 문제 해결 가능

창의력

시각적 입력

더 긴 문맥

ChatGPT를 능가하는 고급 추론

질문

ChatGPT (GPT-3.5)

GPT-4

시험 잘 봄

Uniform Bar Exam (통합 변호사 시험)

Biology Olympiad (생물학 올림피아드)

딥 러닝으로 점점 발전

우리가 개고생해서 장기간 튜닝했더니 더 안전하고 정확해졌다.

안전 및 정렬

GPT-4를 활용하여 제작된 서비스/제품

기타 사항

연구

Infrastructure

한계

사용 가능

마치며

여담

'#개발 이야기 - 개발, IT 트렌드 > AI 이야기' 카테고리의 다른 글

댓글

티스토리툴바

GPT-4 나왔다! ChatGPT의 GPT-3.5와 달라진 점은? | OpenAI의 GPT-4 소개 페이지 리뷰

GPT-4?

소개

어려운 문제 해결 가능

창의력

시각적 입력

더 긴 문맥

ChatGPT를 능가하는 고급 추론

질문

ChatGPT (GPT-3.5)

GPT-4

시험 잘 봄

Uniform Bar Exam (통합 변호사 시험)

Biology Olympiad (생물학 올림피아드)

딥 러닝으로 점점 발전

우리가 개고생해서 장기간 튜닝했더니 더 안전하고 정확해졌다.

안전 및 정렬

GPT-4를 활용하여 제작된 서비스/제품

기타 사항

연구

Infrastructure

한계

사용 가능

마치며

여담

'#개발 이야기 - 개발, IT 트렌드 > AI 이야기' 카테고리의 다른 글

관련글

댓글

티스토리툴바