본문 바로가기

오픈AI의 ChatGPT o1-preview, o1-mini 사용법 - GPT-4o 성능 및 답변 차이

Hub's 2024. 9. 14.

오픈AI에서 새로운 ChatGPT 모델 o1 발표

오픈AI에서 새로운 AI 모델 시리즈인 o1을 발표하였습니다.

기존과 다른 점은 질문에 대한 답을 하기 전에 "생각하도록 설계"되었다고 합니다. 즉, 진짜 추론을 할 수 있도록 하게 된 겁니다. 

ChatGPT o1 모델 발표
ChatGPT o1 모델 발표

ChatGPT o1, o1-preview, o1-mini 특징

o1의 경우 프로그래밍, 수학 올림피아드 등 관련 벤치마크 수준이 박사 수준을 넘어섰다고 합니다.

ChatGPT 3가 나온지 2년이 안되었는데, 기술 발전이 너무 빠른거 같네요.

그때는 아직 오류도 많고, 고지식의 수준까지는 아니라고 했었는데 대단하네요.

OpenAI o1 설명
OpenAI o1 설명

그리고 아래의 그래프는 o1이 데이터 학습에 있어서 안전성까지 있다고 하는 그래프 지표 입니다. 

데이터 학습 안전성
데이터 학습 안전성

 

o1-preview 모델의 경우, 질문에 대한 반응으로 생각을 한다고 합니다.

이번 발표에서 "생각"이라는 키워드를 중점으로 많이 언급하고 있는 게 보입니다. 

사실 가장 큰 특징이긴 합니다. 

그리고 o1의 특징인 추론 문제 해결에 강점이 있다고 합니다. 

o1-preview 설명
o1-preview 설명

o1-mini는 STEM 분야, 특히 수학과 코딩에 엄청난 강점이 있다고 합니다.

수하 올림피아드 대회와, 코딩 대회에서 평가한 벤치마크의 수준이 OpenAI o1 모델과 거의 비슷하다고 합니다.

비용을 더 저렴하다고 합니다. API 쓰시는 분들은 o1-mini가 좋은 대안이 될 수도 있다고 생각합니다.

o1-mini 설명
o1-mini 설명

ChatGPT o1 벤치마크 결과 (성능 차이) - o1 vs GPT4o 

o1 시리즈와 GPT-4o에 대한 머신러닝 벤치마크 결과입니다.

모두 o1 시리즈가 압도적으로 성능이 좋은 것을 확인할 수 있습니다.

차이가 좀 크게 나는게 이외인것 같네요. 

ML 벤치마크 결과
ML 벤치마크 결과

어려운 추론 문제에 대해서도 GPT-4o보다 성능이 크게 향상되어있는 것을 눈으로 확인하실 수 있습니다.

모든 부분에서 o1 모델이 높습니다. 

4o가 성능 좋다고 했던게 불과 5개월 전인데, 5개월만에 성능을 이렇게까지 올리다니 대단합니다.

ML 벤치마크 결과2
ML 벤치마크 결과2

ChatGPT o1 사용자 조건

ChatGPT o1 모델을 사용하시려면 유료 사용자는 사용이 가능하지만, 무료 사용자는 사용이 불가합니다.

요금제 유형 ChatGPT o1 모델 사용 유무 비고
ChatGPT Plus O -
ChatGPT Team O -
ChatGPT Enterprise O -
ChatGPT Edu O -
ChatGPT API O Tier 5 사용
ChatGPT Free X 사용 예정(o1-mini 모델만), 날짜 미정

 

나중에 o1-mini 모델만 무료 사용자에게 쓸 수 있게 한다고 합니다.

하지만 날짜는 미정입니다. 

ChatGPT o1 사용법 예시 - 영어 문제 풀이

먼저 ChatGPT에 로그인하시고 모델 선택 부분에 o1-preview와 o1-mini 모델 선택이 가능합니다.

원하시는 모델을 선택하시면 사용이 가능합니다.

ChatGPT o1 모델 선택 화면
ChatGPT o1 모델 선택 화면

영어 문제를 풀어보겠습니다.

저는 다음과 같은 영어 문제를 풀어 달라고 했습니다. 

ChatGPT o1 답변

영어 문제 풀이
영어 문제 풀이

22초 동안 o1-preview 모델이 생각하고 있는 과정을 볼 수 있습니다.

과정을 볼 수 있으니깐, 대답의 근거를 알 수 있으니 잘 활용하면 보고서 작성을 하거나 어떤 프로젝트를 기획하거나 할 때 유용하게 사용할 수 있을 것 같네요.

22초 동안 생각하는 o1-preview
22초 동안 생각하는 o1-preview

그리고 생각의 과정을 통해 다음과 같은 답변을 도출해 냈습니다.

o1-preveiw 답변
o1-preveiw 답변

정답도 잘 찾아주고, 좋네요.

GPT-4o 답변

똑같은 질문으로 GPT-4o에게 질문을 하겠습니다.

GPT-4o 답변
GPT-4o 답변

정답이 일단 틀렸고, 생각하는 생각보다 답을 내는 근거가 너무 짧습니다.

확실히 2개의 모델을 사용해보니 차이가 확 느껴집니다.

전에는 몰랐지만, 확실히 어떤 생각의 과정을 거쳐서 정답을 도출해 냈는지 보는 게 더 좋은 것 같습니다.

추가될 기능 SearchGPT(서치 GPT)

지금은 텍스트만 입력할 수 있는데, 추후에는 파일 첨부 기능이 생긴다고 합니다.

또한 인터넷 검색 기능이 새로 추가된다고 합니다!

이건 기다리고 기다리던 SearchGPT(서치 GPT)곧 나온다고 하니 기대가 됩니다.

사전 등록된 사람만 우선 사용할 수 있고, 이후에 풀린다고 하니 사전등록을 안 하신 분들은 좀 걸릴 듯합니다.

현재는 마감되었습니다.

과연 구글 VS OpenAI 누가 검색시장의 승리자가 될지 궁금합니다.

 

 

댓글