인플렉션(inflection)은 인간적이고 감성적인 AI 개발을 목표로 하고 있는 스타트업입니다. 인플렉션 AI는 새로운 대규모 언어 모델(LLM)인플렉션-2.5 (Inflection-2.5)를 공개했습니다.
즉 새롭게 선보인 AI 시스템인 인플렉션-2.5를 기반으로 개인용 챗봇 파이(Pi)를 출시한 것입니다.
인플렉션 AI는 Inflection-1.0부터 현재 inflection-2.5 모델까지 자체 AI 모델을 지속적으로 업그레이드해오고 있습니다.
인플렉션-2.5 기반의 파이(Pi) 소개
인플렉션 AI는 작년 11월에 Inflection-2.0을 선보이면서 세계 최고의 LLM 모델 중에서 상위권에 자리매김을 해 온 것으로 잘 알려져 있는데요.
위에서 언급했듯이 인플렉션은 모든 사람들을 위한 개인용 AI를 개발하는 것이 의무라고 생각하며 AI 기술에 전념하고 있다고 합니다.
이번 공개된 인플렉션-2.5 AI 모델이 탑재된 파이(Pi)는 EQ에 IQ까지 추가된 개인용 인공지능 챗봇입니다.
파이(Pi) 챗봇은 이미 공개되어 많은 사람들과 소통을 하고 있는데요. 파이(Pi)의 평균 대화 시간은 33분 정도이고 일부는 매일 1시간 이상 지속한다고 인플렉션은 말하고 있습니다.
현재 월간 활성 사용자가 600만 명이며 파이(Pi)와 40억 개 이상의 메시지를 교환했다고 합니다. 어마 어마하죠?!
인플렉션-2.5 기반의 파이(Pi) 챗봇은 시사 토론, 지역 내 레스토랑 추천, 사업 계획 초안 작성, 코딩, 일반 대화, 생물학 시험공부까지 광범위하고 다양한 주제로 대화 가능합니다.
인플렉션-2.5 (Inflection-2.5) vs. GPT-4 테스트 결과
인플렉션-2.5 AI 모델과 GPT-4.0을 비교한 결과가 있는데요.
결론적으로 인플렉션-2.5 (Inflection-2.5)는 GPT-4.0과 비교했을 때 다양한 범위의 IQ 중심 작업에서 GPT-4.0 성능의 약 72% 정도를 수행했다고 합니다. 성능 측면에서는 인플렉션-2.5 모델이 GPT-4의 94% 정도의 성능을 보였다고 하는데요.
다만 AI 모델 훈련에 사용되는 계산량 측정을 40%만 사용하였다고 하는데요. 만약 100%로 할 경우 어떻게 바뀔지는 아직 알 수 있습니다.
즉 AI 테스트 결과에 의하면 인플렉션-2.5가 GPT-4.0에 비해 성능이나 IQ 측면에서 다소 떨어졌다고 나왔지만 100% 테스트를 하여 계산량을 측정한다면 모르는 일이라는 겁니다.
이외에도 전문가 수준의 어려운 난이도로 AI 테스트를 시행했는데요. 아래 도표 이미지를 보면 GPQA Diamond라고 나온 항목인데 이 부분에서 인플렉션-2.5와 GPT-4.0의 차이가 거의 안나는 것을 보실 수 있죠.
결론적으로 정리하면,
인플렉션-2.5 기반의 개인용 챗봇 파이(Pi)는 시사, 문화, 경제, 과학 등 다양하고 광범위한 주제로 대화를 할 수 있는 인공지능입니다.
또한 일반 대화는 물론이고 사업 계획서, 마케팅 문서 작성, 코딩 등 여러 측면에서 다방면으로 활용해 볼 수 있는 챗봇인데요.
인플렉션 AI는 Inflection-1.0부터 지금까지 지속적으로 개인용 AI 기술을 개발하고 업그레이드하고 있습니다. 이번에 새로운 AI 모델인 인플렉션-2.5는 GPT-4 모델을 거의 따라잡았다고 해도 과언이 아닙니다.
어쩌면 조만간 GPT-4 AI 모델의 성능 및 IQ를 뛰어 넘을 수도 있을 것 같습니다.