애플은 렐름이라는 신규 작은 언어 AI 모델을 공개했습니다. 렐름(ReALM)은 영어로 Reference Resolution as Language Modeling의 약자로 해상도를 참조하여 언어를 이해한다는 의미로 볼 수 있습니다.
렐름 AI 모델은 휴대폰에서 실행되면 시리(Siri) 등의 음성 비서에 의해 사용자의 모호한 상황을 참조하여 이해할 수 있도록 도와주는 인공지능이라고 할 수 있습니다.
애플 렐름(ReALM) AI이란?
애플의 렐름 AI는 사용자 요청을 분석하고 내용을 이해하여 문맥 상의 단서를 시리와 같은 음성 AI 시스템에 제공하기 위해 시각적인 부분을 텍스트 기반으로 생성해 내는 인공지능입니다.
렐름 AI는 어떻게 작동하나?
사용자는 시리와 같은 음성 비서와 계속 소통을 하는 것이며 뒷단에서는 렐름 AI가 열심히 대화 내용을 이해하고 스마트폰에 표시된 시각적인 화면 이미지 및 내용까지도 참조하여 사용자의 질문에 대한 답변 단서를 찾아 시각적으로 제공하는 AI 모델입니다.
예를 들어 스마트폰 상에서 인터넷 쇼핑을 하다가 마음에 드는 제품군 목록을 보는 중에 맨 위에 있는 아이템이 마음에 들 경우 음성 비서에게 '맨 위의 상품을 주문해 줘'라고 요청하면 렐름 AI가 문맥을 이해하고 화면 목록을 참조해 단서를 찾는다는 것입니다.
GPT-4.0 등과 같은 AI 모델은 화면에 나타난 정보를 이해하기 위해 이미지 분석을 하게 되지만 렐름(ReALM) AI는 화면 이미지를 분석한 후 테스트로 변환하여 음성 지원을 할 수 있도록 하는 것입니다.
렐름 AI 주요 특징
렐름 AI는 매개변수(파라미터) 별로 4가지 모델로 구분되는데요. 가장 작은 모델인 렐름-80M, 렐름-250M, 렐름-1B 그리고 렐름-3B입니다.
렐름 80M은 8천만 개 매개변수를 가진 모델이고 250M은 2억 5천만 개 매개변수 보유, 1B는 10억 개의 매개변수 보유 그리고 3B는 30억 개의 매개변수를 가진 AI 모델입니다.
렐름-80M 모델과 오픈 AI의 GPT-4.0을 비교하여 테스트한 결과 성능 측면에서 비슷한 성능을 보였다고 합니다. 렐름의 매개변수가 훨씬 적은데도 불구하고 말이죠.
이러한 이유로 렐름 80M은 스마트폰 등의 기기에 맞는 온디바이스 AI 방식으로 활용될 수 있을 것으로 보입니다.
결론적으로 정리하면,
렐름(ReALM) AI는 애플에서 개발한 새로운 sLM이자 sLLM입니다. 즉 소형 언어 모델이면서 대규모 소형 언어 모델이라고 할 수 있습니다. 렐름 AI는 매개변수별로 4가지 모델로 구성되어 있기 때문이죠.
우선 애플이 공개한 모델은 렐름 80M으로 8천만 개 매개변수를 가진 인공지능 모델인데 이는 챗GPT 4 모델보다 더 적은 파라미터를 가지고 있는데도 불구하고 성능면에서 유사한 테스트 결과를 보았다고 합니다.
렐름 AI의 핵심은 음성 비서 시리(Sir)와 같은 음성 기능과 어우러져서 사용자의 요구사항을 잘 분석하고 이해하도록 개발된 시각적인 AI 모델입니다.
화면상에 보이는 객체나 위치 등을 파악하여 테스트로 변환해 음성 비서에게 전달하여 사용자에게 최적의 답변을 할 수 있도록 합니다.
애플은 결국 사용자를 이해하고 사용자 입장에서 AI 기술을 개발하고자 하는 것으로 보입니다. 즉 AI 기술의 혁신에 집중하기보다는 서비스를 사용하는 사람에게 집중하고 있는 것으로 생각됩니다.