본문 바로가기
카테고리 없음

메타 AI 에뮤 비디오(Emu Video) 및 에뮤 에디트(Emu Edit) 어떤 기술인가?

by tech블로거 2023. 11. 17.

 

 

 

페이스북 모기업인 메타가 생성형 AI인 에뮤 비디오(Emu Video)와 에뮤 에디트(Emu Edit)를 공개했습니다. 에뮤 비디오(Emu Video)는 고품질 비디오를 제작해 낼 수 있는 AI 모델입니다.

 

에뮤 에디트(Emu Edit)는 정교한 이미지 편집이 가능하도록 이미지 조작을 할 수 이는 이미지 편집 AI 모델입니다. 메타의 새로운 이 2가지 AI 모델에 대해 알아보도록 하겠습니다.

 

 

에뮤 비디오 및 에뮤 에디트 어떤 AI인가?
사진 출처: 메타 AI

 

 

에뮤 비디오(Emu Video)란 어떤 AI인가?

 

에뮤 비디오는 Emu라는 AI 모델을 기반으로 고품질 비디오를 생성하는 AI 기술이라고 할 수 있습니다.

 

비디오 생성을 위해 통합 아키텍처를 사용하여 텍스트 입력, 이미지 입력 또는 텍스트와 이미지를 함께 입력하여 품질이 뛰어난 비디오를 만들어 낼 수 있습니다.

 

 

 

 

에뮤 비디오 AI 모델은 텍스트 기반으로만 프롬프트를 작성하여 고품질의 이미지만을 만들 수도 있고 텍스트와 이미지를 프롬프트에 입력하여 비디오를 생성해 낼 수 있습니다.

 

에뮤 비디오는 비디오 생성 과정을 분해하는 방식으로 접근하여 개발된 AI 모델인데요.

 

512x512 크기의 4초 길이 비디오를 1초당 16 프레임으로 만들기 위해 2개 모델로 분해하여 나누는 확산 모델이라는 것을 적용했다고 합니다. 즉 이는 비디오 품질을 높이기 위해 방법론인 것으로 보입니다.

 

 

 

 

에뮤 에디트(Emu Edit)란 어떤 AI인가?

 

에뮤티 에디트는 프롬프트에 텍스트를 입력하여 지시에 따라 이미지를 조작하고 편집할 수 있는 AI 기술이라고 보시면 됩니다.

 

이미지 편집 시 배경을 추가하거나 배경을 삭제, 색상을 바꾸거나 이미지에 있는 요소들도 변형할 수 있습니다.

 

 

 

 

기존의 많은 생성형 AI 모델과는 다르게 에뮤 에디트는 지시에 정확하게 따르도록 설계되었습니다. 이미지 편집에 있어서 정밀성을 높였는데요. 이미지와 관련 없는 부분에 있어서 의도하지 않은 것이 발생되는 것을 차단합니다.

 

에뮤 에디트 AI 모델 학습을 위해 1천만 개의 합성된 샘플을 포함하여 대규모 데이터셋이 생성되었다고 합니다.

 

각 샘플에는 입력 이미지, 수행할 작업에 대한 설명 및 결과물 이미지가 포함되어 있다고 합니다.

 

 

 

 

에뮤 비디오(Emu Video) 및 에뮤 에디트(Emu Edit)를 어디에 적용할까?

 

에뮤 비디오와 에뮤 에디트는 인스타그램, 페이스북 등의 소셜 미디어 플랫폼에 적용되어 사용자들이 고품질 비디오 및 이미지를 만들어 낼 때 도움이 될 수 있습니다.

 

 

 

 

또한 페이스북 메신저 등의 커뮤니케이션 도구에 에뮤 비디오나 에뮤 이미지 AI 모델을 적용하여 사용자 간의 대화를 풍부하게 만들 수 있죠.

 

이외에도 창의성을 요구하는 직업인 디자이너, 창작자 등을 위한 효과적이고 편리한 영상 제작 및 이미지 편집 도구로 사용할 수 있을 듯합니다.

 

 

 

 

결론적으로 정리하면,

 

메타 AI는 고품질의 비디오를 만들어 낼 수 있는 에뮤 비디오(Emu Video) AI 모델과 텍스트 입력만으로 정교한 이미지 편집 및 수정을 할 수 있는 에뮤 에디트(Emu Edit) AI 모델을 소개했습니다.

 

에뮤 비디오 및 에뮤 에디트가 지속적으로 진화된다면 향후 이 AI 도구를 통해 영화나 애니메이션 등을 제작할 수도 있을 것 같네요.

 

 

 

 

 

Meta Llama 2는 어떤 AI인가? 챗GPT와 다른 점은?

Llama 2(라마 2)는 페이스북 모기업인 Meta(메타)에서 개발한 대규모 언어 모델인 LLM입니다. Meta Llama 2는 3가지 종류의 모델로 구분됩니다. 대규모 언어 모델인 LLM은 매개변수 즉 파라미터 개수가 많

8terabyte.com

 

메타 AI 챗봇 어떤 서비스인가?

메타는 자체 멀티 모달 LLM인 라마 2와 마이크로소프트 검색엔진을 기반으로 AI 챗봇 서비스를 공개했습니다. 메타 AI 챗봇은 MZ 세대 등 젊은 층을 타깃으로 개인 비서 및 도우미 역할을 하는 인공

8terabyte.com

 

진화하는 멀티 모달 AI 이해하기

멀티 모달 AI가 무엇일까요? 멀티 모달 AI가 진화하고 있습니다. 즉 이 말은 AI가 인간의 두뇌와 비슷해지고 있다는 것입니다. 멀티 모달 AI, 멀티 모달 기능 탑재된 AI, 멀티 모달 LLM 등 이 모든 말

8terabyte.com

 

AI와 이미지로 대화하세요. LLM 보다 더 진화한 LMM 무엇인가?

LMM이란 대형멀티모달모델을 말합니다. 즉 Large Multimodal Models의 약자를 말하는데요. LMM는 이미지, 사진 등으로 AI에게 명령을 하면 AI가 이미지나 사진을 이해하고 분석하여 답변을 할 수 있는 것

8terabyte.com

 

 

어도비 새로운 AI 도구 어떤 것인가?

포토샵 등 그래픽 프로그램으로 잘 알려진 어도비가 비전문가도 사진을 쉽게 편집할 수 있는 새로운 AI 도구를 출시한다고 합니다. 어도비의 새로운 AI 도구가 포토샵 그래픽 프로그램 안에 AI 도

8terabyte.com