본문 바로가기

전체 글171

이미지 생성 AI 스테이블 디퓨전 2 vs. 스테이블 디퓨전 3 비교 스테이블 디퓨전은 텍스트를 입력하여 이미지를 만들어내는 딥러닝 모델입니다. 즉 텍스트 프롬프트를 기반으로 개발된 이미지 생성 AI입니다. 스테이블 디퓨전은 2022년에 출시되었고 텍스트 설명에 따라 사실적인 이미지를 생성하는 능력으로 인해 큰 인기를 얻고 있죠. 현재 스테이블 디퓨전 3의 프리뷰 버전을 공개하여 테스트 과정을 거치기 위해 테스터를 모집하고 있는데요. 우선 스테이블 디퓨전 AI의 주요 특징을 먼저 알아보고 스테이블 디퓨전 2와 스테이블 디퓨전 3 프리뷰 버전의 주요 차이를 알아보도록 하겠습니다. 스테이블 디퓨전 주요 특징 스테이블 디퓨전은 텍스트 프롬프트를 사용하여 원하는 이미지를 생성할 수 있습니다. 스테이블 디퓨전을 통해 생성된 이미지는 실제 사진과 구별하기 어려울 정도로 정교하게 잘 .. 2024. 2. 24.
소라 AI vs 빙 AI 동일한 텍스트 프롬프트 입력으로 결과 비교했더니? 오픈 AI가 개발한 동영상 만들어주는 소라(Sora) AI 공개 이후 뜨거운 관심이 집중되고 있어 보입니다. 소라 AI로 만들어진 애니메이션 등 동영상 결과물이 진짜 사람이 만든 결과물처럼 보인다는 것이죠. 소라(Sora) AI는 텍스트-비디오 모델(Text-to-Video)인데요. 즉 텍스트 프롬프트를 입력하면 최대 1분 길이의 동영상을 생성할 수 있습니다. 물론 텍스트 프롬프트에 메시지가 얼마나 자세하게 작성되었냐에 따라 결과물의 정교함이 달라지겠죠. 소라(Sora) AI와 빙(Bing) AI에 동일한 텍스트 프롬프트를 입력하여 결과물을 한 번 비교해 보았습니다. 엄밀히 말하면 빙(Bing) AI 즉 빙 이미지 크리에이터를 통해 소라 AI가 예제 비디오를 만들어낸 동일한 텍스트 프롬프트를 그대로 입력.. 2024. 2. 23.
일론 머스크 뉴럴링크 주요 핵심 기술 및 전망 일론 머스크는 2016년에 뉴럴링크를 설립했는데요. 뉴럴링크는 뇌와 컴퓨터 인터페이스(Brain Computer Interface, BCI)라는 혁신적인 기술을 개발하고 운영하는 기업입니다. 즉 뇌와 컴퓨터를 연결하는 칩을 개발한 것이죠. 뉴럴링크가 환자에게 이 칩을 뇌에 이식하여 성공했는데요. 해당 환자가 부작용 없이 생각만으로 마치 마우스를 움직이는 것처럼 컴퓨터 화면을 컨트롤했다고 합니다. 뉴럴링크는 뇌와 컴퓨터를 연결하는 BCI 칩으로 작년 5월에 미국 FDA(식품의약국)로부터 승인을 받은 후 작년 9월에 사진 마비 환자를 모집하여 수술을 성공한 것입니다. 일론 머스크의 뉴럴링크 기업이 주로 하는 사업 활동과 앞으로의 전망에 대해 더욱 궁금해졌는데요. 뉴럴링크의 주요 핵심 기술, 사업 및 전망에 .. 2024. 2. 22.
애플 동영상 만들어주는 AI 도구 키프레이머(Keyframer) 주요 기술 및 특징 키프레이머(Keyframer)는 애플이 개발한 동영상을 만들어주는 AI 도구입니다. 엄밀히 말하면 대형 언어 모델(LLM)을 활용하여 단순한 텍스트 프롬프트만으로 이미지를 애니메이션으로 만들어주는 인공지능입니다. 키프레이머(Keyframer)의 핵심 기술 애플의 키프레이머의 핵심 기술 중 하나는 대규모의 텍스트 데이터를 기반으로 훈련된 LLM입니다. 대규모 언어 모델(LLM)은 텍스트의 의미를 깊이 있게 이해하기 때문에 창의적인 결과로 다양한 애니메이션 시나리오를 만들어 낼 수 있습니다. 키프레이머의 두 번째 기술은 딥 러닝 기술입니다. 이는 텍스트와 이미지를 연결하여 텍스트 프롬프트에 맞는 시각적 요소들을 자동으로 만들어 냅니다. 세 번째 핵심 기술은 컴퓨터 비전 기술인데요. 이는 생성된 이미지의 사실.. 2024. 2. 19.
캔바(Canva) 동영상 생성 AI 도구 어떤 AI인가? 캔바(Canva)의 AI 동영상 제작 도구는 텍스트를 입력하면 AI가 자동으로 동영상을 만들어 줍니다. 캔바 동영상 생성 AI는 오픈 AI 소라(Sora)와는 다르게 일반 사용자가 모두 쉽게 무료로 사용할 수 있어요. 캔바(Canva)는 원래 누구나 쉽게 디자인을 할 수 있도록 도와주는 온라인 디자인 플랫폼입니다. 캔바(Canva)는 프레젠테이션, 포스터, 인포그래픽, 카드뉴스, SNS 게시물 등 다양한 용도로 사용할 수 있는 수많은 템플릿을 무료 및 유료 서비스로 제공하고 있는데요. 캔바(Canva) 동영상 생성 AI 3가지 종류별 특징 캔바의 동영상 생성 AI는 캔바에서 제공하는 템플릿 또는 내가 보유한 이미지 등을 활용한 AI 동영상 제작 도구, 실제로 존재하지 않는 이미지나 영상을 생성하여 창의적.. 2024. 2. 19.
오픈AI 동영상 만들어주는 소라(Sora) 어떤 AI일까? 오픈 AI가 개발한 소라(Sora)는 텍스트 프롬프트를 기반으로 사실적이고 상상력이 풍부한 동영상을 만들어주는 AI 모델입니다. 동영상 생성 AI 소라(Sora)는 딥러닝 기술을 사용하여 텍스트 설명을 실제 영상으로 변환하는 획기적인 기술을 선보였는데요. AI 소라(Sora)가 동영상을 어떻게 만들어내는지 작동 방식, 장점 및 단점 등에 대해 알아보도록 하겠습니다. AI 소라(Sora)가 동영상을 생성해 내는 작동 방식 1. 텍스트 프롬프트 처리 사용자가 AI 소라(Sora)에게 원하는 영상을 설명하는 텍스트를 프롬프트창에 입력합니다. 예를 들어 "파란 하늘과 푸른 숲 속에서 햇살 아래 걷는 사람과 귀여운 강아지"와 같은 텍스트 문장을 프롬프트란에 입력했다고 가정해 봅시다. 2. 텍스트를 벡터로 변환 A.. 2024. 2. 17.
갤럭시 S23 시리즈 AI 폰으로 업데이트, 갤럭시 S24 AI 기능과 같을까? 갤럭시 S24 시리즈는 올해 1월 말에 출시한 신규 모델로 온디바이스 AI 방식으로 일명 갤럭시 AI 폰으로 출시되었는데요. 기존 모델인 갤럭시 S23 시리즈에도 AI 기능을 탑재하여 갤럭시 AI폰으로 업그레이될 것으로 보입니다. 갤럭시 S23 시리즈뿐만 아니라 갤럭시 Z폴드 5, 갤럭시 Z플립 5에도 AI 기능을 적용할 것으로 보이는데요. 갤럭시 S23 시리즈, 갤럭시 Z폴드 및 Z플립 5 모델도 이젠 갤럭시 AI폰이라고 할 수 있겠습니다. 갤럭시 AI용 갤럭시 S23 시리즈에 원 UI 6.1이 업데이트되어 AI 관련 새로운 기능과 서비스가 추가될 것으로 보입니다. 원 UI 6.1 업데이트된 갤럭시 S23 시리즈에서 어떤 AI 기능을 경험할 수 있을지 궁금한데요. 결론적으로 갤럭시 S23 시리즈, 갤럭.. 2024. 2. 15.
LLM vs. sLLM vs. sLM 차이점 및 장단점 AI 모델은 대규모 언어 모델 LLM, 소형 대규모 언어 모델 sLLM, 소형 언어 모델 sLM으로 크게 구분됩니다. LLM(대규모 언어 모델)은 수천억 개 이상의 매개변수(파라미터)를 가지고 있는 대규모 인공지능 모델입니다. sLLM(소형 대규모 언어 모델)은 수백억 개 이상의 매개변수(파라미터)를 가지고 있는 인공지능 모델입니다. sLM(소형 언어 모델)은 수백만 개 또는 수십억 개 이상의 매개변수(파라미터)를 가지고 있는 소형 인공지능 모델입니다. 결론적으로 LLM, sLLM, sLM의 가장 큰 차이는 매개변수 개수로 인한 성능, 학습 데이터양, 속도 등입니다. LLM, sLLM, sLM 차이점 LLM, sLLM, sLM 이 3가지 모두 자연어 처리(NLP) 작업에 사용되는 인공지능 모델이며 크기,.. 2024. 2. 14.
구글 AI 에이전트 공식 명칭 제미나이(Gemini) 어떤 변화가 있나? 구글 AI 제미나이(Gemini)는 안드로이드용 스마트폰에 기본으로 탑재된 음성 비서인 구글 어시스턴트를 대체하는 구글 차세대 인공지능이 될 것이라고 합니다. 이외에도 구글의 챗봇 AI인 바드(Bard)의 명칭도 제미나이(Gemini)로 변경되며 제미나이는 이제 구글의 공식 AI 에이전트가 됩니다. 안드로이드용 스마트폰뿐만 아니라 아이폰에도 구글 앱에 제미나이 AI 기능이 적용됩니다. 아이폰 내에서 제미나이를 허용하면 해당 서비스를 통해 구글의 AI 에이전트를 경험할 수 있어요. 제미나이(Gemini)에 텍스트, 음성으로 명령을 내릴 수 있고 현재 보고 있는 화면을 자동 캡처하거나 촬영한 사진을 가져와서 제미나이 AI 에이전트와 대화하여 해당 사진 및 이미지를 분석하여 이해할 수 있도록 가능합니다. 구글.. 2024. 2. 10.