스테이블 디퓨전은 텍스트를 입력하여 이미지를 만들어내는 딥러닝 모델입니다. 즉 텍스트 프롬프트를 기반으로 개발된 이미지 생성 AI입니다.
스테이블 디퓨전은 2022년에 출시되었고 텍스트 설명에 따라 사실적인 이미지를 생성하는 능력으로 인해 큰 인기를 얻고 있죠.
현재 스테이블 디퓨전 3의 프리뷰 버전을 공개하여 테스트 과정을 거치기 위해 테스터를 모집하고 있는데요.
우선 스테이블 디퓨전 AI의 주요 특징을 먼저 알아보고 스테이블 디퓨전 2와 스테이블 디퓨전 3 프리뷰 버전의 주요 차이를 알아보도록 하겠습니다.
스테이블 디퓨전 주요 특징
스테이블 디퓨전은 텍스트 프롬프트를 사용하여 원하는 이미지를 생성할 수 있습니다. 스테이블 디퓨전을 통해 생성된 이미지는 실제 사진과 구별하기 어려울 정도로 정교하게 잘 만들어지는 것으로 알려져 있죠.
스테이블 디퓨전을 통해 만들어진 이미지는 높은 해상도로 생성되어 고퀄리티의 결과물을 얻을 수 있어요. 또한 코드를 직접 작성하지 않고도 웹 사이트를 통해 쉽게 사용할 수 있습니다.
예를 들어 '푸른 바다 위를 항해하는 배'라는 텍스트를 입력하면 스테이블 디퓨전 AI는 해당 텍스트 프롬프트를 잠재 벡터라는 것으로 변환합니다.
잠재 벡터란 이미지를 나타내는 수치적인 표현입니다. 이 잠재 벡터를 사용해 이미지를 생성해 내는 것입니다. 이미지는 픽셀 단위로 만들어지며 이렇게 입력한 텍스트 메시지에 담긴 내용대로 이미지가 묘사되는 것이죠.
스테이블 디퓨전 2 vs. 스테이블 디퓨전 3 비교
1. 모델 크기 및 성능
스테이블 디퓨전 2 모델은 1.4억 개 매개변수를 가지고 있습니다. 기본적인 이미지 생성이 가능합니다.
스테이블 디퓨전 2 모델은 고퀄리티의 이미지 생성을 만들어 내기 때문에 최소 RTX 3060 그래픽 카드가 필요합니다.
반면에 스테이블 디퓨전 3 프리뷰 모델은 8억 개에서 80억 개 매개변수까지 다양한 크기의 모델을 선택할 수 있도록 개발 중입니다.
스테이블 디퓨전 3은 이전 모델에 비해 훨씬 더 사실적이고 정교한 이미지 생성이 가능한 것으로 알려져 있습니다. 또한 다양한 장치에서 실행이 가능하다고 합니다.
스테이블 디퓨전 3은 최소 GTX 1080 Ti 고사양 그래픽 카드를 필요로 합니다.
2. 아키텍처
스테이블 디퓨전 2 모델은 U-Net 백본 기반이며 이미지 해상도가 높아질수록 리소스 사용량이 기하급수적으로 증가합니다.
반면에 스테이블 디퓨전 3 모델은 확산 트랜스포머 기반이며 이미지 해상도에 따른 리소스 사용량이 이전 모델만큼 증가하지 않습니다. 또한 텍스트 렌더링 기능도 향상되었다고 합니다.
즉 확산 트랜스포머 아키텍처는 컴퓨팅 기술을 효율적으로 사용하여 기본 방식보다 퀄리티가 높은 이미지를 만들어 낼 수 있습니다.
3. 기능
스테이블 디퓨전 2는 기본적인 이미지 생성 기능만 제공합니다.
반면에 스테이블 디퓨전 3 모델은 이미지 생성뿐 아니라 텍스트 렌더링 기능이 추가되었고 이미지 편집 기능을 제공합니다. 또한 심층적으로 스타일 변환이 가능합니다.
4. 사용 편의성 및 접근성
스테이블 디퓨전 2 모델의 사용 방법은 다소 복잡한 편입니다. 사용 시 명령어를 입력해야 하는 방식이거든요.
또한 스테이블 디퓨전 2는 코드를 직접 다운로드하여 실행해야 하여 전문 지식이 다소 필요합니다.
반면에 스테이블 디퓨전 3 모델은 웹 인터페이스 제공으로 사용자에게 편의성을 제공한다고 합니다. 스테이블 디퓨전 3 모델을 이용할 때 쉽게 접근할 수 있도록 공식 웹사이트 및 기타 다양한 플랙폼에서 실행 가능하도록 한다고 합니다.
결론적으로 정리하면,
스테이블 디퓨전 3은 스테이블 디퓨전 2에 비해 모델 크기, 성능, 사용 편의성, 접근성 등 모든 면에서 향상되었다고 할 수 있습니다.
하지만 현재 스테이블 디퓨전 3은 프리뷰 모델이기 때문에 아직은 안정적이지 않아 해당 성능 및 기능 향상 등에 대한 검증은 공식 출시 후에 확인할 수 있습니다.
만약 기본적인 이미지 생성에만 집중할 것이라면 스테이블 디퓨전 2 모델로 충분할 것으로 생각합니다.
하지만 더욱 사실적이고 정교한 이미지 또는 텍스트 렌더링, 이미지 편집 등의 추가 기능이 필요한 결과물을 얻고 싶다면 향후 스테이블 디퓨전 3 모델을 사용하는 것이 좋을 것 같네요.
스테이블 디퓨전 2 모델은 2022년에 정식 출시되어 현재 사용 가능합니다. 스테이블 디퓨전 3 모델은 현재 프리뷰 단계로 테스트 과정을 거친 후 공식적으로 조마간 출시할 것으로 예상합니다.