지금으로부터 2년 전인 22년 8월 22일에
Stable Diffusion이 처음 공개됐을 당시
그래픽 카드로 그림을 그린다는 건 참신하긴 했지만
위와 같이 퀄리티가 높지 않았기에
아이디어를 얻는 정도에서 그치고 있었는데
모델을 학습시키는 것이 전문 지식이 없는
많은 사람들이 할 수 있을 정도로
난이도가 높지 않았고
그림에 대한 지식이 조금도 없다고 해도
프롬프트 만으로 그럴싸한 이미지를 생성하는 건
그 당시에도 엄청난 대 혁명이었기 때문에
그림에 관심이 없던 사람들조차
그림을 만들게 하는 현상을 만들어 냈지만
이 당시에는 그냥 아이디어의 수준이었기 때문에
붐을 일으키는 정도는 아니었다고 볼 수 있었지만
그 후 반년이 채 지나지 않아 나온
실제 사진과 대적할 만한 ChilloutMix와
Novel AI 사에서 Stable Diffusion을 활용한
Image Generation가 그럴싸한 이미지를 제공하며
영업을 계속하다가 소스 코드를 모조리 해킹 당하면서
해킹 발 폭발적인 발전이 일어나기 시작했고
집에서도 잘 그린 그림을 찍어내기 시작하는
Anything V3와 Pastel-Mix가 출시되자
가능성의 수준을 넘은 가치에
돈과 사람들이 어마어마하게 유입되기 시작했는데
이전에는 그냥 웃기거나 아이디어 수준에서
실제 사진 혹은 그림을 그릴 줄 아는 사람들보다
뛰어난 부분을 보여주기 시작했고
가장 중요한 점은 이런 이미지 한 장을
몇 초만에 찍어내는 것은 동일했기에
23년 1-2월을 분기로 해서
모델과 사람들이 쏟아져 들어오기 시작했고
구현 못 하는 캐릭터는 Lora로 채우고
ControlNet 등으로 모델의 한계를 메꾸는 등
각종 확장과 방법이 계속 발전되면서
엄청난 발전이 계속 일어나고는 있었지만
눈이 흐리멍덩하거나
해상도가 낮으면 얼굴이 망가진다거나
아는 개념보다는 모르는 개념이 훨씬 많고
손가락은 항상 적거나 많은 등
그래도 아직은 멀었다 이런 의견이 많았었는데
Stable Diffusion 1.5가 출시된지 1년 뒤
SDXL이 본격적으로 출시되자
SD 1.5가 처음 나왔을 때와 같이
와 이거 가능성이 보이기는 한데
디테일이 완벽한 것도 아니고
VRAM도 많이 필요하고
아직은 갈 길이 멀었다
이런 의견이 주류였지만
SDXL이 강점을 보이는
포토리얼리스틱과 같은 분야에서는
비슷한 시기에 OpenAI의 달리3가 출시되자
단순한 북커버, 상업용 일러스트 등
어느 정도 선만 적당히 넘으면 되는 분야에서는
어중간한 실력의 창작자들이 AI와 경쟁 과정에서
도태당하기 시작하는 현상이 발생하기 시작했고
게티이미지, 셔터스톡 같은 상장사까지
1-2년만에 주가가 -75%가 넘게 빠질 정도로
궤멸적인 타격을 입었는데
이런 상황에서도 만화 쪽은
아직 멀었다는 생각이 만연했지만
세 달도 채 지나지 않아
SDXL 기반 유료 AI 그림 서비스인
NAI V3가 출시되면서
이전에 발견된 사소하지만 중요한
문제들을 많이 개선하고
여기에 중요한 점은 작가 태그를 사용해
어지간한 작가들은 프롬프트에 작가명을 넣으면
작가 스타일 그대로 그림을 그려주기 시작했고
이 시점부터 많은 창작자들이 아직은 멀었다에서
생존에 대한 근본적인 위협을 받기 시작했는데
그나마 NAI3 당시에는 유료 서비스고
사용자가 많지 않으니 희망이 있었지만
또 몇달 뒤 Animagine XL이 출시되면서
로컬 환경에서도 작가 태그를 사용해가며
그림을 그리기 시작할 수 있는 시대가 되었고
이전의 문제점을 개선하면서
이런 것도 이제 순식간에 찍어내네?
그러면 사람은 뭘 해야 하지?
이런 식으로 AI 그림에 대한
근본적인 인식이 바뀌기 시작했고
LoRA나 ControlNet, SD 1.5 시절부터
사용되던 각종 확장 프로그램 등이
단순히 프롬프트만 입력해도 구체적인 동작부터
성능까지 완전해지기 시작하면서
더 뛰어난 퀄리티의
이미지를 얻기 위해 만들어진 기법들이
순식간에 다시 사장되기 시작했다
발전은 여기에서 계속 끝나지 않고
이번에는 24년 초가 되자
Pony Diffusion V6이 출시되면서
로컬 환경에서도 어지간한 캐릭터, 작가는
모두 프롬프트로 지원하게 되면서
LoRA는 특정 캐릭터를 완전하게 구현하거나
혹은 아주 구체적인 스타일, 포즈가 아니라면
프롬프트 만으로 구현할 수 있게 되면서
모델과 프롬프트 말고는
많은 기능이 사장이 가속화됐고
이 시점부터 AI가 대부분의 사람들보다
범접할 수 없는 속도로 높은 퀄리티의
그림을 찍어내기 시작하자 많은 창작자들이
목에 칼이 들어온 느낌이었을 텐데
그렇게 Pony가 나온 뒤에도 발전은 끝나지 않고
10월이 되어가자 이번에는 아무도 기대하지 않았던
신토불이의 대 반전이 시작되었는데
한국에서 개발된 ILXL이 출시되면서
AI 이미지에서는 1.5 시절부터 나온
대표적인 문제들이 많이 해결되었고
AI 이미지가 완벽하지는 않지만
그렇다면 인간은 AI에 비해 얼마나 완벽한가
이런 표현이 나올 정도로
1.5 시절에는 상상도 못하는 걸
모델과 프롬프트 만으로 해결하고 있고
이제는 뭐 트집 잡기가 힘든 수준인데
겨우 2년만에 이런 변화가 일어난 걸 생각해보면
이후에도 변화는 더 빠르게 일어날 확률이 높고
만화 스타일의 이미지는
사람들이 훨씬 많이 참여하고 있는데다
요구치가 굉장히 높으면서
사진보다 만화는 단순하기에 학습하기 쉬운데
Danbooru 등에서 모든 작가의 모든 이미지가
모조리 무료로 학습할 수 있도록 노출되어 있고
개발사들은 그 중에서
고퀄리티만 뽑아서 학습시키면 되어
비용 부담이 매우 적은 수준이고
게티이미지나 셔터스톡같은 스톡 이미지 업체들도
소송이 질질 끌리거나 마땅한 대응을 못 하고
주가 폭락에 시달리다
결국 협력으로 선회하고 있는데
상장사도 못하는 걸 개인이 법적으로
내 걸 참고했다가 아니라 표절했다고
증명할 수도 없고 고소하기도 어렵다
그리고 AI은 작가뿐만 아니라
모델 개발자들에게도 엄청난 타격을 주는데
NAI는 개발해서 나올 때마다
얼마 지나지 않아 로컬 모델에 도태되고
1.5의 유명 체크포인트인
ChilloutMix, Anything 부터 시작해서
Animagine까지 현재는 주류에서
모조리 밀려나거나 잊혀진 상태고
최근에 나온 Pony까지 ILXL에 밀려 사라지고 있는데
개발자들이 개인에서 팀과 회사 단위로
점점 기술과 자본이 필요해지는 걸 보면
누가 최종 승자가 될 지는 결코 가늠하기 어렵고
일시적으로 점유했다고 해도 몇달 안에
밀려날 확률이 높다는 것을 기억해야 한다
Leave a Reply
이메일은 알림 용도로만 사용됩니다.