‘큐원-이미지-에디트(Qwen-Image-Edit)’ - AI 편집 모델 성능 비교

관련 기사
아침 출근길에 ‘Qwen-Image-Edit’의 기능이 나노 바나나에 필적한다는 조코딩 유튜브의 방송을 봤는데 기사로도 나와있길래 냉큼 들어가서 써봤다.
결론적으로 제미나이나 지피티 대비 뛰어난 일관성을 보여준다.
힉스필드나 Flux Kontext 같은 이미지/영상 모델들도 일관성 유지가 좋은 것으로 아는데
범용 모델 중 좋은 성능을 보여주는 부분은 인상적인 것 같다.
다만, 일관성 외에 프롬프트 이해력은 아쉽다.
같은 이미지와 프롬프트를 넣고 비교 테스트를 해보았다.
테스트 이미지
프롬프트
1. 사진 속 인물이 칠판 앞에서 강의하는 모습
2. 사진 속 인물이 책을 펴들고 칠판 앞에서 판서하는 모습
Qwen-Image-Edit 테스트 결과
이미지 일관성은 괜찮은데, 판서를 하고 있지는 않다.
역시 이미지 일관성은 괜찮은데 강의하는 모습은 아닌 것 같은 느낌…?
제미나이 2.5 Pro
외모부터 옷까지 일관성이 전혀 없다.. 다만 판서하는 모습을 표현한 것은 잘했다.
Chat GPT-5
인물 외모의 일관성은 아쉽다. 다만 프롬프트 이해력이 좋은지 원하는 모습인 강의하는 모습에는 더 가깝다.
결론적으로는 일관성 측면에서는 이미지만 봐도 바로 승패를 알 수 있다. ^^;;
로그인 없이 바로 써보고 싶다면 https://chat.qwen.ai/ 에서 2번까지는 가능하다.
로그인하면 더 써볼 수 있는 것 같다.
오픈소스로도 풀렸고 깃허브, 허깅페이스에도 있다고 한다.
Subscribe to my newsletter
Read articles from Wonkyung Lee directly inside your inbox. Subscribe to the newsletter, and don't miss out.
Written by
