관련 기사

아침 출근길에 ‘Qwen-Image-Edit’의 기능이 나노 바나나에 필적한다는 조코딩 유튜브의 방송을 봤는데 기사로도 나와있길래 냉큼 들어가서 써봤다.

결론적으로 제미나이나 지피티 대비 뛰어난 일관성을 보여준다.

힉스필드나 Flux Kontext 같은 이미지/영상 모델들도 일관성 유지가 좋은 것으로 아는데

범용 모델 중 좋은 성능을 보여주는 부분은 인상적인 것 같다.

다만, 일관성 외에 프롬프트 이해력은 아쉽다.

같은 이미지와 프롬프트를 넣고 비교 테스트를 해보았다.

테스트 이미지

프롬프트

1. 사진 속 인물이 칠판 앞에서 강의하는 모습
2. 사진 속 인물이 책을 펴들고 칠판 앞에서 판서하는 모습

Qwen-Image-Edit 테스트 결과

이미지 일관성은 괜찮은데, 판서를 하고 있지는 않다.

역시 이미지 일관성은 괜찮은데 강의하는 모습은 아닌 것 같은 느낌…?

제미나이 2.5 Pro

외모부터 옷까지 일관성이 전혀 없다.. 다만 판서하는 모습을 표현한 것은 잘했다.

인물 외모의 일관성은 아쉽다. 다만 프롬프트 이해력이 좋은지 원하는 모습인 강의하는 모습에는 더 가깝다.

결론적으로는 일관성 측면에서는 이미지만 봐도 바로 승패를 알 수 있다. ^^;;

로그인 없이 바로 써보고 싶다면 https://chat.qwen.ai/ 에서 2번까지는 가능하다.

로그인하면 더 써볼 수 있는 것 같다.

오픈소스로도 풀렸고 깃허브, 허깅페이스에도 있다고 한다.