Generar imágenes con la iA de QWEN

alt43alt43
4 min read

La explosión y posterior propagación de todo lo relacionado con la Inteligencia Artificial (iA) está alcanzado cuotas difícilmente imaginables hace tan sólo un par de años. Hasta el punto de que considero absurdo tratar cualquier tema relacionado con ella de forma genérica. Y llegado el caso, como con éste sencillo artículo, mi idea pasa por centrarme ya no sólo en un modelo en particular, sino en un aspecto concreto del mismo. Por todo ello, hoy me gustaría comentar el modelo que ofrece QWEN en lo relativo a la creación de imágenes.

Chatbot de Qwen

De forma muy resumida, Qwen es el modelo de iA generativa desarrollado por la empresa Alibaba a partir del Llama de Meta Ai.

  • Qwen 1.0 (2023): basado en Llama de Meta AI.

  • Qwen 2.0 (2024): implementó la arquitectura MoE, mejorando eficiencia y precisión.

  • Qwen 2.5-Max (2025): última versión, con mejoras en razonamiento y capacidades multimodales.

  • Puede generar y procesar tanto texto como imágenes y audio.

  • Es de código abierto.

Aquí tenéis los términos de uso (ToS) y su política de privacidad para solventar cualquier duda antes de entrar en materia.

Generando imágenes

A fecha se hoy, no he encontrado una App específica de Qwen. Por tanto todo el proceso se ha llevado a cabo desde el navegador (Quetta en Android).

Lo primero tras entrar en la página y habernos registrado, es acceder a la línea de Chat general y solicitar que nos cree un mensaje (prompt) para generar la imagen que queramos:

Del texto introducido inicialmente:

Genera un prompt para crear una imagen consistente en una tecla blanca y redonda con el comando Alt y abajo a la derecha el número 43′

Vemos que nos devuelve uno mucho más detallado y específico para la generación de la imagen:

Prompt para generar la imagen:

«Crea una imagen minimalista y limpia de una tecla de teclado redonda y blanca, con un diseño moderno y elegante. En el centro de la tecla, escribe la palabra ‘Alt’ en letra negra, utilizando una tipografía sans-serif simple y legible. En la parte inferior derecha de la tecla, incluye el número ’43’ en pequeño, también en color negro, alineado de forma discreta pero visible. La tecla debe tener un ligero relieve o sombreado sutil para darle profundidad, simulando una apariencia realista pero simplificada. El fondo debe ser neutro y limpio, preferiblemente de color gris claro o blanco suave, para que la tecla destaque visualmente.» Este prompt debería ayudarte a obtener una representación visual clara y profesional de la tecla descrita.

Copiamos el nuevo prompt y pulsamos sobre la opción «generación de imágenes»

Allí, lo pegamos y procedemos a generar la imagen:

Aquí ya observamos algunos puntos interesantes:

  1. Pulgar arriba o abajo para indicarle si estamos satisfechos con el resultado

  2. Botón para volver a generar otra

  3. Botón para descargar

  4. Flechas para desplazarnos entre todas las imágenes que se vayan generando

  5. Menú desplegable para elegir el formato de la imagen

Como puede observarse en la captura, hay 16 imágenes generadas, en éste caso llegué a hasta las 22 sin ninguna advertencia de que hubiera un límite máximo (que seguro que lo hay). Una gran ventaja respecto a propuestas como Mistral (Le Chat) donde la opción gratuita está restringida a la generación de 3 imágenes.

Un aspecto a mejorar es en todo lo relativo a las imágenes que podemos subir. De momento, sólo parece destinado a obtener y proporcionar información. No hay manera de interactuar sobre ella; de forma que siempre que se le solicita algún tipo de retoque o modificación acaba por remitirnos a programas específicos para ello como pueden ser Photoshop o Gimp.

Conclusiones

Pese a todas las polémicas, dudas e incertidumbres que siguen suscitando los modelos de iA; creo firmemente que también pueden aportar mucho valor añadido en una gran cantidad de aspectos. Considero fantástico el que puedas crearte una imagen de forma sencilla, gratuita y sin problemas de copyright; ya sea a un avatar, icono o banner para tus redes sociales; para maquetar un artículo en tu Blog, crear un meme ad hoc o lo que consideres oportuno.

La libertad que nos puede proporcionar a los pequeños creadores de contenido, es algo no visto hasta la fecha. Y al menos de momento, la posibilidad de utilizarse mediante navegador web, nos permite minimizar -en parte- su impacto en lo relativo a la privacidad.

0
Subscribe to my newsletter

Read articles from alt43 directly inside your inbox. Subscribe to the newsletter, and don't miss out.

Written by

alt43
alt43

Android ¬ Hard&Soft ¬ Redes ¬ Domótica y Opinión