“Impresionante”: la actualización de Midjourney sorprende a los artistas de IA con una función related a una cámara

on

|

views

and

comments


Midjourney 5.2 permite
Agrandar / Midjourney 5.2 permite “alejar” las imágenes sintetizadas. La imagen sintética unique se muestra aquí en el cuadro de puntos rojos.

a mitad de camino

El jueves, Midjourney presentó la versión 5.2 de su modelo de síntesis de imágenes impulsado por IA, que incluye una nueva función de “alejar” que permite mantener una imagen central sintetizada mientras construye automáticamente una escena más grande a su alrededor, simulando alejarse con una lente de cámara.

Comparable a superando—una técnica de imágenes de IA introducida por OpenAI DALL-E 2 en agosto de 2022: la función de alejamiento de Midjourney puede tomar una imagen existente generada por IA y expandir sus bordes mientras mantiene el sujeto unique centrado en la nueva imagen. Pero a diferencia de DALL-E y Photoshop Relleno generativo característica, no puede seleccionar una imagen personalizada para expandir. Por el momento, el zoom-out de v5.2 solo funciona en imágenes generadas dentro de Midjourney, un suscripción Servicio de generador de imágenes de IA.

En el servidor Midjourney Discord (todavía la interfaz oficial de Midjourney, aunque hay planes en marcha para cambiar eso), los usuarios pueden experimentar con el alejamiento generando cualquier imagen v5.2 (ahora la predeterminada) y escalando un resultado. Después de eso, aparecen botones especiales de “Zoom” debajo de la salida. Puede alejar por un issue de 1,5x, 2x o un valor personalizado entre 1 y 2. Otro botón, llamado “Hacer cuadrado”, generará materials alrededor de la imagen existente de una manera que crea una relación de aspecto cuadrada de 1:1 .

David Holz, el creador de Midjourney, anunció las nuevas funciones y mejoras v5.2 en el servidor de Discord el jueves por la noche. Además de “alejar”, las adiciones más significativas incluyen un sistema estético revisado, que promete una mejor calidad de imagen y un comando “–estilizar” más fuerte que influye de manera efectiva en el aspecto no realista de una imagen. También hay un nuevo “modo de alta variación”, activado de forma predeterminada, que aumenta la variedad de composición entre las generaciones de imágenes. Además, un nuevo comando “/ acortar” permite a los usuarios evaluar las indicaciones en un intento de recortar palabras no esenciales.

A pesar del lanzamiento inmediato de v5.2, Holz enfatizó en su anuncio que los cambios pueden ocurrir sin previo aviso. Las versiones anteriores del modelo Midjourney todavía están disponibles usando el comando “/settings” o el argumento de comando en línea “–v 5.1”.

Una comparación entre la salida de Midjourney v3 (izquierda), v4 (centro-izquierda), v5 (centro-derecha) y v5.2 (derecha) con el indicador
Agrandar / Una comparación entre la salida de Midjourney v3 (izquierda), v4 (centro-izquierda), v5 (centro-derecha) y v5.2 (derecha) con el mensaje “un bárbaro musculoso con armas al lado de un televisor CRT, cinematográfico, 8K , iluminación de estudio”.

a mitad de camino

Para los fanáticos de esta nueva forma de arte de síntesis de imágenes que a veces se denomina “sintografía” por defensores como julie wielandlos cambios en v5.2 son bienvenidos, y algunos usuarios de Midjourney los llaman “impresionante” y “alucinante“que no son superlativos inusuales en el mundo de la IA en este momento. Pero los fanáticos probablemente argumentarían que Midjourney’s mejoras visuales ¿Justificas a los asombrados? reacciones entre ellos.

La última actualización es parte de una serie de mejoras de calidad desde marzo de 2022, cuando el modelo generado imágenes relativamente mal definidas que carecían de detalles. Más recientemente, Midjourney introdujo v5.0 en marzo y v5.1 en mayo de este año, los cuales mejoraron el realismo y el detalle de la imagen. La introducción de la serie de modelos v5 permitió la creación de imágenes realistas de Papa Francisco y Donald Trump eso generó preocupaciones sobre deepfakes en las redes sociales.

A pesar del entusiasmo por las nuevas funciones entre los entusiastas de Midjourney, la síntesis de imágenes sigue siendo altamente controversial entre algunos artistas debido a cómo se entrenan estos sistemas de IA, utilizando millones de imágenes raspadas de la net sin consulta, crédito o permiso del artista. Midjourney nunca ha revelado oficialmente el contenido exacto de sus datos de entrenamiento. Adobe está intentando seguir un camino más ético con Luciérnagapero Enterprise Beat informó recientemente que el consentimiento activo del artista es aún marginal.

Por ahora, es difícil no apreciar los avances técnicos reveladores de Midjourney y al mismo tiempo preguntarse si existe un camino más ético para esta tecnología, uno que complazca a los artistas, tanto tradicionales como sintógrafos.



Share this
Tags

Debe leer

Las ganancias de verano de Ryanair casi se cuadruplican debido a los precios más altos y la demanda en auge

Reciba actualizaciones gratuitas de Ryanair Holdings PLCTe enviaremos un Resumen diario de myFT correo electrónico redondeando lo último Ryanair Holdings PLC noticias cada...

Drexel y Peirce firman acuerdo para apoyar a estudiantes adultos

Drexel College y Peirce Faculty establecieron un canal de transferencia entre las dos instituciones privadas para apoyar el desarrollo de la fuerza laboral...

Rutina de entrenamiento para principiantes para hombres

Las sesiones de entrenamiento para principiantes se pueden representar como cualquier...

Más como esto