DeepSeek lanza Janus-Pro 7B, un modelo de IA multimodal capaz de superar a DallE-3 gracias a su arquitectura y licencia de software libre
Notipress.- La startup china DeepSeek, la cual logró el reconocimiento en Estados Unidos y otros mercados, presentó Janus-Pro 7B, un modelo de inteligencia artificial multimodal diseñado para generar imágenes a partir de texto. Según TechCrunch, en recientes pruebas, este modelo superó en rendimiento a DallE-3, desarrollado por OpenAI. Disponible en la plataforma de desarrollo de IA Hugging Face, Janus-Pro 7B está cubierto por una licencia MIT de software libre, lo que permite su uso sin restricciones.
Un modelo innovador con licencia abierta
Según DeepSeek, Janus-Pro 7B es un “nuevo marco autorregresivo”, diseñado para interpretar y crear imágenes de manera eficiente. A diferencia de otros modelos unificados, su arquitectura desacopla la codificación visual para la interpretación y la generación de imágenes, utilizando el modelo SigLIP-L como codificador y un tokenizador basado en LlamaGen. Esta estructura permite que el modelo supere en rendimiento a generadores populares como DallE-3, PixArt-alpha, Emu3-Gen y Stable Diffusion XL.
El modelo puede utilizarse sin restricciones gracias a la licencia MIT, que permite a los desarrolladores modificar y distribuir el código, incluso con fines comerciales. Sin embargo, DeepSeek exige aceptar su propia licencia, incluyendo restricciones éticas, tales como la prohibición de uso militar y la generación de contenidos que promuevan desinformación.
Funcionamiento y limitaciones de Janus-Pro 7B
Dicho modelo presenta algunas limitaciones en comparación con otras herramientas de inteligencia artificial. Una de las más notables es su capacidad para generar imágenes únicamente en resoluciones de hasta 384 x 384 píxeles. A pesar de esta restricción, el rendimiento del modelo fue destacado en pruebas publicadas en Hugging Face, donde mostró resultados competitivos en comparación con otras soluciones disponibles en el mercado.
Su funcionamiento es similar al de otros generadores de imágenes: los usuarios describen una escena o concepto, y el modelo transforma esa descripción en una imagen digital. Esta tecnología se basa en el análisis de grandes volúmenes de datos visuales y textuales, permitiendo la creación de representaciones gráficas con alto nivel de detalle dentro de sus limitaciones de resolución.
La startup china continúa fortaleciendo su presencia en el sector de inteligencia artificial con el lanzamiento de Janus-Pro 7B. La compañía ya había generado interés con su chatbot de IA, el cual alcanzó popularidad en tiendas de aplicaciones de Estados Unidos. La introducción de un generador de imágenes con licencia abierta podría representar un desafío para OpenAI y otras empresas del sector, que hasta ahora lideraron el desarrollo de este tipo de modelos. El avance de DeepSeek en el ámbito de la IA generó preocupación en Silicon Valley, donde empresas y startups tecnológicas observan con atención la creciente competencia proveniente de China.
Espero que esta publicación sea de tu interés. Me gustaría seguir en contacto contigo. Por lo cual te dejo mis principales redes para dialogar y comentar los temas de interés para la sociedad y nosotros.