DeepSeek lanza actualización con mejoras en razonamiento e interfaz

dplnews DeepSeek mc26325

La empresa china de Inteligencia Artificial (IA), DeepSeek, lanzó una importante actualización de su modelo grande de lenguaje (LLM) V3, conforme la compañía busca ampliar su popularidad en el competido mercado de Inteligencia Artificial Generativa. Parte de la actualización incluye mejoras en la interfaz y en la ejecución de código, con el objetivo de facilitar su adopción, según describe la compañía en el documento publicado.

La actualización, denominada DeepSeek-V3-0324, está disponible a través de la plataforma Hugging Face y presenta mejoras significativas en capacidades de razonamiento y codificación. La compañía detalla que esta nueva versión ofrece mejoras significativas en capacidades de razonamiento, desarrollo web, escritura en chino y búsqueda de texto. Entre las características destacadas se encuentran la capacidad de función de llamada, salida en formato JSON y completado de texto.

Otra de las características a destacar es el desarrollo web de front-end, donde recibió mejoras en la ejecutabilidad del código, así como páginas web y front-ends de juegos más agradables estéticamente. Este tipo de nuevas capacidades permitiría ampliar sus casos de uso, así como atraer la atención de un mayor número de desarrolladores.

También lee: Huawei Cloud trae DeepSeek a América Latina y anuncia Pangu en portugués

La compañía china anunció la nueva versión de su LLM como parte de sus esfuerzos por ampliar su adopción a nivel global, y así aprovechar la atención ganada después de la disrupción generada en su introducción al mercado a finales del año pasado. DeepSeek generó una fuerte disrupción en el mercado, al afirmar que sus costos de entrenamiento se acercaban a los 5.6 millones de dólares, un nivel significativamente inferior a sus contrapartes estadounidenses que han demandado cientos o miles de millones de dólares en infraestructura.

Mientras que la compañía ha logrado integrar su modelo en servicios de Nube como Azure de Microsoft y AWS de Amazon, también ha sido objetivo de restricciones contra su uso por algunos gobiernos que lo consideran una amenaza a la seguridad nacional, como Australia y Corea del Sur. El Congreso de Estados Unidos también evalúa una ley que prohibiría su uso en dispositivos del gobierno federal.

DeepSeek también ha generado ruido en el mercado, al demostrar que las restricciones impuestas por el gobierno de Estados Unidos contra China para el acceso a infraestructura avanzada como GPUs no estaría surtiendo el efecto esperado. De hecho, algunas compañías lo consideraron como una lección de la creatividad de China para superar las restricciones comerciales.

Adicionar aos favoritos o Link permanente.