IBM anuncia la disponibilidad del modelo de IA Mistral de código abierto en Watsonx y amplía la elección de modelos para ayudar a las empresas a escalar la IA con confianza y flexibilidad.

  • IBM ofrece una versión optimizada de Mixtral-8x7B que ha demostrado el potencial de reducir la latencia hasta en un 75%
  • Se une al creciente catálogo de IBM de plantillas de código abierto y de terceros para brindar a los clientes opciones y flexibilidad.
  • El último modelo de código abierto disponible en la plataforma de datos e inteligencia artificial de Watsonx con funciones de gobernanza, almacén de datos y estudio de inteligencia artificial listos para la empresa

ARMONK, Nueva York, 29 de febrero de 2024 /PRNewswire/ — IBM (NYSE: IBM) anunció hoy la disponibilidad del popular modelo de lenguaje grande (LLM) de código abierto Mixtral-8x7B, desarrollado por Mistral AI, en su plataforma de datos e inteligencia artificial Watsonx mientras continúa expandiendo sus capacidades para ayudar a los clientes a innovar con los modelos principales de IBM y los de una variedad de proveedores de código abierto.

IBM ofrece una versión optimizada de Mixtral-8x7B que, en pruebas internas, pudo aumentar el rendimiento (o la cantidad de datos que se pueden procesar en un período de tiempo determinado) en un 50% con respecto al modelo normal.1 Esto podría reducir potencialmente la latencia entre un 35% y un 75%, según el tamaño del lote, lo que aceleraría el tiempo para obtener información valiosa. Esto se logra mediante un proceso llamado cuantificación, que reduce el tamaño del modelo y los requisitos de memoria para los LLM y, a su vez, puede acelerar el procesamiento para ayudar a reducir los costos y el consumo de energía.

La incorporación de Mixtral-8x7B amplía la estrategia abierta y multimodelo de IBM para llegar a los clientes dondequiera que estén y brindarles opciones y flexibilidad para escalar las soluciones empresariales de IA en sus negocios. A través de décadas de investigación y desarrollo de IA, colaboración abierta con Meta y Hugging Face y asociaciones con líderes de modelos, IBM está ampliando su catálogo de modelos watsonx.ai e introduciendo nuevas características, lenguajes y modos.

Las opciones de modelos fundamentales listos para la empresa de IBM y su plataforma de datos e inteligencia artificial Watsonx pueden permitir a los clientes utilizar la inteligencia artificial generativa para obtener nuevos conocimientos y eficiencias y crear nuevos modelos de negocios basados ​​en principios de confianza. IBM permite a los clientes seleccionar el modelo correcto para los casos de uso correctos y los objetivos de precio-rendimiento para entornos comerciales específicos, como las finanzas.

Mixtral-8x7B se construyó utilizando una combinación de modelado disperso, una técnica innovadora que encuentra y utiliza solo las partes más esenciales de los datos para crear modelos más eficientes, y la técnica de Mezcla de Expertos, que combina diferentes modelos («expertos» ) que se especializan y resuelven diferentes partes de un problema. El modelo Mixtral-8x7B es ampliamente conocido por su capacidad para procesar y analizar rápidamente grandes cantidades de datos para proporcionar información relevante para el contexto.

«Los clientes exigen opciones y flexibilidad para implementar las plantillas que mejor se adapten a sus casos de uso específicos y requisitos comerciales», afirmó. Karim Yusuf, Ph.D, vicepresidente senior, gestión y crecimiento de productos, IBM Software. “Al ofrecer Mixtral-8x7B y otros modelos en Watsonx, no solo les brindamos opciones opcionales sobre cómo implementar la IA, sino que también estamos potenciando un ecosistema sólido de creadores de IA y líderes empresariales con herramientas y tecnologías para impulsar la innovación en diferentes industrias. y sectores.dominios.»

Esta semana, IBM también anunció la disponibilidad de ELYZA-japanese-Llama-2-7b, un modelo japonés de LLM hecho de código abierto por ELYZA Corporation, en watsonx. IBM también ofrece plantillas Meta Llama-2 de código abierto13B-chat y Llama-2-70B-chat y otras plantillas de terceros en watsonx, y habrá más en los próximos meses.

Las declaraciones relativas a la dirección e intención futuras de IBM están sujetas a cambios o retiradas sin previo aviso y representan metas y objetivos únicamente.

Contacto con los medios:

amy angelini
(correo electrónico protegido)

1 Basado en pruebas de IBM realizadas durante dos días utilizando cargas de trabajo internas capturadas en una instancia de Watsonx para uso de IBM.

FUENTE IBM