IBM anuncia la disponibilidad del modelo de IA Mistral de código abierto en Watsonx y amplía la elección de modelos para ayudar a las empresas a escalar la IA con confianza y flexibilidad |

  • IBM ofrece una versión optimizada de Mixtral-8x7B que ha demostrado el potencial de reducir la latencia hasta en un 75%
  • Se une al creciente catálogo de IBM de plantillas de código abierto y de terceros para brindar a los clientes opciones y flexibilidad.
  • El último modelo de código abierto disponible en la plataforma de datos e inteligencia artificial de Watsonx con funciones de gobernanza, almacén de datos y estudio de inteligencia artificial listos para la empresa

ARMONK, Nueva York, 29 de febrero de 2024 /PRNewswire/ — IBM (NYSE: IBM) anunció hoy la disponibilidad del popular modelo de lenguaje grande (LLM) de código abierto Mixtral-8x7B, desarrollado por Mistral AI, en su plataforma de datos e inteligencia artificial Watsonx a medida que continúa expandiendo sus capacidades para ayudar. los clientes innovan con los modelos fundamentales de IBM y los de una variedad de proveedores de código abierto.

IBM ofrece una versión optimizada de Mixtral-8x7B que, en pruebas internas, pudo aumentar el rendimiento (o la cantidad de datos que se pueden procesar en un período de tiempo determinado) en un 50% con respecto al modelo normal.1 Esto podría reducir potencialmente la latencia entre un 35% y un 75%, según el tamaño del lote, lo que aceleraría el tiempo para obtener información valiosa. Esto se logra mediante un proceso llamado cuantificación, que reduce el tamaño del modelo y los requisitos de memoria para los LLM y, a su vez, puede acelerar el procesamiento para ayudar a reducir los costos y el consumo de energía.

La incorporación de Mixtral-8x7B amplía la estrategia abierta y multimodelo de IBM para llegar a los clientes dondequiera que estén y brindarles opciones y flexibilidad para escalar las soluciones empresariales de IA en sus negocios. A través de décadas de investigación y desarrollo de IA, colaboración abierta con Meta y Hugging Face y asociaciones con líderes de modelos, IBM está ampliando su catálogo de modelos watsonx.ai e introduciendo nuevas características, lenguajes y modos.

Las opciones de modelos fundamentales listos para la empresa de IBM y su plataforma de datos e inteligencia artificial Watsonx pueden permitir a los clientes utilizar la inteligencia artificial generativa para obtener nuevos conocimientos y eficiencias y crear nuevos modelos de negocios basados ​​en principios de confianza. IBM permite a los clientes seleccionar el modelo correcto para los casos de uso correctos y los objetivos de precio-rendimiento para entornos comerciales específicos, como las finanzas.

Mixtral-8x7B se construyó utilizando una combinación de modelado disperso, una técnica innovadora que encuentra y utiliza solo las partes más esenciales de los datos para crear modelos más eficientes, y la técnica de Mezcla de Expertos, que combina diferentes modelos («expertos» ) que se especializan y resuelven diferentes partes de un problema. El modelo Mixtral-8x7B es ampliamente conocido por su capacidad para procesar y analizar rápidamente grandes cantidades de datos para proporcionar información relevante para el contexto.

«Los clientes exigen opciones y flexibilidad para implementar las plantillas que mejor se adapten a sus casos de uso específicos y requisitos comerciales», afirmó. Karim Yusuf, Ph.D, vicepresidente senior, gestión y crecimiento de productos, IBM Software. “Al ofrecer Mixtral-8x7B y otros modelos en Watsonx, no solo les brindamos opciones opcionales sobre cómo implementar la IA, sino que también estamos potenciando un ecosistema sólido de creadores de IA y líderes empresariales con herramientas y tecnologías para impulsar la innovación en diferentes industrias. y sectores.dominios.»

Esta semana, IBM también anunció la disponibilidad de ELYZA-japanese-Llama-2-7b, un modelo japonés de LLM hecho de código abierto por ELYZA Corporation, en watsonx. IBM también ofrece plantillas Meta Llama-2 de código abierto13B-chat y Llama-2-70B-chat y otras plantillas de terceros en watsonx, y habrá más en los próximos meses.

Las declaraciones relativas a la dirección e intención futuras de IBM están sujetas a cambios o retiradas sin previo aviso y representan metas y objetivos únicamente.

Contacto con los medios:

amy angelini

alangeli@us.ibm.com

1 Basado en pruebas de IBM realizadas durante dos días utilizando cargas de trabajo internas capturadas en una instancia de Watsonx para uso de IBM.

Cisión Vea el contenido original para descargar multimedia: https://www.prnewswire.com/news-releases/ibm-announces-availability-of-open-source-mistral-ai-model-on-watsonx-expands-model-choice -to -ayudar-a-las-empresas-a-escalar-la-ia-con-confianza-y-flexibilidad-302075654.html

FUENTE IBM

(tagToTranslate)nyse:ibm