Alibaba, lanzo una IA de código abierto para competir contra Llama 2

alibaba AI

Alibaba busca competir con sus modelos de AI, con los ya existentes del mercado

Alibaba dio a conocer hace ya varios días, que ha liberado dos grandes modelos de lenguaje (LLM) de código abierto en un intento por enfrentarse a las metaplataformas.

Los modelos de inteligencia artificial, llamados Qwen-7B y Qwen-7B-Chat, el cual cada modelo tiene siete mil millones de parámetros, que a menudo se utilizan para medir su fuerza. Uno de ello de los modelos de AI de Alibaba, busca posicionarse como una variación conversacional al reciente lanzamiento de «Llama 2» de Meta.

La compañía dijo en un comunicado de prensa que el «código, los pesos de los modelos y la documentación de los dos modelos serán de libre acceso para académicos, investigadores e instituciones comerciales de todo el mundo«. Esta es la primera vez que una importante empresa de tecnología china hace que sus LLM sean de acceso abierto.

Añadió que el lanzamiento de estos modelos de código abierto tiene como objetivo que estos grandes modelos LLM puedan ser parte del esfuerzo por ayudar a democratizar la tecnología de IA y apoyar a las empresas emergentes de LLM. Además, también se menciono que se proporcionarán acceso gratuito al código, la documentación y los mecanismos internos de los modelos para académicos, investigadores e instituciones comerciales de todo el mundo.

Hay que recordar que los modelos de LLM AI pueden procesar cantidades masivas de datos y generar todo tipo de contenido desde texto, imágenes, audio y video, ademas de que la información sirven como columna vertebral de los chatbots de IA como ChatGPT.

Sobre sus modelos LLM, Alibaba mencionó que los dos se basan en Tongyi Qianwen LLM de Alibaba, que se anunció en abril. Tongyi Qianwen tiene múltiples versiones con diferentes números de parámetros, y Qwen-7B y Qwen-7B-Chat son dos versiones de tamaño pequeño que están diseñadas para ayudar a las pequeñas y medianas empresas a comenzar con la IA.

«Nuestro objetivo es promover tecnologías inclusivas y permitir que más desarrolladores y pequeñas y medianas empresas obtengan los beneficios de la IA generativa», dijo el director de tecnología de Alibaba Cloud Intelligence, Zhou Jingren.

Si bien las principales empresas de tecnología están “abriendo fuentes” de sus modelos de IA, la apertura es objeto de debate. Al igual que Alibaba, Meta admite que hay partes de LLaMA 2 a las que no se puede acceder. De manera similar, OpenAI limita lo que comparte de su GPT-4 AI. Un estudio reciente muestra que, de hecho, ChatGPT de OpenAI y LLaMA de Meta no son muy abiertos en absoluto.

Alibaba Cloud dijo que las empresas con menos de 100 millones de usuarios activos mensuales pueden implementar los modelos libremente; mientras que las empresas con más de 100 millones de usuarios activos mensuales deberán solicitar una licencia de Alibaba antes de utilizar ambos modelos. De manera similar, Meta’s Llama 2 requiere una licencia para usuarios de más de 700 millones de usuarios.

Alibaba dijo que Tongyi Qianwen tenía versiones con más parámetros que no se lanzaron de forma gratuita, pero no dijo cuántos parámetros contenía su modelo más grande. La versión más grande de Meta’s Llama 2 tiene 70 mil millones de parámetros.

“Hoy, Alibaba Cloud es el primero en lanzar una solución de capacitación e implementación para toda la serie de Llama 2 en China, publicó Alibaba en su canal WeChat. «Todos los desarrolladores pueden crear modelos grandes personalizados en Alibaba Cloud».

China intenta alcanzar a Estados Unidos en el campo de la IA, y Beijing anima a las empresas chinas a desarrollar rápidamente modelos de IA nacionales y “ controlables ”capaz de rivalizar con los desarrollados por empresas estadounidenses.

Además de Alibaba, muchos de los gigantes tecnológicos como por ejemplo Huawei, han estado desarrollando agresivamente sus propios modelos de IA en los últimos meses. Fuente

Como ya se menciono, para los interesados, los modelos basados en Tongyi Qianwen de Alibaba (Qwen-7B, y la versión Qwen-7B-Chat) para conversaciones, están disponibles para cualquier persona, con una licencia gratuita y para para empresas con más de 100 millones de usuarios mensuales, se debe solicitar una.

Finalmente si estás interesado en poder conocer más al respecto, puedes consultar los detalles en el siguiente enlace.


Deja tu comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*

*

  1. Responsable de los datos: AB Internet Networks 2008 SL
  2. Finalidad de los datos: Controlar el SPAM, gestión de comentarios.
  3. Legitimación: Tu consentimiento
  4. Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  5. Almacenamiento de los datos: Base de datos alojada en Occentus Networks (UE)
  6. Derechos: En cualquier momento puedes limitar, recuperar y borrar tu información.