Hace poco la comunidad LAION (Red Abierta de Inteligencia Artificial a Gran Escala) dio a conocer mediante un anuncio el primer lanzamiento del proyecto «OpenAssistant», que desarrolla un chatbot de inteligencia artificial capaz de comprender y responder preguntas en lenguaje natural, interactuar con sistemas de terceros y extraer dinámicamente la información necesaria.
Para quienes desconocen de LAION, deben saber que desarrolla herramientas, modelos y colecciones de datos para crear sistemas libres de aprendizaje automático (por ejemplo, la colección LAION se usa para entrenar modelos del sistema de síntesis de imágenes Stable Diffusion).
Además del código para entrenar y organizar el trabajo del bot en su equipo, se propone usar una colección de modelos listos para usar ya entrenados y un modelo de lenguaje, entrenado sobre la base de 600 mil ejemplos de diálogos en forma de una solicitud-respuesta (instrucción-ejecución), preparada y revisada con la participación de una comunidad de entusiastas.
También se lanzó un servicio en línea para evaluar la calidad del chatbot, que utiliza el modelo de conocimiento OA_SFT_Llama_30B_6, que cubre 30 mil millones de parámetros.
Nuestro equipo ha trabajado incansablemente durante los últimos meses recopilando grandes cantidades de información y comentarios basados en texto para crear un conjunto de datos increíblemente diverso y único diseñado específicamente para entrenar modelos de lenguaje u otras aplicaciones de IA.
Con más de 600 000 puntos de datos generados por humanos que cubren una amplia gama de temas y estilos de escritura, nuestro conjunto de datos será una herramienta invaluable para cualquier desarrollador que busque crear modelos de instrucción de última generación
Para aumentar la eficiencia del sistema y evitar la necesidad de almacenar grandes cantidades de parámetros predefinidos, el proyecto prevé la posibilidad de utilizar una base de conocimiento actualizada dinámicamente que puede recuperar la información requerida a través de motores de búsqueda o servicios externos.
Por ejemplo, al generar respuestas, el bot puede acceder a API externas para obtener datos adicionales. De las características avanzadas, también se destaca el soporte de personalización, es decir la capacidad de adaptarse a un usuario específico en función de sus frases anteriores.
Para los interesados en instalar OpenAssistant, deben saber que pueden instalarlo de manera local, y que los modelos candidatos Pythia SFT están disponibles en HuggingFace y se pueden cargar a través de la biblioteca HuggingFace Transformers. Como tal, es posible que pueden ser usados con suficiente hardware. También hay espacios en HF que se pueden usar para chatear con el candidato de OA sin su propio hardware. Sin embargo, estos modelos no son definitivos y pueden generar resultados deficientes o no deseados.
Los modelos LLaMa SFT no se pueden lanzar directamente debido a la licencia de Meta, pero los pesos XOR se lanzarán pronto.
Es importante mencionar que el modelo actual más pequeño (Pythia) tiene parámetros 12B y es difícil de ejecutar en hardware de consumo, pero puede ejecutarse en una sola GPU profesional. En el futuro puede haber modelos más pequeños y esperamos avanzar en métodos como la cuantificación de enteros que pueden ayudar a ejecutar el modelo en hardware más pequeño.
El proyecto no planea detenerse en repetir las capacidades de ChatGPT. Se espera que Open-Assistant estimule el desarrollo del desarrollo abierto en el campo de la generación de contenido y procesamiento de consultas en lenguajes naturales, al igual que el proyecto de fuente abierta Stable Diffusion estimuló el desarrollo de herramientas para generar imágenes.
El código del proyecto está escrito en Python y se distribuye bajo la licencia Apache 2.0. Los desarrollos de OpenAssistant se pueden utilizar para crear sus propios asistentes inteligentes y sistemas de diálogo que no están vinculados a API y servicios externos. El hardware de consumo convencional es suficiente para funcionar, por ejemplo, es posible trabajar en un teléfono inteligente. Los datos de Open Assistant se publican bajo una licencia Creative Commons que permite una amplia gama de usos, incluido el uso comercial.
Finalmente si estás interesado en poder conocer más al respecto asi como poder consultar el código fuente, puedes consultar los detalles en el siguiente enlace.