OpenAssistant, un bot d'IA de codi obert

OpenAssistant

Open Assistant és un projecte destinat a brindar a tots accés a un excel·lent model de llenguatge gran basat en xat.

Fa poc la comunitat LAION (Xarxa Oberta d'Intel·ligència Artificial a Gran Escala) va donar a conèixer mitjançant un anunci el primer llançament del projecte OpenAssistant, que desenvolupa un chatbot d'intel·ligència artificial capaç de comprendre i respondre preguntes en llenguatge natural, interactuar amb sistemes de tercers i extreure'n dinàmicament la informació necessària.

Per als que desconeixen de LAION, han de saber que desenvolupa eines, models i col·leccions de dades per crear sistemes lliures d'aprenentatge automàtic (per exemple, la col·lecció LAION es fa servir per entrenar models del sistema de síntesi d'imatges Stable Diffusion).

A més del codi per entrenar i organitzar el treball del bot al seu equip, es proposa fer servir una col·lecció de models llestos per fer servir ja entrenats i un model de llenguatge, entrenat sobre la base de 600 mil exemples de diàlegs en forma d'una sol·licitud-resposta (instrucció-execució), preparada i revisada amb la participació d'una comunitat d'entusiastes.

També es va llançar un servei en línia per avaluar la qualitat del chatbot, que utilitza el model de coneixement OA_SFT_Llama_30B_6, que cobreix 30 mil milions de paràmetres.

El nostre equip ha treballat incansablement durant els darrers mesos recopilant grans quantitats d'informació i comentaris basats en text per crear un conjunt de dades increïblement divers i únic dissenyat específicament per entrenar models de llenguatge o altres aplicacions d'IA.

Amb més de 600 punts de dades generats per humans que cobreixen una àmplia gamma de temes i estils d'escriptura, el nostre conjunt de dades serà una eina invaluable per a qualsevol desenvolupador que busqui crear models d'instrucció d'última generació

Per augmentar l'eficiència del sistema i evitar la necessitat de emmagatzemar grans quantitats de paràmetres predefinits, el projecte preveu la possibilitat dutilitzar una base de coneixement actualitzada dinàmicament que pot recuperar la informació requerida a través de motors de cerca o serveis externs.

Per exemple, en generar respostes, el bot pot accedir a API externes per obtenir dades addicionals. De les característiques avançades, també es destaca el suport de personalització, és a dir, la capacitat d'adaptar-se a un usuari específic en funció de les frases anteriors.

Per als interessats a instal·lar OpenAssistant, han de saber que poden instal·lar-lo de manera local, i que els models candidats Pythia SFT estan disponibles a HuggingFace i es poden carregar a través de la biblioteca HuggingFace Transformers. Com a tal, és possible que poden ser usats amb prou maquinari. També hi ha espais a HF que es poden fer servir per xatejar amb el candidat d'OA sense el seu propi maquinari. Aquests models, però, no són definitius i poden generar resultats deficients o no desitjats.

Els models LLaMa SFT no es poden llançar directament a causa de la llicència de Meta, però els pesos XOR es llançaran aviat.

És important esmentar que el model actual més petit (Pythia) té paràmetres 12B i és difícil dexecutar en maquinari de consum, però pot executar-se en una sola GPU professional. En el futur hi pot haver models més petits i esperem avançar en mètodes com la quantificació d'enters que poden ajudar a executar el model en maquinari més petit.

El projecte no planeja aturar-se a repetir les capacitats de ChatGPT. S'espera que Open-Assistant estimuli el desenvolupament del desenvolupament obert al camp de la generació de contingut i processament de consultes en llenguatges naturals, igual que el projecte de font oberta Stable Diffusion va estimular el desenvolupament d'eines per generar imatges.

El codi del projecte està escrit a Python i es distribueix sota la llicència Apache 2.0. Els desenvolupaments d'OpenAssistant es poden utilitzar per crear els seus propis assistents intel·ligents i sistemes de diàleg que no estan vinculats a API i serveis externs. El maquinari de consum convencional és suficient per funcionar, per exemple, és possible treballar en un telèfon intel·ligent. Les dades d'Open Assistant es publiquen sota una llicència Creative Commons que permet una àmplia gamma d'usos, inclòs l'ús comercial.

Finalment si estàs interessat a poder conèixer més sobre això així com poder consultar el codi font, pots consultar els detalls en el següent enllaç.


Deixa el teu comentari

La seva adreça de correu electrònic no es publicarà. Els camps obligatoris estan marcats amb *

*

*

  1. Responsable de les dades: AB Internet Networks 2008 SL
  2. Finalitat de les dades: Controlar l'SPAM, gestió de comentaris.
  3. Legitimació: El teu consentiment
  4. Comunicació de les dades: No es comunicaran les dades a tercers excepte per obligació legal.
  5. Emmagatzematge de les dades: Base de dades allotjada en Occentus Networks (UE)
  6. Drets: En qualsevol moment pots limitar, recuperar i esborrar la teva informació.