OpenAssistant, een open source AI-bot

Assistent openen

Open Assistant is een project dat erop gericht is iedereen toegang te geven tot een geweldig op chat gebaseerd groot taalmodel.

Onlangs de LAION-gemeenschap (Large-Scale Artificial Intelligence Open Network) onthuld via een aankondiging de eerste uitgave van het «OpenAssistant»-project, dat een chatbot met kunstmatige intelligentie ontwikkelt die in staat is om vragen in natuurlijke taal te begrijpen en te beantwoorden, interactie te hebben met systemen van derden en dynamisch de benodigde informatie te extraheren.

Voor degenen die niet bekend zijn met LAION, u moet weten dat het tools, modellen en gegevensverzamelingen ontwikkelt om gratis machine learning-systemen te creëren (de LAION-verzameling wordt bijvoorbeeld gebruikt om modellen van het Stable Diffusion-beeldsynthesesysteem te trainen).

Naast code om werk te trainen en te organiseren van de bot op uw computer, voorgesteld wordt om een ​​verzameling kant-en-klare modellen te gebruiken om reeds getraind en een taalmodel te gebruiken, getraind op basis van 600 duizend voorbeelden van dialogen in de vorm van een verzoek-antwoord (instructie-uitvoering), voorbereid en herzien met de deelname van een gemeenschap van enthousiastelingen.

Er werd ook een online service gelanceerd om de kwaliteit van de chatbot te beoordelen, met behulp van het OA_SFT_Llama_30B_6 kennismodel, dat 30 miljard parameters dekt.

Ons team heeft de afgelopen maanden onvermoeibaar gewerkt aan het verzamelen van enorme hoeveelheden informatie en op tekst gebaseerde feedback om een ​​ongelooflijk diverse en unieke dataset te creëren die speciaal is ontworpen voor het trainen van taalmodellen of andere AI-toepassingen.

Met meer dan 600 door mensen gegenereerde datapunten die een breed scala aan onderwerpen en schrijfstijlen bestrijken, zal onze dataset een hulpmiddel van onschatbare waarde blijken te zijn voor elke ontwikkelaar die instructiemodellen van de volgende generatie wil maken.

Om de efficiëntie te verhogen van het systeem en vermijd de noodzaak om slaan grote hoeveelheden vooraf ingestelde parameters op, voorziet het project in de mogelijkheid om een ​​dynamisch bijgewerkte kennisbank te gebruiken die de vereiste informatie kan ophalen via zoekmachines of externe diensten.

Bij het genereren van reacties heeft de bot bijvoorbeeld toegang tot externe API's om aanvullende gegevens te verkrijgen. Van de geavanceerde functies wordt ook ondersteuning voor personalisatie benadrukt, dat wil zeggen de mogelijkheid om zich aan te passen aan een specifieke gebruiker op basis van hun eerdere zinnen.

Voor degenen die geïnteresseerd zijn in het installeren van OpenAssistant, moet u weten dat u het lokaal kunt installeren en dat kandidaat-Pythia SFT-modellen beschikbaar zijn bij HuggingFace en kunnen worden geladen via de HuggingFace Transformers-bibliotheek. Als zodanig is het mogelijk dat ze met voldoende hardware kunnen worden gebruikt. Er zijn ook ruimtes op HF die gebruikt kunnen worden om te chatten met de OA-kandidaat zonder eigen hardware. Deze modellen zijn echter niet definitief en kunnen slechte of ongewenste resultaten opleveren.

LLaMa SFT-modellen kunnen niet direct worden vrijgegeven vanwege de Meta-licentie, maar XOR-gewichten zullen binnenkort worden vrijgegeven.

Het is belangrijk om te vermelden dat het huidige kleinste model (Pythia) 12B parameters heeft en moeilijk te draaien is op consumentenhardware, maar kan draaien op een enkele professionele GPU. Mogelijk komen er in de toekomst kleinere modellen en we hopen methodes zoals integer-kwantisatie te ontwikkelen die kunnen helpen het model op kleinere hardware uit te voeren.

Het project is niet van plan te stoppen bij het herhalen van de mogelijkheden van ChatGPT. Van Open-Assistant wordt verwacht dat het de ontwikkeling van open ontwikkeling op het gebied van contentgeneratie en queryverwerking in natuurlijke talen stimuleert, net zoals het open source-project Stable Diffusion de ontwikkeling van tools voor het genereren van afbeeldingen stimuleerde.

De projectcode is geschreven in Python en wordt gedistribueerd onder de Apache 2.0-licentie. OpenAssistant-ontwikkelingen kunnen worden gebruikt om uw eigen intelligente assistenten en dialoogsystemen te maken die niet gebonden zijn aan externe API's en services. Conventionele consumentenhardware is voldoende om te werken, het is bijvoorbeeld mogelijk om op een smartphone te werken. De Open Assistant-gegevens worden vrijgegeven onder een Creative Commons-licentie die een breed scala aan toepassingen mogelijk maakt, waaronder commercieel gebruik.

Tot slot, als u er meer over wilt weten en de broncode wilt raadplegen, kunt u de details raadplegen In de volgende link.


Laat je reactie achter

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *

*

*

  1. Verantwoordelijk voor de gegevens: AB Internet Networks 2008 SL
  2. Doel van de gegevens: Controle SPAM, commentaarbeheer.
  3. Legitimatie: uw toestemming
  4. Mededeling van de gegevens: De gegevens worden niet aan derden meegedeeld, behalve op grond van wettelijke verplichting.
  5. Gegevensopslag: database gehost door Occentus Networks (EU)
  6. Rechten: u kunt uw gegevens op elk moment beperken, herstellen en verwijderen.