OpenAssistant, en AI-bot med öppen källkod

Öppna Assistent

Open Assistant är ett projekt som syftar till att ge alla tillgång till en fantastisk chattbaserad stor språkmodell.

Nyligen den LAION gemenskap (Large-Scale Artificial Intelligence Open Network) presenteras genom ett tillkännagivande den första utgåvan av «OpenAssistant»-projektet, som utvecklar en artificiell intelligens chatbot som kan förstå och svara på frågor på naturligt språk, interagera med tredje parts system och dynamiskt extrahera nödvändig information.

För de som inte är bekanta med LAION bör du veta att det utvecklar verktyg, modeller och datainsamlingar för att skapa gratis maskininlärningssystem (till exempel används LAION-samlingen för att träna modeller av bildsyntessystemet Stable Diffusion).

Förutom kod för att träna och organisera arbetet av boten på din dator, det föreslås att använda en samling färdiga modeller att använda redan utbildade och en språkmodell, utbildad på basis av 600 tusen exempel på dialoger i form av en begäran-svar (instruktion-utförande), förberedd och reviderad med deltagande av en gemenskap av entusiaster.

En onlinetjänst för att bedöma kvaliteten på chatboten lanserades också, med hjälp av kunskapsmodellen OA_SFT_Llama_30B_6, som täcker 30 miljarder parametrar.

Vårt team har arbetat outtröttligt under de senaste månaderna med att samla in enorma mängder information och textbaserad feedback för att skapa en otroligt mångsidig och unik datauppsättning speciellt designad för att träna språkmodeller eller andra AI-applikationer.

Med över 600 000 mänskligt genererade datapunkter som täcker ett brett spektrum av ämnen och skrivstilar, kommer vår datauppsättning att visa sig vara ett ovärderligt verktyg för alla utvecklare som vill skapa nästa generations instruktionsmodeller.

För att öka effektiviteten av systemet och undvika behovet lagra stora mängder förinställda parametrar, förutser projektet möjligheten att använda en dynamiskt uppdaterad kunskapsbas som kan hämta den information som krävs genom sökmotorer eller externa tjänster.

Till exempel, när den genererar svar kan boten komma åt externa API:er för att få ytterligare data. Av de avancerade funktionerna lyfts även personaliseringsstöd fram, det vill säga möjligheten att anpassa sig till en specifik användare utifrån deras tidigare fraser.

För de som är intresserade av att installera OpenAssistant bör du veta att du kan installera det lokalt, och att kandidat Pythia SFT-modeller är tillgängliga från HuggingFace och kan laddas via HuggingFace Transformers-biblioteket. Som sådana är det möjligt att de kan användas med tillräcklig hårdvara. Det finns även utrymmen på HF som kan användas för att chatta med OA-kandidaten utan egen hårdvara. Dessa modeller är dock inte definitiva och kan ge dåliga eller oönskade resultat.

LLaMa SFT-modeller kan inte släppas direkt på grund av Meta-licensen, men XOR-vikter kommer att släppas snart.

Det är viktigt att nämna att den nuvarande minsta modellen (Pythia) har 12B parametrar och är svår att köra på konsumenthårdvara, men kan köras på en enda professionell GPU. Det kan finnas mindre modeller i framtiden, och vi hoppas kunna utveckla metoder som heltalskvantisering som kan hjälpa till att köra modellen på mindre hårdvara.

Projektet planerar inte att stanna vid att upprepa funktionerna i ChatGPT. Open-Assistant förväntas stimulera utvecklingen av öppen utveckling inom området innehållsgenerering och frågebehandling i naturliga språk, precis som open source-projektet Stable Diffusion stimulerade utvecklingen av bildgenereringsverktyg.

Projektkoden är skriven i Python och distribueras under Apache 2.0-licensen. OpenAssistant-utvecklingar kan användas för att skapa dina egna intelligenta assistenter och dialogsystem som inte är knutna till externa API:er och tjänster. Konventionell konsumenthårdvara räcker för att fungera, till exempel är det möjligt att arbeta på en smartphone. Open Assistant-data släpps under en Creative Commons-licens som tillåter ett brett spektrum av användningar, inklusive kommersiell användning.

Slutligen, om du är intresserad av att kunna lära dig mer om det såväl som att kunna konsultera källkoden, kan du konsultera detaljerna I följande länk.


Lämna din kommentar

Din e-postadress kommer inte att publiceras. Obligatoriska fält är markerade med *

*

*

  1. Ansvarig för data: AB Internet Networks 2008 SL
  2. Syftet med uppgifterna: Kontrollera skräppost, kommentarhantering.
  3. Legitimering: Ditt samtycke
  4. Kommunikation av uppgifterna: Uppgifterna kommer inte att kommuniceras till tredje part förutom enligt laglig skyldighet.
  5. Datalagring: databas värd för Occentus Networks (EU)
  6. Rättigheter: När som helst kan du begränsa, återställa och radera din information.