OpenAssistant, avoimen lähdekoodin AI-botti

OpenAssistant

Open Assistant on projekti, jonka tavoitteena on antaa kaikille pääsy upeaan chat-pohjaiseen laajaan kielimalliin.

Äskettäin LAION yhteisö (Large-Scale Artificial Intelligence Open Network) paljastettiin ilmoituksella "OpenAssistant"-projektin ensimmäinen julkaisu, joka kehittää tekoälyn chatbotin, joka pystyy ymmärtämään ja vastaamaan kysymyksiin luonnollisella kielellä, olemaan vuorovaikutuksessa kolmannen osapuolen järjestelmien kanssa ja poimimaan dynaamisesti tarvittavat tiedot.

Niiden, jotka eivät tunne LAIONia, kannattaa tietää, että se kehittää työkaluja, malleja ja tietokokoelmia ilmaisten koneoppimisjärjestelmien luomiseen (LAION-kokoelmaa käytetään esimerkiksi Stable Diffusion -kuvasynteesijärjestelmän mallien kouluttamiseen).

Lisäksi koodi kouluttaa ja organisoida työtä tietokoneesi robotista, ehdotetaan käytettäväksi valmiiden mallien kokoelmaa käyttää jo koulutettua ja kielimallia, joka on koulutettu 600 XNUMX vuoropuheluesimerkin pohjalta pyyntö-vastauksen muodossa (ohje-suoritus), joka on valmistettu ja tarkistettu harrastajayhteisön osallistuessa.

Myös chatbotin laadun arvioimiseksi lanseerattiin verkkopalvelu, jossa käytetään OA_SFT_Llama_30B_6-tietomallia, joka kattaa 30 miljardia parametria.

Tiimimme on työskennellyt väsymättä useiden viime kuukausien ajan kerätäkseen valtavia määriä tietoa ja tekstipohjaista palautetta luodakseen uskomattoman monipuolisen ja ainutlaatuisen tietojoukon, joka on suunniteltu erityisesti kielimallien tai muiden tekoälysovellusten koulutukseen.

Yli 600 000 ihmisen luoman tietopisteen avulla, jotka kattavat monenlaisia ​​aiheita ja kirjoitustyylejä, tietojoukostamme tulee korvaamaton työkalu kaikille kehittäjille, jotka haluavat luoda seuraavan sukupolven opetusmalleja.

Tehokkuuden lisäämiseksi järjestelmästä ja välttää sen tarvetta tallentaa suuria määriä esiasetettuja parametreja, hankkeessa ennakoidaan mahdollisuutta käyttää dynaamisesti päivittyvää tietokantaa, joka voi hakea tarvittavat tiedot hakukoneiden tai ulkoisten palvelujen kautta.

Esimerkiksi luodessaan vastauksia, botti voi käyttää ulkoisia API-liittymiä saadakseen lisätietoja. Edistyneistä ominaisuuksista korostuu myös personointituki, eli kyky mukautua tietylle käyttäjälle aiempien lauseiden perusteella.

OpenAssistantin asentamisesta kiinnostuneiden kannattaa tietää, että voit asentaa sen paikallisesti ja että ehdokkaita Pythia SFT -malleja on saatavana HuggingFacelta ja ne voidaan ladata HuggingFace Transformers -kirjaston kautta. Sellaisenaan on mahdollista, että niitä voidaan käyttää riittävällä laitteistolla. HF:ssä on myös tiloja, joilla voit keskustella OA-ehdokkaan kanssa ilman omaa laitteistoasi. Nämä mallit eivät kuitenkaan ole lopullisia ja voivat tuottaa huonoja tai ei-toivottuja tuloksia.

LLaMa SFT -malleja ei voida julkaista suoraan Meta-lisenssin vuoksi, mutta XOR-painot julkaistaan ​​pian.

On tärkeää mainita, että nykyisessä pienimmässä mallissa (Pythia) on 12B parametreja ja sitä on vaikea ajaa kuluttajalaitteistolla, mutta se voi toimia yhdellä ammattimaisella GPU:lla. Tulevaisuudessa saattaa olla pienempiä malleja, ja toivomme kehittävämme menetelmiä, kuten kokonaislukukvantisointia, jotka voivat auttaa mallin suorittamisessa pienemmillä laitteistoilla.

Projekti ei aio lopettaa ChatGPT:n ominaisuuksien toistamista. Open-Assistantin odotetaan stimuloivan avoimen kehityksen kehittymistä sisällöntuotannon ja kyselynkäsittelyn alalla luonnollisilla kielillä, aivan kuten avoimen lähdekoodin projekti Stable Diffusion stimuloi kuvanmuodostustyökalujen kehitystä.

Projektikoodi on kirjoitettu Pythonilla ja sitä jaetaan Apache 2.0 -lisenssillä. OpenAssistant-kehityksen avulla voit luoda omia älykkäitä avustajia ja dialogijärjestelmiä, joita ei ole sidottu ulkoisiin API:ihin ja palveluihin. Perinteinen kuluttajalaitteisto riittää toimimaan, esimerkiksi älypuhelimella on mahdollista työskennellä. Open Assistant -tiedot julkaistaan ​​Creative Commons -lisenssillä, joka mahdollistaa monenlaisia ​​​​käyttöjä, mukaan lukien kaupallinen käyttö.

Lopuksi, jos olet kiinnostunut saamaan lisätietoa siitä ja pääsemään tarkastelemaan lähdekoodia, voit tutustua yksityiskohtiin Seuraavassa linkissä.


Jätä kommentti

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

*

*

  1. Vastaa tiedoista: AB Internet Networks 2008 SL
  2. Tietojen tarkoitus: Roskapostin hallinta, kommenttien hallinta.
  3. Laillistaminen: Suostumuksesi
  4. Tietojen välittäminen: Tietoja ei luovuteta kolmansille osapuolille muutoin kuin lain nojalla.
  5. Tietojen varastointi: Occentus Networks (EU) isännöi tietokantaa
  6. Oikeudet: Voit milloin tahansa rajoittaa, palauttaa ja poistaa tietojasi.