OpenAssistant, odprtokodni AI bot

OpenAssistant

Open Assistant je projekt, katerega namen je vsem omogočiti dostop do odličnega velikega jezikovnega modela, ki temelji na klepetu.

Nedavno je Skupnost LAION (Large-Scale Artificial Intelligence Open Network), predstavljen z objavo prva izdaja projekta «OpenAssistant»., ki razvija klepetalnega robota z umetno inteligenco, ki je sposoben razumeti in odgovarjati na vprašanja v naravnem jeziku, komunicirati s sistemi tretjih oseb in dinamično pridobivati ​​potrebne informacije.

Za tiste, ki ne poznate LAION, morate vedeti, da razvija orodja, modele in zbirke podatkov za ustvarjanje brezplačnih sistemov za strojno učenje (na primer, zbirka LAION se uporablja za usposabljanje modelov sistema za sintezo slike Stable Diffusion).

Poleg kodeks za usposabljanje in organizacijo dela bota v vašem računalniku, predlaga se uporaba zbirke že pripravljenih modelov uporabljati že naučen in jezikovni model, naučen na podlagi 600 tisoč primerov dialogov v obliki zahteva-odgovor (navodilo-izvedba), pripravljenih in revidiranih s sodelovanjem skupnosti entuziastov.

Uvedena je bila tudi spletna storitev za ocenjevanje kakovosti chatbota z uporabo modela znanja OA_SFT_Llama_30B_6, ki zajema 30 milijard parametrov.

Naša ekipa je v zadnjih nekaj mesecih neutrudno delala in zbirala ogromne količine informacij in besedilnih povratnih informacij, da bi ustvarila neverjetno raznolik in edinstven nabor podatkov, posebej zasnovan za usposabljanje jezikovnih modelov ali drugih aplikacij AI.

Z več kot 600 podatkovnimi točkami, ki jih je ustvaril človek in pokrivajo širok razpon tem in stilov pisanja, se bo naš nabor podatkov izkazal za neprecenljivo orodje za vsakega razvijalca, ki želi ustvariti učne modele naslednje generacije.

Za povečanje učinkovitosti sistema in se izognili potrebi po shranjevanje velike količine prednastavljenih parametrov, projekt predvideva možnost uporabe dinamično posodobljene baze znanja, ki lahko pridobi zahtevane informacije prek iskalnikov ali zunanjih storitev.

Na primer, pri ustvarjanju odgovorov lahko bot dostopa do zunanjih API-jev, da pridobi dodatne podatke. Od naprednih funkcij je izpostavljena tudi podpora za personalizacijo, to je možnost prilagajanja določenemu uporabniku glede na njegove prejšnje fraze.

Če želite namestiti OpenAssistant, morate vedeti, da ga lahko namestite lokalno in da so možni modeli Pythia SFT na voljo pri HuggingFace in jih je mogoče naložiti prek knjižnice HuggingFace Transformers. Kot take je možno, da jih je mogoče uporabljati z zadostno strojno opremo. Na HF so tudi prostori, ki jih lahko uporabite za klepet s kandidatom za OA brez lastne strojne opreme. Vendar ti modeli niso dokončni in lahko povzročijo slabe ali neželene rezultate.

Modelov LLaMa SFT ni mogoče izdati neposredno zaradi licence Meta, vendar bodo uteži XOR kmalu izdane.

Pomembno je omeniti, da ima trenutni najmanjši model (Pythia) 12B parametrov in ga je težko izvajati na potrošniški strojni opremi, lahko pa deluje na eni profesionalni grafični procesorji. V prihodnosti bodo morda na voljo manjši modeli in upamo, da bomo napredovali pri metodah, kot je celoštevilska kvantizacija, ki lahko pomagajo zagnati model na manjši strojni opremi.

Projekt se ne namerava ustaviti pri ponavljanju zmogljivosti ChatGPT. Open-Assistant naj bi spodbudil razvoj odprtega razvoja na področju generiranja vsebin in obdelave poizvedb v naravnih jezikih, tako kot je odprtokodni projekt Stable Diffusion spodbudil razvoj orodij za generiranje slik.

Koda projekta je napisana v Pythonu in se distribuira pod licenco Apache 2.0. Razvoj OpenAssistant lahko uporabite za ustvarjanje lastnih inteligentnih pomočnikov in pogovornih sistemov, ki niso vezani na zunanje API-je in storitve. Za delo je dovolj običajna potrošniška strojna oprema, na primer mogoče je delati na pametnem telefonu. Podatki Open Assistant so objavljeni pod licenco Creative Commons, ki omogoča široko paleto uporab, vključno s komercialno uporabo.

Nazadnje, če vas zanima več o tem in si lahko ogledate izvorno kodo, si lahko ogledate podrobnosti V naslednji povezavi.


Pustite svoj komentar

Vaš e-naslov ne bo objavljen. Obvezna polja so označena z *

*

*

  1. Odgovoren za podatke: AB Internet Networks 2008 SL
  2. Namen podatkov: Nadzor neželene pošte, upravljanje komentarjev.
  3. Legitimacija: Vaše soglasje
  4. Sporočanje podatkov: Podatki se ne bodo posredovali tretjim osebam, razen po zakonski obveznosti.
  5. Shranjevanje podatkov: Zbirka podatkov, ki jo gosti Occentus Networks (EU)
  6. Pravice: Kadar koli lahko omejite, obnovite in izbrišete svoje podatke.