OpenAssistant, avatud lähtekoodiga AI-bot

OpenAssistant

Open Assistant on projekt, mille eesmärk on anda kõigile juurdepääs suurepärasele vestluspõhisele suurele keelemudelile.

Hiljuti LAION kogukond (Large-Scale Artificial Intelligence Open Network) avalikustati teadaandega projekti «OpenAssistant» esimene väljalase, mis arendab tehisintellekti vestlusrobotit, mis on suuteline mõistma ja loomulikus keeles küsimusi vastama, suhtlema kolmandate osapoolte süsteemidega ning hankima dünaamiliselt vajalikku teavet.

Need, kes LAIONiga ei tunne, peaksid teadma, et see arendab tööriistu, mudeleid ja andmekogusid tasuta masinõppesüsteemide loomiseks (näiteks kasutatakse LAIONi kollektsiooni Stable Diffusion kujutise sünteesisüsteemi mudelite koolitamiseks).

Lisaks sellele kood töö koolitamiseks ja korraldamiseks teie arvutis olevast robotist, tehakse ettepanek kasutada valmismudelite kogumit kasutada juba koolitatud ja keelemudelit, mis on koolitatud 600 tuhande dialooginäidete põhjal päringu-vastuse vormis (juhis-täitmine), mis on koostatud ja üle vaadatud entusiastide kogukonna osalusel.

Käivitati ka veebiteenus vestlusroboti kvaliteedi hindamiseks, kasutades OA_SFT_Llama_30B_6 teadmiste mudelit, mis hõlmab 30 miljardit parameetrit.

Meie meeskond on viimase mitme kuu jooksul väsimatult töötanud, kogudes tohutul hulgal teavet ja tekstipõhist tagasisidet, et luua uskumatult mitmekesine ja ainulaadne andmestik, mis on spetsiaalselt loodud keelemudelite või muude tehisintellekti rakenduste treenimiseks.

Rohkem kui 600 000 inimese loodud andmepunktiga, mis hõlmavad laia valikut teemasid ja kirjutamisstiile, osutub meie andmekogum hindamatuks tööriistaks igale arendajale, kes soovib luua järgmise põlvkonna õppemudeleid.

Tõhususe suurendamiseks süsteemi ja vältida vajadust salvestada suures koguses eelseadistatud parameetreid, näeb projekt ette võimaluse kasutada dünaamiliselt ajakohastatud teadmistebaasi, mis suudab vajalikku teavet hankida otsingumootorite või välisteenuste kaudu.

Näiteks vastuste genereerimisel pääseb bot lisaandmete hankimiseks juurde välistele API-dele. Täiustatud funktsioonidest tuuakse esile ka isikupärastamise tugi ehk võimalus kohaneda konkreetse kasutajaga tema varasemate fraaside põhjal.

Need, kes on huvitatud OpenAssistanti installimisest, peaksid teadma, et saate selle installida kohapeal ja et Pythia SFT-i kandidaatmudelid on saadaval HuggingFace'is ja neid saab laadida HuggingFace Transformersi teegi kaudu. Sellisena on võimalik, et neid saab kasutada piisava riistvaraga. HF-is on ka ruume, mida saab kasutada OA kandidaadiga vestlemiseks ilma oma riistvarata. Need mudelid ei ole siiski lõplikud ja võivad anda halbu või soovimatuid tulemusi.

LLaMa SFT-mudeleid ei saa Meta litsentsi tõttu otse välja anda, kuid XOR-raskused ilmuvad peagi.

Oluline on mainida, et praegusel väikseimal mudelil (Pythia) on 12B parameetreid ja seda on raske tarbijariistvaraga käivitada, kuid suudab töötada ühe professionaalse GPU-ga. Tulevikus võib olla väiksemaid mudeleid ja loodame arendada selliseid meetodeid nagu täisarvu kvantimine, mis aitavad mudelit väiksemal riistvaral käitada.

Projekt ei kavatse piirduda ChatGPT võimaluste kordamisega. Open-Assistantilt oodatakse avatud arenduse arengut loomulikes keeltes sisu genereerimise ja päringute töötlemise vallas, nagu ka avatud lähtekoodiga projekt Stable Diffusion stimuleeris pildi genereerimise tööriistade väljatöötamist.

Projekti kood on kirjutatud Pythonis ja seda levitatakse Apache 2.0 litsentsi all. OpenAssistanti arendusi saab kasutada oma intelligentsete assistentide ja dialoogisüsteemide loomiseks, mis ei ole seotud väliste API-de ja teenustega. Töötamiseks piisab tavapärasest tarbijariistvarast, näiteks on võimalik töötada nutitelefoniga. Open Assistanti andmed avaldatakse Creative Commonsi litsentsi alusel, mis võimaldab kasutada laia valikut, sealhulgas ärilist kasutamist.

Lõpuks, kui olete huvitatud selle kohta lisateavet ja lähtekoodiga tutvumisest, võite tutvuda üksikasjadega Järgmisel lingil.


Jäta oma kommentaar

Sinu e-postiaadressi ei avaldata. Kohustuslikud väljad on tähistatud *

*

*

  1. Andmete eest vastutav: AB Internet Networks 2008 SL
  2. Andmete eesmärk: Rämpsposti kontrollimine, kommentaaride haldamine.
  3. Seadustamine: teie nõusolek
  4. Andmete edastamine: andmeid ei edastata kolmandatele isikutele, välja arvatud juriidilise kohustuse alusel.
  5. Andmete salvestamine: andmebaas, mida haldab Occentus Networks (EL)
  6. Õigused: igal ajal saate oma teavet piirata, taastada ja kustutada.