Alibaba paleista prieš kelias dienas, išleido du pagrindinius kalbų modelius (LLM) atvirojo kodo bandant susidoroti su metaplatformomis.
dirbtinio intelekto modeliai, vadinami Qwen-7B ir Qwen-7B-Chat, kurių kiekvienas modelis turi septynis milijardus parametrų, kurie dažnai naudojami jo stiprumui matuoti. Vienas iš AI modelių iš Alibaba, siekia pozicionuoti save kaip pokalbio variantą neseniai išleistam Meta „Lama 2“.
Bendrovė sakė pranešime spaudai, kad "kodas, modelių svoriai ir dviejų modelių dokumentai bus laisvai prieinami akademikams, mokslininkams ir komercinėms institucijoms visame pasaulyje.«. Tai pirmas kartas, kai didelė Kinijos technologijų įmonė padarė atvirą prieigą prie LLM.
Pridėjo tai paleidimas šių atvirojo kodo modelių siekia, kad šie puikūs LLM modeliai galėtų būti dalis pastangų už pagalbą demokratizuoti AI technologiją ir remia LLM pradedančias įmones. Be to, taip pat buvo paminėta, kad nemokama prieiga prie modelių kodo, dokumentacijos ir vidinių elementų bus suteikta akademikams, mokslininkams ir komercinėms institucijoms visame pasaulyje.
Reikia atsiminti, kad LLM AI modeliai gali apdoroti didžiulius duomenų kiekius ir generuoti įvairaus pobūdžio turinį iš teksto, vaizdų, garso ir vaizdo, be informacijos, kuri yra AI pokalbių robotų, tokių kaip ChatGPT, pagrindas.
Apie jų LLM modelius „Alibaba“. paminėjo, kad jie abu yra pagrįsti Alibaba Tongyi Qianwen LLM, kuris buvo paskelbtas balandį. „Tongyi Qianwen“ turi kelias versijas su skirtingu parametrų skaičiumi, o „Qwen-7B“ ir „Qwen-7B-Chat“ yra dvi mažos versijos, skirtos padėti mažoms ir vidutinėms įmonėms pradėti dirbti su dirbtiniu intelektu.
„Mūsų tikslas yra skatinti visa apimančias technologijas ir sudaryti sąlygas daugiau kūrėjų bei mažų ir vidutinių įmonių pasinaudoti generatyvaus AI privalumais“, – sakė „Alibaba Cloud Intelligence“ CTO Zhou Jingren.
Nors didžiosios technologijų įmonės „atvirojo šaltinio“ savo AI modelius, atvirumas kelia diskusijų. Kaip ir Alibaba, Meta pripažįsta, kad yra LLaMA 2 dalių, kurių negalima pasiekti. Panašiai OpenAI riboja savo GPT-4 AI dalijimąsi. Neseniai atliktas tyrimas rodo, kad iš tikrųjų OpenAI ChatGPT ir Meta LLaMA nėra labai atviri.
„Alibaba Cloud“ teigė, kad įmonės, turinčios mažiau nei 100 milijonų aktyvių vartotojų per mėnesį, gali laisvai diegti modelius; o įmonės, turinčios daugiau nei 100 milijonų aktyvių naudotojų per mėnesį, prieš naudodamos abu modelius turės kreiptis dėl licencijos iš Alibaba. Panašiai Meta's Llama 2 reikalauja daugiau nei 700 milijonų vartotojų licencijos.
„Alibaba“ teigė, kad Tongyi Qianwen turėjo versijas su daugiau parametrų, kurios nebuvo išleistos nemokamai, tačiau nepasakė, kiek parametrų yra didžiausiame modelyje. Didžiausia Meta's Llama 2 versija turi 70 milijardų parametrų.
„Šiandien Alibaba Cloud yra pirmoji, kuri Kinijoje pristato mokymo ir diegimo sprendimą visai Llama 2 serijai“, – paskelbė Alibaba savo WeChat kanale. „Visi kūrėjai gali sukurti pritaikytus didelius modelius „Alibaba Cloud“.
Kinija bando pasivyti JAV dirbtinio intelekto srityje, o Pekinas skatina Kinijos įmones sparčiai kurti vietinius ir „kontroliuojamus“ AI modelius, galinčius konkuruoti su Amerikos kompanijų sukurtais.
Be „Alibaba“, daugelis technologijų gigantų, tokių kaip „Huawei“, pastaraisiais mėnesiais agresyviai kūrė savo AI modelius. Fontanas
Kaip jau minėta, tiems, kurie domisi, modeliai, pagrįsti Alibaba Tongyi Qianwen (Qwen-7B ir Qwen-7B-Chat versija), skirti pokalbiams, yra prieinami visiems, turintiems nemokamą licenciją, ir įmonėms, turinčioms daugiau nei 100 mln. turite paprašyti vieno.
Pagaliau jei norite sužinoti daugiau apie tai, išsamią informaciją galite patikrinti sekanti nuoroda.