OpenAssistant, бот ШІ з відкритим кодом

OpenAssistant

Open Assistant – це проект, спрямований на те, щоб надати кожному доступ до великої мовної моделі на основі чату.

Нещодавно Спільнота LAION (Large-Scale Artificial Intelligence Open Network), оприлюднений через оголошення перший випуск проекту «OpenAssistant»., який розробляє чат-бот зі штучним інтелектом, здатний розуміти запитання та відповідати на них природною мовою, взаємодіяти зі сторонніми системами та динамічно витягувати необхідну інформацію.

Тим, хто не знайомий із LAION, слід знати, що він розробляє інструменти, моделі та колекції даних для створення безкоштовних систем машинного навчання (наприклад, колекція LAION використовується для навчання моделей системи синтезу зображень Stable Diffusion).

Окрім код навчання та організації роботи бота на вашому комп’ютері, пропонується використовувати колекцію готових моделей використовувати вже навчену і мовну модель, навчену на основі 600 тис. прикладів діалогів у формі запит-відповідь (інструкція-виконання), підготовлених і доопрацьованих за участю спільноти ентузіастів.

Також запущено онлайн-сервіс для оцінки якості чат-бота за допомогою моделі знань OA_SFT_Llama_30B_6, яка охоплює 30 мільярдів параметрів.

Наша команда невпинно працювала протягом останніх кількох місяців, збираючи величезну кількість інформації та текстових відгуків, щоб створити неймовірно різноманітний та унікальний набір даних, спеціально розроблений для навчання мовних моделей або інших програм ШІ.

Завдяки понад 600 000 точок даних, створених людиною, які охоплюють широкий спектр тем і стилів написання, наш набір даних стане безцінним інструментом для будь-якого розробника, який хоче створити навчальні моделі нового покоління.

Для підвищення ефективності системи та уникнути необхідності зберігати велику кількість попередньо встановлених параметрів, проект передбачає можливість використання динамічно оновлюваної бази знань, яка може отримувати необхідну інформацію через пошукові системи або зовнішні сервіси.

Наприклад, під час генерації відповідей бот може отримати доступ до зовнішніх API, щоб отримати додаткові дані. З розширених функцій також виділяється підтримка персоналізації, тобто можливість підлаштовуватися під конкретного користувача на основі його попередніх фраз.

Для тих, хто зацікавлений у встановленні OpenAssistant, ви повинні знати, що ви можете встановити його локально, і що потенційні моделі Pythia SFT доступні з HuggingFace і можуть бути завантажені через бібліотеку HuggingFace Transformers. Таким чином, цілком можливо, що їх можна використовувати з достатнім обладнанням. На HF також є місця, які можна використовувати для спілкування з кандидатом на OA без власного обладнання. Однак ці моделі не є остаточними і можуть дати погані або небажані результати.

Моделі LLaMa SFT не можуть бути випущені безпосередньо через ліцензію Meta, але ваги XOR будуть випущені незабаром.

Важливо зазначити, що поточна найменша модель (Pythia) має параметри 12B і її важко запускати на споживчому обладнанні, але вона може працювати на одному професійному GPU. У майбутньому можуть з’явитися менші моделі, і ми сподіваємося вдосконалити такі методи, як цілочисельне квантування, які можуть допомогти запустити модель на меншому обладнанні.

Проект не планує зупинятися на повторенні можливостей ChatGPT. Очікується, що Open-Assistant стимулюватиме розвиток відкритих розробок у сфері генерації контенту та обробки запитів на природних мовах, подібно до того, як проект із відкритим кодом Stable Diffusion стимулював розвиток інструментів генерації зображень.

Код проекту написаний на Python і поширюється за ліцензією Apache 2.0. Розробки OpenAssistant можна використовувати для створення власних інтелектуальних помічників і діалогових систем, які не прив’язані до зовнішніх API і сервісів. Для роботи достатньо звичайного побутового обладнання, наприклад, можна працювати на смартфоні. Дані Open Assistant оприлюднені за ліцензією Creative Commons, що дозволяє використовувати їх у різноманітних цілях, у тому числі в комерційних цілях.

Нарешті, якщо ви зацікавлені в тому, щоб мати можливість дізнатися більше про це, а також мати можливість проконсультуватися з вихідним кодом, ви можете ознайомитися з деталями У наступному посиланні.


Залиште свій коментар

Ваша електронна адреса не буде опублікований. Обов'язкові для заповнення поля позначені *

*

*

  1. Відповідальний за дані: AB Internet Networks 2008 SL
  2. Призначення даних: Контроль спаму, управління коментарями.
  3. Легітимація: Ваша згода
  4. Передача даних: Дані не передаватимуться третім особам, за винятком юридичних зобов’язань.
  5. Зберігання даних: База даних, розміщена в мережі Occentus Networks (ЄС)
  6. Права: Ви можете будь-коли обмежити, відновити та видалити свою інформацію.