* Большая языковая модель
* Генеративный предварительно обученный трансформатор
* Мамба (архитектура глубокого обучения)
* Смесь экспертов
* Модель фундамента
«Jamba» — это модель большого языка с открытым весом (LLM), разработанная AI21 Labs.
Jamba показывает хорошие результаты по ряду ключевых показателей, включая пропускную способность и эффективность, превосходя или сопоставляя другие современные модели в своем классе по широкому спектру тестов производительности, имея при этом значительно большие контекстные ограничения, что позволяет использовать сценарии, требующие более высоких показателей производительности. context. Модель выпущена с открытыми весами по лицензии Apache | Лицензия Apache 2.0
В ближайшем будущем компания планирует выпустить бета-версию, настроенную по инструкции, на платформе AI21
== Характеристики ==
* '''Размер контекстного окна''': 256 тыс. токенов * '''Параметры''': 52 миллиарда
* '''Архитектура''': гибридный преобразователь Mamba (SSM) с участием экспертов (MoE)
== См. также ==
* Мамба (архитектура глубокого обучения)|Мамба — архитектура глубокого обучения
* Смесь экспертов – техника глубокого обучения
* AI21 Labs — компания в области искусственного интеллекта, расположенная в Тель-Авиве (Израиль)
Большие языковые модели
Джамба (языковая модель) ⇐ Васина Википедия
-
Автор темыwiki_en
- Сообщения: 127251
- Зарегистрирован: 16.01.2024
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
- 0 Ответы
- 325 Просмотры
-
Последнее сообщение wiki_en
-
- 0 Ответы
- 43 Просмотры
-
Последнее сообщение wiki_en
-
- 0 Ответы
- 35 Просмотры
-
Последнее сообщение wiki_de
-
- 0 Ответы
- 29 Просмотры
-
Последнее сообщение wiki_en
-
- 0 Ответы
- 122 Просмотры
-
Последнее сообщение wiki_de