Т5 (языковая модель)Васина Википедия

Новости с планеты OGLE-2018-BLG-0677
Что вы не только не знали, но и не хотели знать
Автор темы
wiki_en
Всего сообщений: 94473
Зарегистрирован: 16.01.2024
 Т5 (языковая модель)

Сообщение wiki_en »

*Большая языковая модель
*Трансформер (архитектура глубокого обучения)

«T5 (преобразователь передачи текста в текст)» — это серия больших языковых моделей | больших языковых моделей, разработанных Google AI. Представлено в 2019 году
Как и оригинальная модель Трансформера
В 2022 году T5X обновил его для использования Google JAX|JAX.
== Обучение ==
Модели T5 предварительно обучены на Colossal Clean Crawled Corpus (C4), содержащем текст и код веб-сканера, взятые из Интернета. Этот процесс предварительного обучения позволяет моделям изучить общее понимание языка и способности к генерации. Затем модели T5 можно точно настроить для конкретных последующих задач, адаптируя их знания для эффективной работы в различных приложениях.

Модели T5 были предварительно обучены для выполнения многих задач, все в формате -> .

Некоторые примеры:

* восстановление поврежденного текста: Спасибо мне на вашей вечеринке недели. -> за приглашение на последнюю , где < code> означает «конец вывода».
* перевод: перевести с английского на немецкий: Это хорошо. -> Das ist Gut..
* оценка грамматической приемлемости предложения (Корпус лингвистической приемлемости|предложение CoLA): Курс прыгает хорошо. -> не приемлемо .

== Архитектура ==
Серия T5 включает в себя несколько моделей разных размеров и возможностей. Эти модели часто отличаются количеством параметров, что указывает на сложность и потенциальную емкость модели. В исходной статье сообщалось о следующих 5 моделях:

В приведенной выше таблице

* # слоев: количество слоев в кодировщике; также количество слоев в декодере. У них всегда одинаковое количество слоев.
* d_{model}: Размерность векторов внедрения.
* d_{ff}: размер сети прямой связи внутри каждого уровня кодера и декодера.
* '''d_{kv}''': Размерность векторов ключа и значения, используемых в механизме самообслуживания.

== См. также ==

* Большая языковая модель|большие языковые модели
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ, комментарий, отзыв

Изменение регистра текста: 
Смайлики
:) :( :oops: :chelo: :roll: :wink: :muza: :sorry: :angel: :read: *x) :clever:
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Джамба (языковая модель)
    wiki_en » » в форуме Васина Википедия
    0 Ответы
    52 Просмотры
    Последнее сообщение wiki_en
  • 1,58-разрядная большая языковая модель
    wiki_en » » в форуме Васина Википедия
    0 Ответы
    18 Просмотры
    Последнее сообщение wiki_en
  • Молодая языковая школа
    wiki_de » » в форуме Васина Википедия
    0 Ответы
    83 Просмотры
    Последнее сообщение wiki_de
  • Официальная языковая школа
    wiki_de » » в форуме Васина Википедия
    0 Ответы
    60 Просмотры
    Последнее сообщение wiki_de
  • Языковая политика в Нунавуте
    wiki_en » » в форуме Васина Википедия
    0 Ответы
    16 Просмотры
    Последнее сообщение wiki_en