Последний экзамен человечестваВасина Википедия

Новости с планеты OGLE-2018-BLG-0677
Что вы не только не знали, но и не хотели знать
Автор темы
wiki_de
Всего сообщений: 58684
Зарегистрирован: 13.01.2023
 Последний экзамен человечества

Сообщение wiki_de »


«Последний экзамен человечества (HLE)» — это эталонный (компьютерный) | эталонный тест для моделей искусственного интеллекта | языковых моделей ИИ, который включает 2500 вопросов из широкого спектра предметных областей. Он был разработан совместно исследовательским центром Center for AI Safety в Сан-Франциско и компанией Scale AI.

== Создание ==
В ежегодном отчете Стэнфордского института AI Index 2025 «Последний экзамен человечества» упоминается как один из наиболее «сложных тестов», разработанных в ответ на то, что основные тесты AI достигают «уровня насыщения». Тест был описан как детище Дэна Хендрикса, исследователя машинного обучения и директора Центра безопасности искусственного интеллекта, который заявил, что на разработку теста его вдохновил разговор с Илоном Маском, который счел существующие тесты для языковых моделей, такие как тест Massive Multitask Language Offer (MMLU), слишком простыми. Хендрикс работал с Scale AI над составлением вопросов.
== Состав ==
Бенчмарк включает 2500 вопросов из общедоступной анкеты. Вопросы «обычно требуют знаний на уровне колледжа или проверяют знания по очень конкретным темам». В исследовании вопросы разделены на следующие широкие предметные области: математика (41%), физика (9%), биология/медицина (11%), гуманитарные и социальные науки (9%), информатика/искусственный интеллект (10%), инженерное дело (4%), химия (7%) и другие (9%). Около 14% вопросов требуют умения понимать как текст, так и изображения, т.е. Мультимодальность. 24% вопросов имеют множественный выбор; Модели должны найти собственные ответы на оставшиеся вопросы. Также сохраняется частный набор данных для проверки соответствия эталону.

Пример вопроса:
|Text=Колибри в отряде Apodiformes - единственные, у кого есть парное овальное костное образование, сесамовидная кость, которая прикрепляется к каудолатеральной области расширенной крестообразной сухожильной мембраны (апоневроза) места прикрепления мышцы, опускающей хвостовую мышцу. Сколько пар сухожилий поддерживается этой сесамовидной костью? Введите номер.
|Автор=
|Источник=

== Результаты ==

* [https://agi.safe.ai Последний экзамен человечества] Центр безопасности ИИ
* [https://scale.com/leaderboard/humanitys_last_exam Последний экзамен человечества] Масштабируйте ИИ
Категория: ИТ-бенчмарк

Категория:Искусственный интеллект

Подробнее: https://de.wikipedia.org/wiki/Humanity%27s_Last_Exam
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :chelo: :roll: :wink: :muza: :sorry: :angel: :read: *x) :clever:
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Коалиция земли-человечества
    wiki_en » » в форуме Васина Википедия
    0 Ответы
    51 Просмотры
    Последнее сообщение wiki_en
  • Граждане Человечества
    wiki_en » » в форуме Васина Википедия
    0 Ответы
    17 Просмотры
    Последнее сообщение wiki_en
  • Список нематериального культурного наследия человечества в Чили
    wiki_de » » в форуме Васина Википедия
    0 Ответы
    12 Просмотры
    Последнее сообщение wiki_de
  • Квалификационный экзамен HHS
    Гость » » в форуме Васина Википедия
    0 Ответы
    26 Просмотры
    Последнее сообщение Гость
  • Экзамен NABARD класса А
    wiki_en » » в форуме Васина Википедия
    0 Ответы
    22 Просмотры
    Последнее сообщение wiki_en