'''Риджевая функция''' — это многомерная функция f:\R^d\rightarrow\R, которая получается в результате композиции одномерной функции g:\R \rightarrow\R с аффинным отображением|аффинным отображением x^{\top} a + b : \mathbb{R}^d \to \mathbb{R} возникает:
f(x) = g(x^{\top} a + b), \quad for x\in\R^d.
Здесь g упоминается как «функция профиля», a как «вектор направления» и b как «смещение».
Прямой перевод Gratfunktion или Kammfunktion в немецком языке не прижился.
=== Случаи ===
Ридж-функции играют, среди прочего, важную роль в проекционном преследовании, обобщенных линейных моделях и в качестве функций активации в нейронных сетях. Подробные объяснения ридж-функций см. в книгах Пинкуса и Исмаилова.
== Свойства ==
=== Неоднозначное представление ===
Представление ридж-функции обычно не уникально. Для
\lambda \neq 0, определите функцию профиля \tilde g(t) :=g(t/\lambda), а также вектор направления \tilde a := \lambda a и смещение \tilde b := \lambda b , который возвращает ту же функцию гребня
g(a^\top x+b)
=
g \big( \tfrac{1}{\lambda} (\lambda a)^\top x+\lambda b \big) = \tilde g( { \tilde a}^\top x+ \tilde b) .
Уникальность можно обеспечить путем нормализации a, например a^{\top} a = 1 .
=== Разложение по направлениям и ортогональным пространствам ===
Для a\neq 0 пространство \mathbb R^n можно разложить в направлении a и пространства, ортогонального ему: \mathbb R^n = \operatorname{span}\{a\} \oplus \operatorname{span}\{ \psi_1, ..., \psi_{d-1} \} .
Функция ridge изменяется только в направлении a. Значение остается постоянным во всех направлениях, перпендикулярных a. Таким образом, их наборы уровней представляют собой параллельные гиперплоскости, поэтому для нормализованных a^{\top} a = 1 и x = \alpha \, применяется a + \sum_{j=1}^{d-1} \beta_j \psi_{j}
f(x)=g(a^\top x+b) = g(\alpha +b),
Следовательно, необходимо знать только пропорцию в направлении a.
=== Градиент ===
Если функция профиля g дифференцируема, то и ридж-функция также дифференцируема. По правилу цепочки
\набла f(x)
=
g'(a^\top x+b)\,a .
Таким образом, градиент является скалярным кратным вектора направления a в каждой точке. Поэтому направление наибольшего изменения всегда параллельно a.
=== Гладкость ===
Гладкость функции гребня наследуется от функции профиля.
Если g\in C^k(\mathbb R) соответствует k\in \mathbb N_0\cup\{\infty\, то для f(x)=g(a^\top x+b) также f\in C^k(\mathbb R^n).
Это следует из правила цепочки, поскольку рисунок
x\mapsto a^\top x+b
аффинный и, следовательно, гладкий. Следующее относится, в частности, к частным производным:
\partial^\alpha f(x)
=
g^{(|\alpha|)}(a^\top x+b)\,a^\alpha
для всех мультииндексов \alpha с |\alpha|\leq k.
Категория:Вычислительная математика
Категория:Линейная алгебра
Подробнее: https://de.wikipedia.org/wiki/Ridge-Funktion
Функция гребня ⇐ Васина Википедия
-
Автор темыwiki_de
- Всего сообщений: 60390
- Зарегистрирован: 13.01.2023
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
Мобильная версия