Отстой (алгоритмы поиска) ⇐ Васина Википедия
-
Автор темыwiki_en
- Всего сообщений: 111062
- Зарегистрирован: 16.01.2024
Отстой (алгоритмы поиска)
'''Slop''' (или '''slop sum''') — это параметр в алгоритмах поиска информации и полнотекстового поиска, который определяет максимальное количество позиций, на которые слова в запросе могут перемещаться для соответствия документу. Он преобразует строгое «фразовое совпадение» в «поиск по близости», допуская пропущенные слова, дополнительные слова или изменения в порядке слов в пределах указанного «расстояния редактирования» терминов.
Этот термин в основном используется в поисковых системах на основе Apache Lucene, таких как Elasticsearch и OpenSearch (программное обеспечение)|OpenSearch.
== Механизм ==
При стандартном фразовом совпадении (отклонение равно 0) поисковая система требует, чтобы токены появлялись в точной последовательности, хранящейся в инвертированном индексе. При применении значения наклона алгоритм вычисляет количество «ходов», необходимых для изменения условий документа в соответствии с условиями запроса.
=== Транспонирование слов ===
Примечательной особенностью slop в системах на основе Lucene является то, как он обрабатывает обратный порядок слов. Чтобы поменять местами два соседних слова (например, сопоставление «лиса быстрая» с запросом «быстрая лиса»), требуется наклон не менее 2. # Первый ход ставит два слова в одну и ту же позицию.
# Второй ход сдвигает одно слово за другое, чтобы завершить транспозицию.
== Примеры ==
Учитывая поисковый запрос * '''Slop 0:''' Соответствует только точной фразе "quick fox". * '''Отстой 1:''' Соответствует «быстрой бурой лисе» (слово «коричневая» пропускается, требуется 1 ход).
* '''Отстой 2:''' Соответствует «быстрой коричневой ленивой лисе» (2 хода) или перевернутой «быстрой лисице» (2 хода).
== Приложения ==
Slop используется для повышения точности и запоминаемости результатов поиска за счет учета человеческих ошибок, различных стилей письма или присутствия стоп-слов, которые могли быть опущены в индексе. Это позволяет разработчикам сбалансировать точность поиска по фразе и гибкость поиска по ключевым словам.
== См. также ==
* Примерное совпадение строк
* Редактировать расстояние
* Расстояние Левенштейна
Алгоритмы поиска
Поиск информации
Подробнее: https://en.wikipedia.org/wiki/Slop_(search_algorithms)
'''Slop''' (или '''slop sum''') — это параметр в алгоритмах поиска информации и полнотекстового поиска, который определяет максимальное количество позиций, на которые слова в запросе могут перемещаться для соответствия документу. Он преобразует строгое «фразовое совпадение» в «поиск по близости», допуская пропущенные слова, дополнительные слова или изменения в порядке слов в пределах указанного «расстояния редактирования» терминов.
Этот термин в основном используется в поисковых системах на основе Apache Lucene, таких как Elasticsearch и OpenSearch (программное обеспечение)|OpenSearch.
== Механизм ==
При стандартном фразовом совпадении (отклонение равно 0) поисковая система требует, чтобы токены появлялись в точной последовательности, хранящейся в инвертированном индексе. При применении значения наклона алгоритм вычисляет количество «ходов», необходимых для изменения условий документа в соответствии с условиями запроса.
=== Транспонирование слов ===
Примечательной особенностью slop в системах на основе Lucene является то, как он обрабатывает обратный порядок слов. Чтобы поменять местами два соседних слова (например, сопоставление «лиса быстрая» с запросом «быстрая лиса»), требуется наклон не менее 2. # Первый ход ставит два слова в одну и ту же позицию.
# Второй ход сдвигает одно слово за другое, чтобы завершить транспозицию.
== Примеры ==
Учитывая поисковый запрос * '''Slop 0:''' Соответствует только точной фразе "quick fox". * '''Отстой 1:''' Соответствует «быстрой бурой лисе» (слово «коричневая» пропускается, требуется 1 ход).
* '''Отстой 2:''' Соответствует «быстрой коричневой ленивой лисе» (2 хода) или перевернутой «быстрой лисице» (2 хода).
== Приложения ==
Slop используется для повышения точности и запоминаемости результатов поиска за счет учета человеческих ошибок, различных стилей письма или присутствия стоп-слов, которые могли быть опущены в индексе. Это позволяет разработчикам сбалансировать точность поиска по фразе и гибкость поиска по ключевым словам.
== См. также ==
* Примерное совпадение строк
* Редактировать расстояние
* Расстояние Левенштейна
Алгоритмы поиска
Поиск информации
Подробнее: https://en.wikipedia.org/wiki/Slop_(search_algorithms)
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
Мобильная версия