Информационно-поисковая система Elasticsearch: учебное пособие
Автор
Пруцков Александр Викторович
Аннотация
Это учебное пособие раскроет принципы работы современных информационно-поисковых систем и расскажет, как работать с ними. Вы научитесь загружать, искать и анализировать данные в системе Elasticsearch. В этом помогут более 120 примеров с пояснениями.
Предназначено для проведения лекционных и практических занятий, лабораторных работ, курсового проектирования магистрантов направления 09.04.04 «Программная инженерия» по дисциплине «Информационно-поисковые системы», а также всех желающих погрузиться в увлекательный мир информационно-поисковых систем.
Библиографическая ссылка
Учебное пособие разделено на два тома.
Пруцков А.В. Информационно-поисковая система Elasticsearch: учеб. пособие: в 2 т. – Рязань: РГРТУ, 2023. – Т. 1. – 172 с.
Пруцков А.В. Информационно-поисковая система Elasticsearch: учеб. пособие: в 2 т. – Рязань: РГРТУ, 2023. – Т. 2. – 184 с.
Оставить отзыв об учебном пособии
Листинги из учебного пособия
Пока недоступны
Оглавление
Предисловие
Часть I. Информационно-поисковые системы
Информационный поиск
Язык информационного поиска
Информация и данные
Информационные потребности
Документ и коллекция
Терм
Поисковый запрос и результаты поиска
Релевантность
Библиографические заметки
Метрология информационного поиска
Метрики и функциональные зависимости информационного поиска
Расстояние Левенштейна
Точность и полнота поиска
Частота терма и обратная частота терма в документах
Закон Хипса
Закон Зипфа
Параметр PageRank
Задания
Библиографические заметки
Информационно-поисковые системы
Назначение
Составные блоки
Агент
Хранилище веб-страниц
Индексатор
Прямой индекс
Обратный индекс
Обработчик поисковых запросов
Задания
Библиографические заметки
Что еще нужно знать перед началом практической работы с информационно-поисковой системой?
Кодирование Base64
Стандарт ASCII
Формат CSV
Формат JSON
Трехуровневая архитектура веб-приложений
Архитектурный стиль REST
Математическая статистика
Библиографические заметки
Часть II. Концепция комплекса программ Elastic Stack
Комплекс программ Elastic Stack – системы Elasticsearch, Logstash и Kibana
Описание
Назначение
Взаимодействие систем
Установка
Запуск
Первый запрос к системе Elasticsearch
Библиографические заметки
Концептуальные понятия системы Elasticseach
Документ
Индекс
Узел
Кластер
Сегмент
Кластер в действии
Библиографические заметки
Запрос
Структура и общий вид
Методы запросов
Настройка представления ответа на запрос с помощью параметров заголовка запроса
Получение параметров и состояния кластера и узлов
Выясняем, что такое кластер и узел на практике
Кластер
Узлы
Соглашение об именовании элементов и исходные данные для примеров
Что такое соглашение об именовании и зачем оно нужно?
Соглашение об именовании элементов
Предметная область и данные
Библиографические заметки
Система Logstash и загрузка данных в систему Elasticsearch
Порядок загрузки данных в систему Elasticsearch c помощью системы Logstash
Общий вид конфигурации загрузки данных
Конфигурация загрузки описаний книг
Запуск загрузки описаний книг в систему Elasticsearch
Особенности полей документов в системе Elasticsearch, загруженных системой Logstash
Библиографические заметки
Часть III. Операции с документами и индексами в системе Elasticsearch
Операции с индексами
Создание
Просмотр
Переиндексирование
Закрытие и открытие
Удаление
Просмотр настроек индекса
Что такое шаблон wildcard?
Библиографические заметки
Операции с документами
Создание
Параметры ответов на запросы операций с документами
Как параметры _seq_no и _primary_term повышают надежность хранения данных?
Получение документа по идентификатору
Обновление
Удаление
Библиографические заметки
Операции со структурой документа индекса
Структура документа в системе Elasticsearch
Динамическое и явное определение структуры документа
Явное определение структуры документа
Составные типы данных
Просмотр структуры документа
Просмотр поля в структуре документа
Рекомендации по выбору типа поля
Библиографические заметки
Индексирование
Индексатор
Тестирование индексатора, делителя текста на термы, фильтров символов и термов
Просмотр термов проиндексированного документа
Фильтрация символов
Разделение текста на термы
Фильтрация термов
Индексаторы системы Elasticsearch
Создание пользовательского индексатора в настройках индекса
Изменение структуры документа с добавлением индексатора к полю
Библиографические заметки
Часть IV. Поиск и агрегация в системе Elasticsearch
Команда _search
Назначение, общий вид и параметры
Параметры ответа на запрос с командой _search
Параметр _source
Параметр fields
Параметр stored_fields
Параметр sort
Параметры from и size
Индекс релевантности и его вычисление
Библиографические заметки
Параметр query
Назначение и общий вид
Контекст запроса и контекст фильтра
Полнотекстовый поиск и поиск термов, структуры данных для них
Поисковые запросы параметра query
Поисковый запрос match
Поисковый запрос match_phrase
Поисковый запрос match_phrase_prefix
Поисковый запрос match_bool_prefix
Поисковый запрос query_string
Поисковый запрос multi_match
Поисковый запрос more_like_this
Поисковый запрос term
Поисковый запрос terms
Поисковый запрос range
Поисковый запрос ids
Поисковый запрос exists
Логический поисковый запрос
Поиск с помощью мультиполей
Использование индексаторов для поиска по мультиполям и текстов запросов
Библиографические заметки
Агрегация
Назначение, определение, категории и общий вид
Возможности агрегации
Как исключить результаты поиска из ответов на запросы агрегации?
Статистические агрегации
Агрегация по группам
Вложенные агрегации
Отбор документов и результатов агрегации, конвейерные агрегации
Библиографические заметки
Тонкости настройки поиска и операций с документами
То, о чем еще стоит сказать
Шинглы
Выделение термов из текста запроса в тексте найденного документа
Получение расчета значения индекса релевантности
Автозавершение текста
Ускорение фильтрации в логическом запросе с помощью поля типа constant_keyword
Выполнение нескольких запросов в одном запросе
Удаление по запросу
Библиографические заметки
Часть V. Заключение
Это также необходимо знать
Идеальная информационно-поисковая система
Библиографический список
Информационный поиск и информационно-поисковые системы
Elastic Stack, Apache Lucene и Apache Solr
Документация Elastic Stack
Применение Elastic Stack для решения прикладных задач
Формат JSON
Архитектура программных систем
Архитектурный стиль REST
Алгоритмы и структуры данных
Язык программирования Java
Регулярные выражения
Стандарты
Остальные
Приложение 1. Книги для примеров поиска и агрегации, их параметры
П1.1. Параметры книги
П1.2. Набор книг
Приложение 2. Используемая терминология и ее перевод на английский язык