Информационно-поисковая система Elasticsearch: учебное пособие

Информационно-поисковая система Elasticsearch

Автор

Пруцков Александр Викторович

Аннотация

Это учебное пособие раскроет принципы работы современных информационно-поисковых систем и расскажет, как работать с ними. Вы научитесь загружать, искать и анализировать данные в системе Elasticsearch. В этом помогут более 120 примеров с пояснениями.

Предназначено для проведения лекционных и практических занятий, лабораторных работ, курсового проектирования магистрантов направления 09.04.04 «Программная инженерия» по дисциплине «Информационно-поисковые системы», а также всех желающих погрузиться в увлекательный мир информационно-поисковых систем.

Библиографическая ссылка

Учебное пособие разделено на два тома.

Пруцков А.В. Информационно-поисковая система Elasticsearch: учеб. пособие: в 2 т. – Рязань: РГРТУ, 2023. – Т. 1. – 172 с.

Пруцков А.В. Информационно-поисковая система Elasticsearch: учеб. пособие: в 2 т. – Рязань: РГРТУ, 2023. – Т. 2. – 184 с.

Оставить отзыв об учебном пособии

Листинги из учебного пособия

Пока недоступны

Оглавление

  1. Предисловие
  2. Часть I. Информационно-поисковые системы
    1. Информационный поиск
      1. Язык информационного поиска
      2. Информация и данные
      3. Информационные потребности
      4. Документ и коллекция
      5. Терм
      6. Поисковый запрос и результаты поиска
      7. Релевантность
      8. Библиографические заметки
    2. Метрология информационного поиска
      1. Метрики и функциональные зависимости информационного поиска
      2. Расстояние Левенштейна
      3. Точность и полнота поиска
      4. Частота терма и обратная частота терма в документах
      5. Закон Хипса
      6. Закон Зипфа
      7. Параметр PageRank
      8. Задания
      9. Библиографические заметки
    3. Информационно-поисковые системы
      1. Назначение
      2. Составные блоки
      3. Агент
      4. Хранилище веб-страниц
      5. Индексатор
      6. Прямой индекс
      7. Обратный индекс
      8. Обработчик поисковых запросов
      9. Задания
      10. Библиографические заметки
    4. Что еще нужно знать перед началом практической работы с информационно-поисковой системой?
      1. Кодирование Base64
      2. Стандарт ASCII
      3. Формат CSV
      4. Формат JSON
      5. Трехуровневая архитектура веб-приложений
      6. Архитектурный стиль REST
      7. Математическая статистика
      8. Библиографические заметки
  3. Часть II. Концепция комплекса программ Elastic Stack
    1. Комплекс программ Elastic Stack – системы Elasticsearch, Logstash и Kibana
      1. Описание
      2. Назначение
      3. Взаимодействие систем
      4. Установка
      5. Запуск
      6. Первый запрос к системе Elasticsearch
      7. Библиографические заметки
    2. Концептуальные понятия системы Elasticseach
      1. Документ
      2. Индекс
      3. Узел
      4. Кластер
      5. Сегмент
      6. Кластер в действии
      7. Библиографические заметки
    3. Запрос
      1. Структура и общий вид
      2. Методы запросов
      3. Настройка представления ответа на запрос с помощью параметров заголовка запроса
    4. Получение параметров и состояния кластера и узлов
      1. Выясняем, что такое кластер и узел на практике
      2. Кластер
      3. Узлы
    5. Соглашение об именовании элементов и исходные данные для примеров
      1. Что такое соглашение об именовании и зачем оно нужно?
      2. Соглашение об именовании элементов
      3. Предметная область и данные
      4. Библиографические заметки
    6. Система Logstash и загрузка данных в систему Elasticsearch
      1. Порядок загрузки данных в систему Elasticsearch c помощью системы Logstash
      2. Общий вид конфигурации загрузки данных
      3. Конфигурация загрузки описаний книг
      4. Запуск загрузки описаний книг в систему Elasticsearch
      5. Особенности полей документов в системе Elasticsearch, загруженных системой Logstash
      6. Библиографические заметки
  4. Часть III. Операции с документами и индексами в системе Elasticsearch
    1. Операции с индексами
      1. Создание
      2. Просмотр
      3. Переиндексирование
      4. Закрытие и открытие
      5. Удаление
      6. Просмотр настроек индекса
      7. Что такое шаблон wildcard?
      8. Библиографические заметки
    2. Операции с документами
      1. Создание
      2. Параметры ответов на запросы операций с документами
      3. Как параметры _seq_no и _primary_term повышают надежность хранения данных?
      4. Получение документа по идентификатору
      5. Обновление
      6. Удаление
      7. Библиографические заметки
    3. Операции со структурой документа индекса
      1. Структура документа в системе Elasticsearch
      2. Динамическое и явное определение структуры документа
      3. Явное определение структуры документа
      4. Составные типы данных
      5. Просмотр структуры документа
      6. Просмотр поля в структуре документа
      7. Рекомендации по выбору типа поля
      8. Библиографические заметки
    4. Индексирование
      1. Индексатор
      2. Тестирование индексатора, делителя текста на термы, фильтров символов и термов
      3. Просмотр термов проиндексированного документа
      4. Фильтрация символов
      5. Разделение текста на термы
      6. Фильтрация термов
      7. Индексаторы системы Elasticsearch
      8. Создание пользовательского индексатора в настройках индекса
      9. Изменение структуры документа с добавлением индексатора к полю
      10. Библиографические заметки
  5. Часть IV. Поиск и агрегация в системе Elasticsearch
    1. Команда _search
      1. Назначение, общий вид и параметры
      2. Параметры ответа на запрос с командой _search
      3. Параметр _source
      4. Параметр fields
      5. Параметр stored_fields
      6. Параметр sort
      7. Параметры from и size
      8. Индекс релевантности и его вычисление
      9. Библиографические заметки
    2. Параметр query
      1. Назначение и общий вид
      2. Контекст запроса и контекст фильтра
      3. Полнотекстовый поиск и поиск термов, структуры данных для них
      4. Поисковые запросы параметра query
      5. Поисковый запрос match
      6. Поисковый запрос match_phrase
      7. Поисковый запрос match_phrase_prefix
      8. Поисковый запрос match_bool_prefix
      9. Поисковый запрос query_string
      10. Поисковый запрос multi_match
      11. Поисковый запрос more_like_this
      12. Поисковый запрос term
      13. Поисковый запрос terms
      14. Поисковый запрос range
      15. Поисковый запрос ids
      16. Поисковый запрос exists
      17. Логический поисковый запрос
      18. Поиск с помощью мультиполей
      19. Использование индексаторов для поиска по мультиполям и текстов запросов
      20. Библиографические заметки
    3. Агрегация
      1. Назначение, определение, категории и общий вид
      2. Возможности агрегации
      3. Как исключить результаты поиска из ответов на запросы агрегации?
      4. Статистические агрегации
      5. Агрегация по группам
      6. Вложенные агрегации
      7. Отбор документов и результатов агрегации, конвейерные агрегации
      8. Библиографические заметки
    4. Тонкости настройки поиска и операций с документами
      1. То, о чем еще стоит сказать
      2. Шинглы
      3. Выделение термов из текста запроса в тексте найденного документа
      4. Получение расчета значения индекса релевантности
      5. Автозавершение текста
      6. Ускорение фильтрации в логическом запросе с помощью поля типа constant_keyword
      7. Выполнение нескольких запросов в одном запросе
      8. Удаление по запросу
      9. Библиографические заметки
  6. Часть V. Заключение
    1. Это также необходимо знать
    2. Идеальная информационно-поисковая система
  7. Библиографический список
    1. Информационный поиск и информационно-поисковые системы
    2. Elastic Stack, Apache Lucene и Apache Solr
    3. Документация Elastic Stack
    4. Применение Elastic Stack для решения прикладных задач
    5. Формат JSON
    6. Архитектура программных систем
    7. Архитектурный стиль REST
    8. Алгоритмы и структуры данных
    9. Язык программирования Java
    10. Регулярные выражения
    11. Стандарты
    12. Остальные
  8. Приложение 1. Книги для примеров поиска и агрегации, их параметры
    1. П1.1. Параметры книги
    2. П1.2. Набор книг
  9. Приложение 2. Используемая терминология и ее перевод на английский язык