Зарегистрироваться
Восстановить пароль
FAQ по входу

Радченко И.А., Николаев И.Н. Технологии и инфраструктура Big Dat

  • Файл формата djvu
  • размером 837,24 КБ
  • Добавлен пользователем
  • Отредактирован
Радченко И.А., Николаев И.Н. Технологии и инфраструктура Big Dat
Учебное пособие. — СПб.: Университет ИТМО, 2018. — 52 с.
В учебном пособии в сжатой форме излагаются основные принципы, подходы и направления технологий и инфраструктуры Big Data. Авторы дают краткий обзор подходов и определений, предоставляют обзор экосистемы Больших данных и раскрывают тему систем.
управления Большими данными. В учебном подобии также представлен краткий обзор областей применения Больших данных и архитектура системы обработки Больших данных. Отдельно рассказывается о Hadoop/MapReduce и параллельных алгоритмах для работы с данными, а также об оборудовании для работы с Большими данными и центрах обработки данных.
В библиографическом списке приведены информационные источники, ссылки на которые встречаются в тексте данного учебного пособия. Представлен также список для самостоятельного изучения предметной области Больших данных.
Учебное пособие прежде всего ориентировано на студентов факультета технологического менеджмента и инноваций, и может быть полезным для студентов других факультетов и всех заинтересованных в технологиях Big Data лиц.
Содержание
Введение
Данные. Подходы и определения
Определения данных
Философский подход
Юридический подход
Жизненный цикл данных
Создание данных (Data Generation/Data Capture)
Обслуживание данных (Data Maintenance)
Синтез данных (Data Synthesis)
Использование данных (Data Usage)
Публикация данных (Data Publication)
Архивация данных (Data Archival)
Уничтожение данных (Data Purging)
Метаданные
Понятие метаданных
Жизненный цикл метаданных
Оценка требований и анализ контента
Спецификация системных требований
Система метаданных
Сервис и оценка
Большие данные. Системы управления Большими данными
Распределенные файловые системы
Распределенные фреймворки
Бенчмаркинг
Серверное программирование
Планирование
Системы развертывания
Интеграция данных
Информационная безопасность
Машинное обучение
Базы данных NoSQL и новые SQL базы данных
Архитектура системы обработки Больших данных
Прием данных (Data Ingestion)
Сбор данных (Data Staging)
Анализ данных (Analysis Layer)
Представление результатов (Consumption Layer)
Параллельные алгоритмы для работы с данными
Операторы Map и Reduce
Оператор Reduce (свертка)
Оператор Map
Лямбда-архитектура
Программные платформы и системы для Больших данных
Системы управления потоками данных
Системы хранения Больших данных
Платформы Больших данных
Обработка данных в реальном времени
Системы управления Большими данными
Аналитические платформы
Оборудование для обработки Больших данных
Центры обработки Больших данных

Вопросы для проверки
Заключение
Библиографический список
Список информационных источников для самостоятельной работы
  • Чтобы скачать этот файл зарегистрируйтесь и/или войдите на сайт используя форму сверху.
  • Регистрация