Эффективный Spark, масштабирование и оптимизация, Карау Х., Уоррен Р., 2018.
Если у вас уже есть положительный опыт использования Spark для решения небольших задач, но вы по-прежнему ломаете голову — где та самая непревзойденная производительность Spark, позволяющая перемалывать колоссальные объемы данных, — то эта книга для вас. Она расскажет, как эффективно использовать Spark для укрощения больших данных и вырасти из новичка в специалиста. Идеально подходит для программистов, инженеров по работе с данными, системных администраторов, обслуживающих крупномасштабные приложения.
Предисловие.
Мы написали эту книгу для дата-инженеров (data engineers) и ученых по данным (data scientists), которым хотелось бы извлечь максимальную пользу из фреймворка Spark. Если вы работаете со Spark и вложили в его освоение немало усилий, но погрязли в ошибках памяти и загадочных, перемежающихся сбоях, наша книга для вас. Если вы применяли Spark в какой-либо исследовательской деятельности или экспериментировали с ним, не используя для конкретных производственных задач, и запустить фреймворк в работу мешает недостаточная уверенность в уровне его освоения, то это издание может помочь. Если вы энтузиаст Spark, но не сумели добиться от него ожидаемого повышения производительности, то мы надеемся, что вы найдете здесь ответы на свои вопросы. Книга предназначена для тех, кто уже пользовался Spark, и может оказаться не вполне понятной тем, кто до сих пор мало работал с этим фреймворком или с распределенными вычислениями либо вообще не имел с ними дела. В разделе «Вспомогательная литература и материалы» чуть ниже можно найти рекомендации по книгам для начинающих.
Краткое содержание.
Предисловие.
Глава 1. Введение в эффективный Spark.
Глава 2. Как работает Spark.
Глава 3. Наборы DataFrame/Dataset и Spark SQL.
Глава 4. Соединения (SQL и Core).
Глава 5. Эффективные преобразования.
Глава 6. Работа с данными типа «ключ — значение».
Глава 7. Выходим за рамки Scala.
Глава 8. Тестирование и валидация.
Глава 9. Spark MLlib и ML.
Глава 10. Компоненты и пакеты фреймворка Spark.
Приложение. Тонкая настройка, отладка и другие аспекты,обычно игнорируемые разработчиками.
Купить .
Теги: Карау :: Уоррен :: 2018 :: Spark :: программирование
Смотрите также учебники, книги и учебные материалы:
- Алгоритмы и структуры данных, Извлечение информации на языке Java, Доуни А.Б., 2018
- Математическое программирование, Теория и методы, Гредасова Н.В., Сесекин А.Н., Шориков А.Ф., Плескунов М.А., 2020
- Теория автоматического управления в примерах и задачах с решениями в MATLAB, Гайдук А.Р., Беляев В.Е., Пьявченко Т.А., 2016
- Цифровая обработка сигналов на системном уровне с использованием LabVIEW, Кехтарнаваз Н., Ким Н., 2007
- Эволюционная архитектура, поддержка непрерывных изменений, Нил Ф., Ребекка П., Патрик К., 2019
- Чистый код, создание, анализ и рефакторинг, библиотека программиста, Мартин Р., 2013
- Чистый код, создание, анализ и рефакторинг, библиотека программиста, Мартин Р., 2010
- Паттерны проектирования, Фримен Э., Фримен Э., Сьерра К., Бейтс Б., 2011