Spark для профессионалов, современные паттерны обработки больших данных, Риза С., Лезерсон У., Оуэн Ш., Уилле Д., 2017

Spark для профессионалов, современные паттерны обработки больших данных, Риза С., Лезерсон У., Оуэн Ш., Уилле Дж., 2017.

В этой практичной книге четверо специалистов Cloudera по анализу данных описывают самодостаточные паттерны для выполнения крупномасштабного анализа данных при помощи Spark. Авторы комплексно рассматривают Spark, статистические методы и множества данных, собранные в реальных условиях, и на этих примерах демонстрируют решения распространенных аналитических проблем.

Spark для профессионалов, современные паттерны обработки больших данных, Риза С., Лезерсон У., Оуэн Ш., Уилле Дж., 2017



Что вы найдете в этой книге.

Глава 1 покажет место Spark в более широком контексте науки о данных и аналитики больших данных. В дальнейшем каждая глава будет содержать самодостаточный пример анализа с помощью Spark. Глава 2 познакомит вас с основами обработки данных на Spark и Scala на примере очистки данных. Следующие несколько глав охватывают важнейшие темы машинного обучения с помощью Spark, включая некоторые из наиболее распространенных алгоритмов в приложениях, независимых от конечной реализации. Оставшиеся главы больше напоминают сборную солянку и демонстрируют применение Spark в несколько более экзотических приложениях, которые, например, выполняют запросы к «Википедии» через латентные семантические связи в тексте или анализируют геномные данные.

Краткое содержание.

Предисловие.
Введение.
Глава 1. Анализ больших данных.
Глава 2. Введение в анализ данных с помощью Scala и Spark.
Глава 3. Рекомендация музыки и набор данных сервиса AudioScrobbler.
Глава 4. Прогнозирование лесного покрова с использованием деревьев принятия решений.
Глава 5. Обнаружение аномалий сетевого трафика с помощью кластеризации методом k-средних.
Глава 6. Описание «Википедии» с помощью латентно-семантического анализа.
Глава 7. Анализ сетей совместной встречаемости с помощью GraphX.
Глава 8. Анализ геопространственных и временных данных на примере поездок нью-йоркских такси.
Глава 9. Оценка финансовых рисков с помощью моделирования по методу Монте-Карло.
Глава 10. Анализ геномных данных и проект BDG.
Глава 11. Анализ нейровизуальных данных с помощью PySpark и Thunder.
Приложение A. Spark: копнем поглубже.
Приложение Б. Новый API конвейеров библиотеки MLlib.



Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
Скачать книгу Spark для профессионалов, современные паттерны обработки больших данных, Риза С., Лезерсон У., Оуэн Ш., Уилле Д., 2017 - fileskachat.com, быстрое и бесплатное скачивание.

Скачать pdf
Ниже можно купить эту книгу по лучшей цене со скидкой с доставкой по всей России.Купить эту книгу



Скачать - pdf - Яндекс.Диск.
Дата публикации:





Теги: :: :: :: :: :: :: ::


Следующие учебники и книги:
Предыдущие статьи:


 


 

Книги, учебники, обучение по разделам




Не нашёл? Найди:





2024-11-21 18:57:05