В книге рассматриваются модели, системы и фреймворку специально разработанные для обработки и анализа больших наборов данных. Вы познакомитесь с основными парадигмами и механизмами, применяемыми в анализе больших данных, включая MapReduce, рабочие потоки, массовый синхронный параллелизм, передачу сообщений и SQL-подобные модели. В главах книги описаны примеры использования фреймворков Hadoop, Spark, Storm и MPI и рассмотрены вопросы выбора среды, наиболее подходящей для достижения целевых задач приложения.
Книга предназначена разработчикам приложений для работы с большими данными, исследователям и профессионалам бизнеса, основанного на данных. Читатель должен хорошо владеть такими языками, как Java, Python или Scala, и знать основные концепции параллельного и распределенного программирования.

