Основы Data Science и Big Data, Python и наука о данных, Силен Д., Мейсман А., Али М., 2017.
Data Science — это совокупность понятий и методов, позволяющих придать смысл и понятный вид огромным объемам данных.
Каждая из глав этой книги посвящена одному из самых интересных аспектов анализа и обработки данных. Вы начнете с теоретических основ, затем перейдете к алгоритмам машинного обучения, работе с огромными массивами данных, NoSQL, потоковым данным, глубокому анализу текстов и визуализации информации. В многочисленных практических примерах использованы сценарии Python.
Обработка и анализ данных — одна из самых горячих областей ГГ, где постоянно требуются разработчики, которым по плечу проекты любого уровня, от социальных сетей до обучаемых систем. Надеемся, книг а станет отправной точкой для вашего путешествия в увлекательный мир Data Science.
Data science в мире больших данных.
Нод обобщающим термином «большие данные» принято понимать любые наборы данных, достаточно большие и сложные для того, чтобы их можно было обработать традиционными средствами работы с данными (например, РСУБД — реляционными системами управления базами данных). Широко распространенные РСУБД давно считаются универсальным инструментом, но спрос на обработку больших данных показывает иное. В концепцию data science входит использование методов анализа огромных объемов данных и извлечения содержащейся в них информации. Связь между большими данными и data science такая же, как между сырой нефтью и нефтеперерабатывающим заводом. Data science и большие данные развивались на базе статистики и традиционного управления данными, но сейчас считаются разными дисциплинами.
Data science — это расширение статистики, способное справляться с огромными объемами данных, производимыми в наши дни. Data science добавляет методы из computer science в репертуар статистики. В аналитической заметке Лейни и Карта «Emerging Role of the Data Scientist and the Art of Data Science» были проработаны сотни описаний рабочих обязанностей специалистов data science, статистиков и аналитиков бизнес-данных, чтобы выявить различия между этими должностями. Главное, что отличает специалиста data science от статистика, — это умение работать с большими данными и подготовка в области машинного обучения, организации вычислений и построения алгоритмов. Их инструментарии обычно тоже различаются; в описаниях работы специалистов data science чаще упоминается умение использовать Hadoop, Pig, Spark, R, Python и Java (среди прочего). He огорчайтесь, если вас устрашило это перечисление; многие пункты будут постепенно раскрыты в этой книге, хотя основное внимание будет уделено Python. Python — замечательный язык для data science, потому что для него написано много библиотек data science и он широко поддерживается специализированными программами. Например, почти в каждой популярной базе данных NoSL существует программный интерфейс (API) для Python. Из-за этих особенностей, а также из-за возможности быстро строить прототипы на языке Python с сохранением приемлемой производительности его популярность в мире data science быстро растет.
СОДЕРЖАНИЕ.
Предисловие.
Благодарности.
О книге.
Структура книги.
Для кого написана эта книга.
Условные обозначения и загружаемые файлы.
Об авторах.
От издательства.
Глава 1. Data science в мире больших данных.
Глава 2. Процесс data science.
Глава 3. Машинное обучение.
Глава 4. Работа с большими данными на одном компьютере.
Глава 5. Первые шаги в области больших данных.
Глава б. Присоединяйтесь к движению NoSQL.
Глава 7. Графовые базы данных.
Глава 8. Глубокий анализ текста.
Глава 9. Визуализация данных для конечного пользователя.
Приложение А. Настройка Elasticsearch.
А.1. Установка в Linux.
A.2. Установка в Windows.
Приложение Б. Установка Neo4j.
Б.1. Установка в Linux.
Б.2. Установка в Windows.
Приложение В. Установка сервера MySQL.
B.1. Установка в Windows.
В.2. Установка в Linux.
Приложение Г. Установка Anaconda в виртуальной среде.
Г.1. Установка в Linux.
Г.2. Установка в Windows.
Г.3. Настройка среды.
Купить .
Теги: учебник по программированию :: программирование :: Силен :: Мейсман :: Али
Смотрите также учебники, книги и учебные материалы:
- Реактивные веб-сайты, Клиентская оптимизация в алгоритмах и примерах, Мациевский Н.С., Степанишев Е.В., Кондратенко Г.И., 2017
- Программируем Arduino, Профессиональная работа со скетчами, Монк С., 2017
- Программируем Arduino, Основы работы со скетчами, Монк С., 2017
- Отъявленный программист, Лайфхакинг из первых рук, Савчук И., 2016
- Быстрый старт с IDLE Python, Костерин В.В., 2019
- Я иду на урок информатики, Задачи по программированию, 7-11 классы, книга для учителя, Златопольский Д.М., 2001
- Московские олимпиады по программированию, Наумов Б.Н., Брудно А.Л., Каплан Л.И., 1990
- Основы алгоритмизации и программирования в средней школе, Батан Л.В., 2012