Data Science, Наука о данных с нуля, Грас Д., 2021.
Книга позволяет изучить науку о данных (Data Science) и применить полученные знания на практике. Она содержит краткий курс языка Python, элементы линейной алгебры, статистики, теории вероятностей, методов обработки данных. Приведены основы машинного обучения. Описаны алгоритмы k ближайших соседей, наивной байесовой классификации, линейной и логистической регрессии, а также модели на основе деревьев принятия решений, нейронных сетей и кластеризации. Рас смотрены приемы обработки естественного языка, методы анализа социальных сетей, основы баз данных, SQL и MapReduce. Во втором издании примеры переписаны на Python 3.6, игрушечные наборы данных заменены на «реальные», добавлены материалы по глубокому обучению и этике данных, статистике и обработке естественного языка, рекуррентным нейронным сетям, векторным вложениям слов и разложению матриц.
Что такое наука о данных?
Существует шутка, что исследователь данных - это тот, кто знает статистику лучше, чем инженер-информатик, а информатику - лучше, чем инженер-статистик. Не утверждаю, что это хорошая шутка, но на самом деле (в практическом плане) некоторые исследователи данных действительно являются инженерами-статистиками, в то время как другие почти неотличимы от инженеров программного обеспечения. Некоторые являются экспертами в области машинного обучения, в то время как другие не смогли бы машинно обучиться, чтобы найти выход из детского сада. Некоторые имеют ученые степени доктора наук с впечатляющей историей публикаций, в то время как другие никогда не читали академических статей (хотя им должно быть стыдно). Короче говоря, в значительной мере не важно, как определять понятие науки о данных, потому что всегда можно найти практикующих исследователей данных, для которых это определение будет всецело и абсолютно неверным.
Оглавление.
Предисловие.
Условные обозначения, принятые в книге.
Использование примеров кода.
Благодарности.
Предисловие к первому изданию.
Наука о данных.
С нуля.
Комментарий переводчика.
Об авторе.
Глава 1.Введение.
Глава 2.Интенсивный курс языка Python.
Глава 3.Визуализация данных.
Глава 4.Линейная алгебра.
Глава 5.Статистика.
Глава 6.Вероятность.
Глава 7.Гипотеза и вывод.
Глава 8.Градиентный спуск.
Глава 9.Получение данных.
Глава 10.Работа с данными.
Глава 11.Машинное обучение.
Глава 12.k ближайших соседей.
Глава 13.Наивный Байес.
Глава 14.Простая линейная регрессия.
Глава 15.Множественная регрессия.
Глава 16.Логистическая регрессия.
Глава 17.Деревья решений.
Глава 18.Нейронные сети.
Глава 19.Глубокое обучение.
Глава 20.Кластеризация.
Глава 21.Обработка естественного языка.
Глава 22.Сетевой анализ.
Глава 23.Рекомендательные системы.
Глава 24.Базы данных и SQL.
Глава 25.Алгоритм MapReduce.
Глава 26.Этика данных.
Глава 27.Идите вперед и займитесь наукой о данных.
Предметный указатель.
Купить .
Теги: Грас :: статистика :: информатика :: обработка данных :: программирование
Смотрите также учебники, книги и учебные материалы:
- PyTorch, Освещая глубокое обучение, Стивенс Э., Антига Л., Виман Т., 2022
- Python и машинное обучение, Машинное и глубокое обучение с использованием Python, scikit-learn и TensorFlow, Рашка С., Мирджалили В., 2020
- Python для data science, Васильев Ю., 2023
- Google BigQuery, Всё о хранилищах данных, аналитике и машинном обучении, Лакшманан В., Тайджани Д., 2021
- Data Science для карьериста, Нолис Ж., Робинсон Э., 2021
- Apache Kafka, Потоковая обработка и анализ данных, Шапира Г., Палино Т., Сиварам Р., Петти К., 2023
- Командная строка Linux, Колисниченко Д.Н., 2023
- Методология и организация информационно-аналитической деятельности, Агафонова М.М., Монахова Г.Е., 2023