Учебное пособие рассматривает вопросы, связанные с анализом данных: модели, алгоритмы, методы и их реализацию на языке Python. Особое внимание уделено анализу временных рядов. Книга предназначена для студентов группы направлений 09, а также для студентов других групп направлений, изучающих дисциплины, связанные с разработкой приложений в области анализа данных, в том числе TimeSeriesDataMinig и DataMining.
Кодирование нечисловых признаков.
Очевидно, что далеко не все признаки объектов естественно описываются численным значением. Если говорить о размерах объекта или стоимости какого-то товара, то эти признаки, несомненно, будут числовыми. Если же речь идет о цвете, типе товара (категории) или вообще о текстовом описании некоторого объекта, то подобные признаки, как правило, поступают неоцифрованными.
Нечисловые признаки с неупорядоченными значениями (в которых между значениями не определена дистанция, то есть нельзя сказать, что больше или меньше) называют категориальными, или номинальными. Типичный подход к их обработке - кодирование категориального признака с m возможными значениями с помощью m бинарных признаков. Каждый бинарный признак соответствует одному из возможных значений категориального признака и является индикатором того, что на данном объекте он принимает данное значение. Такой подход иногда называют one-hot-кодированием. Например, у нас есть три варианта материала изделия: дерево, пластик, сталь. Причем мы не знаем наверняка, что лучше, а что хуже и как это материал влияет на итоговое качество товара. Тогда вместо того, чтобы закодировать набор матриалов в один столбец как значения 1, 2, 3, one-hot-кодирование даст три столбца и следующие коды: 001, 010, 100. Заметьте, что это не двоичное кодирование.
Содержание.
Введение.
О задачах машинного обучения.
Пространство признаков.
Формальное определение понятия «обучение».
Общий алгоритм машинного обучения.
Типы задач машинного обучения.
Способы обучения и оценки его качества.
Типовые задачи при подготовке данных и обучении моделей.
Учет пропусков.
Кодирование нечисловых признаков.
Приведение данных к единому масштабу и стандартизация.
Разметка данных.
Переобучение.
Модели и алгоритмы машинного обучения.
Методы теории вероятностей.
Деревья решений.
Статистические модели и методы.
Модели и методы нечеткой логики.
Нечеткие множества.
Лингвистические переменные.
Операции нечеткой логики.
Нечеткие системы.
Нечеткая логика в анализе временных рядов.
Метод моделирования нечетких временных рядов.
Пример моделирования временного ряда в нечетком подходе.
Извлечение знаний из временных рядов.
Нечеткое сглаживание временного ряда.
Нечеткая регрессия.
ACL-шкала и нечеткая кластеризация объектов.
Искусственные нейронные сети.
Особенности нейронных сетей.
Определение модели искусственной нейронной сети.
Первая формальная модель и первая реализация нейронной сети.
Многослойный персептрон (MLP).
Сверточные (ConvolutionalNeuralNet) и Глубокие (DeepNet) Сети Карты (ART, SFAM).
Рекуррентные сети (Recurrent Neural Network).
Самоорганизующиеся карты (Self-organization map, SOM).
Автокодировщики (AutoEncoder).
Импульсные (Спайковые) сети.
Причины бурного развития ИНС сегодня.
Борьба с переобучением в ИНС.
Обратное распространение ошибки.
Нечеткие нейронные сети.
Генетические алгоритмы.
Нечеткие системы с генетической настройкой.
Нечеткие нейронные сети с генетическим проектированием.
Генетическая оптимизация F-преобразования временных рядов.
Разработка приложений в сфере машинного обучения.
Основы работы с Python.
Элементарные операции с данными.
Работа с DataFrame.
Предобработка данных. Стандартизация и нормализация.
Работа с деревьями решений.
Работа с линейной регрессией.
Сохранение и загрузка обученной модели.
Работа с логистической регрессией.
Ранение задачи ранжирования признаков.
Работа с полиномиальной регрессией.
Работа с простейшими моделями нейронных сетей.
Реализация алгоритма обучения нейронной сети.
Регуляризация и сеть прямого распространения.
Работа с библиотеками Keras и Theano. Настройка под Windows.
Получение данных средствами Keras.
Создание и обучение модели сверточной сети.
Загрузка и сохранение сложных моделей.
Рекуррентные сети для прогнозирования временных рядов.
Контрольные вопросы и тестовые задания.
Тест «Общие сведения о машинном обучении».
Проблема переобучения.
Регрессия.
Модели и методы нечеткой логики.
Нечеткие временные ряды.
Нечеткая регрессия.
Генетические алгоритмы.
Нечеткая кластеризация.
Искусственные нейронные сети и глубинное обучение.
Тест «Искусственные нейронные сети».
Практические задания.
Работа с файлом данных Титаника.
Работа по отбору признаков.
Многослойный персептрон.
Реализация алгоритма обратного распространения ошибки.
Регуляризация и сеть прямого распространения.
Сравнение эффективности моделей из библиотеки Keras.
Работа с библиотекой OpenCV.
Нечеткая логика.
Генетические алгоритмы.
Нечеткая кластеризация объектов.
Анализ временных рядов.
Работа с рекуррентными сетями.
Заключение.
Глоссарий.
Предметный указатель.
Библиографический список.
Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
Скачать книгу Теория и практика машинного обучения, Воронина В.В., Михеев А.В., Ярушкина Н.Г., Святов К.В., 2017 - fileskachat.com, быстрое и бесплатное скачивание.
Скачать файл № 1 - pdf
Скачать файл № 2 - djvu
Ниже можно купить эту книгу по лучшей цене со скидкой с доставкой по всей России.Купить эту книгу
Скачать - djvu - Яндекс.Диск.
Скачать - pdf - Яндекс.Диск.
Дата публикации:
Теги: учебник по информатике :: информатика :: компьютеры :: Воронина :: Михеев :: Ярушкина :: Святов
Смотрите также учебники, книги и учебные материалы:
Следующие учебники и книги:
- Информатика, 9 класс, Котов В.М., Лапо А.И., Быкадоров Ю.А., Войтехович Е.Н., 2019
- Цифровизация, Турко С., 2019
- Компьютерные инструменты в образовании, 2019
- Аудит безопасности информационных систем, Скабцов Н., 2018
Предыдущие статьи:
- Совершенный алгоритм, Основы, Рафгарден Т., 2019
- Генетические алгоритмы, Панченко Т.В., 2007
- Основы теории алгоритмов, Поляков В.И., Скорубский В.И., 2012
- Нейронные сети и нейроконтроллеры, Бураков М.В., 2013