Прикладной анализ текстовых данных на Python, машинное обучение и создание приложений обработки естественного языка, Бенгфорт Б., Билбро Р., Охеда Т., 2019.
Технологии анализа текстовой информации стремительно меняются под влиянием машинного обучения. Нейронные сети из теоретических научных исследований перешли в реальную жизнь, и анализ текста активно интегрируется в программные решения. Нейронные сети способны решать самые сложные задачи обработки естественного языка, никого не удивляет машинный перевод, «беседа» с роботом в интернет-магазине, перефразирование, ответы на вопросы и поддержание диалога. Почему же Сири, Алекса и Алиса не хотят нас понимать, Google находит не то, что мы ищем, а машинные переводчики веселят нас примерами «трудностей перевода» с китайского на албанский? Ответ кроется в мелочах — в алгоритмах, которые правильно работают в теории, но сложно реализуются на практике. Научитесь применять методы машинного обучения для анализа текста в реальных задачах, используя возможности и библиотеки Python. От поиска модели и предварительной обработки данных вы перейдете к приемам классификации и кластеризации текстов, затем приступите к визуальной интерпретации, анализу графов, а после знакомства с приемами масштабирования научитесь использовать глубокое обучение для анализа текста.
Сложности компьютерной обработки естественного языка.
Естественные языки определяются не правилами, а контекстом использования, который требуется реконструировать для компьютерной обработки. Часто мы сами определяем значения используемых слов, хотя и совместно с другими участниками беседы. Словом «краб» мы можем обозначить морское животное или человека с унылым нравом или имеющего характерную привычку двигаться бочком, но при этом оба — говорящий/автор и слушатель/читатель — должны согласиться с общим пониманием в ходе диалога. Поэтому язык обычно ограничивается обществом и регионом — передать смысл часто намного проще людям, имеющим жизненный опыт, похожий на ваш.
Краткое содержание.
Вступление.
Глава 1. Естественные языки и вычисления.
Глава 2. Создание собственного корпуса.
Глава 3. Предварительная обработка и преобразование корпуса.
Глава 4. Конвейеры векторизации и преобразования.
Глава 5. Классификация в текстовом анализе.
Глава 6. Кластеризация для выявления сходств в тексте.
Глава 7. Контекстно-зависимый анализ текста.
Глава 8. Визуализация текста.
Глава 9. Графовые методы анализа текста.
Глава 10. Чат-боты.
Глава 11. Масштабирование анализа текста.
Глава 12. Глубокое обучение и не только.
Глоссарий.
Купить .
Теги: Бенгфорт :: Билбро :: Охеда :: 2019 :: Python :: анализ :: данные
Смотрите также учебники, книги и учебные материалы:
- Разработка Backbone js приложений, Османи Э., 2014
- Простой Python, современный стиль программирования, Любанович Б., 2016
- Программирование под Android, Меднике З., Дорнин П., Мик Б., Накамура М., 2013
- Программирование на С# 5.0, Гриффитс И., Райтман М.А., 2014
- Программируем для iPhone и iPad, Пайлон Т., Пайлон Д., 2014
- Программируем для iPhone и iPad, Пайлон Т., Пайлон Д., 2012
- Основы разработки веб-приложений, Пьюривал С., 2015
- Новая большая книга CSS, Макфарланд Д., 2016