В монографии рассматриваются вопросы разработки и создания информационно-поисковых систем, способных в автоматизированном режиме извлекать данные из слабоструктурированных электронных документов с целью включения этих документов в научно-информационный процесс и получения новой информации и знаний. Приводится подробное изложение моделей, структур и алгоритмов, описывающих информационно-поисковые системы указанного типа, предназначенные для информационного обеспечения научной деятельности. Представлены результаты использования предложенных информационных моделей и структур при создании целого ряда разделов Информационно-справочной системы Сибирского отделения РАН.
Книга предназначена для специалистов в области информационных технологий, занимающихся вопросами создания информационно-поисковых систем для различных отраслей науки, а также аспирантов и студентов старших курсов.
Методология изучения интернет-сайтов.
Задачу изучения отдельных интернет-документов практически невозможно решить без изучения структур, объединяющих эти документы, т. е. интернет-сайтов, понимаемых как группы документов, имеющих общего владельца и объединенных точкой входа. Более того, ввиду огромного количества научных интернет-ресурсов, а также слабой структурированности некоторых из них, препятствующей выделению основных элементов метаданных, приходится заносить в каталоги интеллектуальных информационных систем сведения не только об отдельных документах, но и о сайтах.
Количество сайтов в сети Интернет весьма сложно оценить хотя бы потому, что один сайт может быть составной частью другого (например, сайт журнала «Вычислительные технологии» является частью сайта Института вычислительных технологий СО РАН). Косвенную оценку снизу числа сайтов можно получить исходя из количества доменных имен, которое, по данным компании VeriSign на июль 2005 г., достигло 82,9 млн [85]. Согласно более современной оценке, на осень 2009 г. количество сайтов в Интернете составляет порядка 230 млн, в том числе в Рунете — около 15 млн [87].
ОГЛАВЛЕНИЕ
ПРЕДИСЛОВИЕ
Глава 1 ИНФОРМАЦИОННЫЙ ПОИСК: ИСТОРИЯ И ТЕХНОЛОГИЧЕСКИЕ ПОДХОДЫ
1.1. Постановка проблемы
1.2. Предыстория
1.3. Современные проблемы создания и функционирования информационно-поисковых систем научной тематики
1.4. Уточнение используемой терминологии на основе семиотического подхода
1.5. Общие принципы организации информационно-поисковых систем
1.6. Составление поисковых предписаний
1.7. Оценка эффективности поиска
1.8. Поиск документов «по аналогии»
1.8.1. Постановка проблемы
1.8.2. Формализация понятий аналогии и сходства
1.8.3. О несимметричном сходстве
1.8.4. Определение меры близости между объектами
1.8.5. Установление аналогии и оценка эффективности поиска
1.9. Метаданные и обработка электронных ресурсов
1.10. Методология изучения интернет-сайтов
1.11. Проблемы разработки теоретических основ создания интеллектуальных систем
Глава 2 АНАЛИЗ ИНФОРМАЦИОННЫХ ПОТРЕБНОСТЕЙ НАУЧНОГО СООБЩЕСТВА
2.1. Основные характеристики информационных потребностей в сфере науки
2.2. Исследование информационных потребностей коллективных пользователей — научных учреждений СО РАН
2.3. Информационная модель описания деятельности научного сообщества
Глава 3 СТРУКТУРА ОСНОВНЫХ КОМПОНЕНТОВ ПРОГРАММНОЙ СИСТЕМЫ
3.1. Формулировка требований к программной системе
3.2. Модель информационной системы
3.3. Структура логических компонентов программной системы
3.4. Структуры представления научной и научно-организационной информации
3.4.1. Структура информационно-справочной системы по истории науки (на примере математики)
3.4.2. Структуры представления информации о деятельности научного сообщества (на примере СО РАН)
3.4.3. Структуры представления информации о научно-инновационной деятельности
Глава 4 МЕТОДОЛОГИЯ ОБРАБОТКИ СЛАБОСТРУКТУРИРОВАННЫХ ДОКУМЕНТОВ
4.1. Автоматизированная технология построения тезаурусов и онтологий
4.2. Автоматизация процесса извлечения метаданных из слабоструктурированных документов
4.3. Автоматизация процесса получения метаданных документа с использованием удаленных библиографических описаний
4.4. Автоматическое извлечение из текстов ключевых слов
4.5. Кластеризация текстовых документов на основании меры сходства
БИБЛИОГРАФИЧЕСКИЙ СПИСОК.
Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
Скачать книгу Проблемы поиска информации, Шокин Ю.И., Федотов А.М., Барахнин В.Б., 2010 - fileskachat.com, быстрое и бесплатное скачивание.
Скачать pdf
Ниже можно купить эту книгу по лучшей цене со скидкой с доставкой по всей России.Купить эту книгу
Скачать - pdf - Яндекс.Диск.
Дата публикации:
Теги: учебник по информатике :: информатика :: компьютеры :: Шокин :: Федотов :: Барахнин
Смотрите также учебники, книги и учебные материалы:
Следующие учебники и книги:
- Компьютер и интернет для женщин, Мирошникова Э.
- MATLAB 7, Ануфриев И.Е., Смирнов Л.Б., Смирнова Е.Н., 2005
- Базы данных, лабораторный практикум, Клецова Т.В., Овсянникова Н.В., Прохоров И.В., 2008
- Надежность информационных систем, Воронин А.А., Морозов Б.И., 2001
Предыдущие статьи:
- Системы записи и воспроизведения информации, конспект лекций, Лявданский С.Е., 2000
- Теоретические основы экономической информатики, Кучинский В.Ф., Спирина Т.П., 2014
- Проектирование СВЧ устройств и антенн с Ansoft HFSS, Банков С.Е., Курушин А.А., 2009
- Сквозное проектирование в T-FLEX, Бунаков П.Ю., 2009