Информационно-поисковые системы
Современные средства поддержки обработки информации и принятия управленческих решений основаны на использовании специализированных информационных хранилищ. Информационное хранилище представляет собой базу обобщенной информации, формируемую из множества внутренних и внешних источников информации. По сравнению со стандартными базами данных такие хранилищаобеспечивают более гибкое формирование разнообразных справочно-аналитических запросов и допускают использование специализированных методов статистического и интеллектуального анализа.
Важной задачей при использовании таких информационных хранилищ является поиск необходимой информации. Для решения данной задачи используются разнообразные информационно-поисковые системы. Для поиска информации в базах данныхиспользуются различные языки запросов. В большинстве случаев поиск ведется с использованием ключевых полей, однозначно идентифицирующих различные участки информации в БД. Для ускорения поиска необходимой информации применяется индексирование данных. Процесс индексирования предполагает создание специальной базы данных вхождений ключевых значений и расположение информации в базах данных.
Технологиятекстового поиска имеет дело с информацией на естественном языке. Поскольку такого рода информация весьма разнообразна как по структуре, так и по содержанию, проблема отыскания необходимых данных достаточно сложна. Основной единицей хранения информации в системах текстового поиска выступает, как правило, документ. Обработка и анализ информации, хранимой в документе, возможна только если документхранится в оцифрованном виде, в формате, когда для анализа доступны его отдельные литеры. То есть недостаточно просто отсканировать документ и хранить его в памяти компьютера. Современные технологии текстового поиска представляют собой весьма сложную область исследования и разработок, охватывающий широкий спектр проблем – от теории информационного поиска до определения способов удовлетворенияпотребностей в сборе, хранении и обработке разнообразной текстовой информации.
Информационно-поисковые системы ориентированы, прежде всего, на функцию поиска нужной информации в большом информационном массиве документов. Представление информационных потребностей пользователя в форме, воспринимаемой информационной системой, называется пользовательский запрос. Запрос может быть выполнен на естественномязыке или с использованием специально установленных правил.
Простейшими системами такого рода являются дескрипторные ИПС. В дескрипторных моделях поиск документа ведется по карточке реквизитов, описывающих основные свойства данного документа. Запрос пользователя представляет собой форму заполнения такой карточки реквизитов. Использование описания документов позволяет ускорить поиск нужных документов иупростить организацию доступа к ним. Одна из наиболее популярных областей использования таких систем – библиографические системы. Успехи в развитии информационных технологиях полнотекстового поиска позволили создавать системы, выполняющие поиск документов по заданному контексту. При контекстном поиске документ представляется как совокупность всевозможных встречающихся в его тексте слов исловосочетаний.
Повышенный интерес к разработке систем информационного поиска в различных массивах данных связан и с развитием различных электронных библиотек. Появились новые направления, такие как поиск информации в глобальных вычислительных сетях, текстовой поиск на Web-страницах и другие направления.
В настоящее время информационные ресурсы Сети составляют свыше десятка миллиардов документов(Web-страниц), к которым возможен свободный доступ любого пользователя. Естественно, для того, чтобы найти необходимую информацию и этой крупнейшей распределенной полнотекстовой базе данных необходимо использовать самые мощные ИПС. Такие системы существуют и конкурируют друг с другом на современном рынке информационных технологий.
Характеристики поисковых систем...
Современные средства поддержки обработки информации и принятия управленческих решений основаны на использовании специализированных информационных хранилищ. Информационное хранилище представляет собой базу обобщенной информации, формируемую из множества внутренних и внешних источников информации. По сравнению со стандартными базами данных такие хранилищаобеспечивают более гибкое формирование разнообразных справочно-аналитических запросов и допускают использование специализированных методов статистического и интеллектуального анализа.
Важной задачей при использовании таких информационных хранилищ является поиск необходимой информации. Для решения данной задачи используются разнообразные информационно-поисковые системы. Для поиска информации в базах данныхиспользуются различные языки запросов. В большинстве случаев поиск ведется с использованием ключевых полей, однозначно идентифицирующих различные участки информации в БД. Для ускорения поиска необходимой информации применяется индексирование данных. Процесс индексирования предполагает создание специальной базы данных вхождений ключевых значений и расположение информации в базах данных.
Технологиятекстового поиска имеет дело с информацией на естественном языке. Поскольку такого рода информация весьма разнообразна как по структуре, так и по содержанию, проблема отыскания необходимых данных достаточно сложна. Основной единицей хранения информации в системах текстового поиска выступает, как правило, документ. Обработка и анализ информации, хранимой в документе, возможна только если документхранится в оцифрованном виде, в формате, когда для анализа доступны его отдельные литеры. То есть недостаточно просто отсканировать документ и хранить его в памяти компьютера. Современные технологии текстового поиска представляют собой весьма сложную область исследования и разработок, охватывающий широкий спектр проблем – от теории информационного поиска до определения способов удовлетворенияпотребностей в сборе, хранении и обработке разнообразной текстовой информации.
Информационно-поисковые системы ориентированы, прежде всего, на функцию поиска нужной информации в большом информационном массиве документов. Представление информационных потребностей пользователя в форме, воспринимаемой информационной системой, называется пользовательский запрос. Запрос может быть выполнен на естественномязыке или с использованием специально установленных правил.
Простейшими системами такого рода являются дескрипторные ИПС. В дескрипторных моделях поиск документа ведется по карточке реквизитов, описывающих основные свойства данного документа. Запрос пользователя представляет собой форму заполнения такой карточки реквизитов. Использование описания документов позволяет ускорить поиск нужных документов иупростить организацию доступа к ним. Одна из наиболее популярных областей использования таких систем – библиографические системы. Успехи в развитии информационных технологиях полнотекстового поиска позволили создавать системы, выполняющие поиск документов по заданному контексту. При контекстном поиске документ представляется как совокупность всевозможных встречающихся в его тексте слов исловосочетаний.
Повышенный интерес к разработке систем информационного поиска в различных массивах данных связан и с развитием различных электронных библиотек. Появились новые направления, такие как поиск информации в глобальных вычислительных сетях, текстовой поиск на Web-страницах и другие направления.
В настоящее время информационные ресурсы Сети составляют свыше десятка миллиардов документов(Web-страниц), к которым возможен свободный доступ любого пользователя. Естественно, для того, чтобы найти необходимую информацию и этой крупнейшей распределенной полнотекстовой базе данных необходимо использовать самые мощные ИПС. Такие системы существуют и конкурируют друг с другом на современном рынке информационных технологий.
Характеристики поисковых систем...
Поделиться рефератом
Расскажи своим однокурсникам об этом материале и вообще о СкачатьРеферат