К статье ИНФОРМАЦИИ НАКОПЛЕНИЕ И ПОИСК В принципе запрос на информацию можно было бы сравнить с содержимым файл ов и выявить наилучшее соответствие . На практике, однако , содержание как запроса, так и элемент ов хранимой информации надо сначала определить более четко. Таким образом, в управлении базой данных содержание каждой записи оценивается согласно некоторому масштабу значений; в системе поиск а ссылки документ представляется набором термин ов, каждый из которых имеет значение (вес), зависящее от важности термина в документе. Процесс накопления и поиска информации состоит из некоторого вида индексации, записи в файл, формулирования запроса и операций просмотр а и выборки, выполняемых над хранимыми записями при ответе на запрос об информации. Индекс ация. Обычно индексация осуществляется вручную . Индекс ( предмет ный указатель , словарь) может содержать много терминов, взятых из естественного языка, или может быть ограничен некоторыми специальными терминами. Словарь специальных терминов может определять термины с более широкими границами применимости, чем некоторый заданный термин, а также более узкие термины, синонимы и т.д. Документ у назначается от 6 до 20 терминов. Ручная индексация представляет собой своего рода искусство , и не следует ожидать какой- либо согласованности между результатами действий отдельных индексаторов. Были разработаны разнообразные методы автоматической индексации. В простейшем случае для индексации используется каждое слово отрывка из документа, за исключением союзов и предлогов. В более сложных системах выбираются термины, и им назначается вес по часто те появления в отдельных документах: чем выше частота появления данного слова, тем больше назначаемый ему вес. Слова, часто появляющиеся на протяжении всего собрания данных, не представляются подходящими для индексации, поскольку при осуществлении поиска они могут создать ложное представление относительно предпочтительности одних элементов перед другими. В случае автоматической индексации содержание документа может быть представлено не более чем сотней терминов. Формулирование запроса. В запросах должны использовать ся термины, имеющие вероятность совпасть с терминами-индексами, назначенными отыскиваемому документу. Формулировки запросов зачастую сложны. Так, запрос "А и В" означает, что должны отыскиваться документы, содержащие как термин А, так и термин В; запрос "А или В" относится к документам, содержащим либо термин А, либо термин В. В обычных системах поиска отыскиваются только те документы, в которых термины точно совпадают с терминами соответствующего запроса. В более совершенных системах формулировки запросов автоматически конструируются из формулировок, предъявляемых пользователем на естественном языке. Затем эти формулировки используются для идентификации документов на основе сходства терминов. Организация и поиск файлов. Последовательный просмотр, при котором запрос сравнивается с каждым хранимым элементом по очереди, является неприемлемо медленным, исключая случай малых файлов. Если бы файл состоял из терминов в алфавитном порядке, по одному на элемент, его можно было бы использовать как телефонную книгу, и поиск был бы быстрым. Когда каждому документу назначается много поисковых терминов, документы можно разбить на группы сходных терминов. Этот способ известен как кластерная организация файла. Затем каждой группе, или кластеру, может быть присвоена метка , и термины запроса сравниваются только с подходящей меткой. Быстрый поиск можно осуществить путем использования справочных файлов, которые содержат список идентификаторов документов для каждого термина-индекса. Тогда выполняется просмотр справочных файлов на предмет обнаружения идентификаторов, соответствующих данному термину. Например , списки идентификаторов документов для терминов-индексов "ЯБЛОНЯ" и "ГРУША" могли бы выглядеть как
Что такое информации накопление и поиск: процесс накопления и поиска информации? Значение информации накопление и поиск: процесс накопления и поиска информации в энциклопедии Кольера
информации накопление и поиск: процесс накопления и поиска информации - К статье ИНФОРМАЦИИ НАКОПЛЕНИЕ И ПОИСК
В принципе запрос на информацию можно было бы сравнить с содержимым файлов и выявить наилучшее соответствие. На практике, однако, содержание как запроса, так и элементов хранимой информации надо сначала определить более четко. Таким образом, в управлении базой данных содержание каждой записи оценивается согласно некоторому масштабу значений; в системе поиска ссылки документ представляется набором терминов, каждый из которых имеет значение (вес), зависящее от важности термина в документе.
Процесс накопления и поиска информации состоит из некоторого вида индексации, записи в файл, формулирования запроса и операций просмотра и выборки, выполняемых над хранимыми записями при ответе на запрос об информации.
Индексация. Обычно индексация осуществляется вручную. Индекс (предметный указатель, словарь) может содержать много терминов, взятых из естественного языка, или может быть ограничен некоторыми специальными терминами. Словарь специальных терминов может определять термины с более широкими границами применимости, чем некоторый заданный термин, а также более узкие термины, синонимы и т.д. Документу назначается от 6 до 20 терминов. Ручная индексация представляет собой своего рода искусство, и не следует ожидать какой-либо согласованности между результатами действий отдельных индексаторов.
Были разработаны разнообразные методы автоматической индексации. В простейшем случае для индексации используется каждое слово отрывка из документа, за исключением союзов и предлогов. В более сложных системах выбираются термины, и им назначается вес по частоте появления в отдельных документах: чем выше частота появления данного слова, тем больше назначаемый ему вес. Слова, часто появляющиеся на протяжении всего собрания данных, не представляются подходящими для индексации, поскольку при осуществлении поиска они могут создать ложное представление относительно предпочтительности одних элементов перед другими. В случае автоматической индексации содержание документа может быть представлено не более чем сотней терминов.
Формулирование запроса. В запросах должны использоваться термины, имеющие вероятность совпасть с терминами-индексами, назначенными отыскиваемому документу. Формулировки запросов зачастую сложны. Так, запрос "А и В" означает, что должны отыскиваться документы, содержащие как термин А, так и термин В; запрос "А или В" относится к документам, содержащим либо термин А, либо термин В. В обычных системах поиска отыскиваются только те документы, в которых термины точно совпадают с терминами соответствующего запроса. В более совершенных системах формулировки запросов автоматически конструируются из формулировок, предъявляемых пользователем на естественном языке. Затем эти формулировки используются для идентификации документов на основе сходства терминов.
Организация и поиск файлов. Последовательный просмотр, при котором запрос сравнивается с каждым хранимым элементом по очереди, является неприемлемо медленным, исключая случай малых файлов. Если бы файл состоял из терминов в алфавитном порядке, по одному на элемент, его можно было бы использовать как телефонную книгу, и поиск был бы быстрым. Когда каждому документу назначается много поисковых терминов, документы можно разбить на группы сходных терминов. Этот способ известен как кластерная организация файла. Затем каждой группе, или кластеру, может быть присвоена метка, и термины запроса сравниваются только с подходящей меткой.
Быстрый поиск можно осуществить путем использования справочных файлов, которые содержат список идентификаторов документов для каждого термина-индекса. Тогда выполняется просмотр справочных файлов на предмет обнаружения идентификаторов, соответствующих данному термину. Например, списки идентификаторов документов для терминов-индексов "ЯБЛОНЯ" и "ГРУША" могли бы выглядеть как
Соседние слова
Что такое информации накопление и поискЧто значит информации накопление и поиск: аппаратные средства поиска информации
Что означает информации накопление и поиск: груша : 22,25,26,31
Значение информации накопление и поиск: применение средств поиска информации
↑ информации накопление и поиск: процесс накопления и поиска информации ↓
Что такое информации накопление и поиск: типы информационных систем
Что значит информации накопление и поиск: яблоня : 23,25,27,31,38
Что означает инь-ян
Значение инь-ян цзя
Узнайте лексическое, прямое, переносное значение следующих слов:
- иордания: государственное устройство - К статье ИОРДАНИЯ Органы государственной власти. По конституции 1952 ...
- иония - область вдоль западного побережья Малой Азии, населенная в ...
- ион - атом или группа атомов, которые приобрели электрический заряд ...
- иоанн солсберийский - (John of Salisbury) (ок. 11151180), английский ученый, политический ...
- иоанн златоуст, св. - (ок. 354407), учитель церкви и епископ Константинопольский, родился ...
- иоанн богослов, св. - по преданию автор Евангелия от Иоанна, входящего ...
- иоанн vii - (13701408), известный также как Иоанн VII Палеолог, византийский ...
- интернет и другие компьютерные сети - Компьютерная сеть это группа компьютеров, которые соединены ...
- интеллект искусственный - раздел информатики, изучающий принципы действия интеллектуальных машин. Исследователи, ...
- интегральная схема ис - микроэлектронная схема, сформированная на крошечной пластинке (кристаллике, или ...
- инсульт - внезапное расстройство функций головного мозга, вызванное нарушением его ...
- инкунабула - (от лат. incunabula "колыбель"), всякая книга, напечатанная ...
- инки: история - в. завоевания - К статье ИНКИ: ИСТОРИЯ Свои владения инки начали расширять ...
- инки: история - а. доинкский период - К статье ИНКИ: ИСТОРИЯ Культура инков сформировалась относительно поздно. ...
- мехмед - имя шести султанов Османской империи. Мехмед I (13871421), правил ...