Иногда классический тезаурус нельзя применить из-за трудностей, связанных с содержимым, препятствующим индексированию на уровне документов. Содержимое может принадлежать третьей стороне или состоять из обновляемых ежедневно динамических новостей. Объем содержимого может быть настолько велик, что его ручное индексирование обошлось бы в астрономическую сумму. По разным причинам во многих средах Интернета и интрасетей индексирование с помощью управляемого словаря всей совокупности документов оказывается неосуществимым. Это не значит, что тезаурус никак не может улучшить условия работы пользователей.

Поисковый тезаурус применяет управляемый словарь в момент поиска, а не в момент индексирования. Например, когда пользователь вводит термин в поисковый механизм, поисковый тезаурус может отобразить этот термин на управляемый словарь, прежде чем выполнять запрос в полнотекстовом указателе. Этот тезаурус может просто выполнять расширение эквивалентными терминами, как мы это видели на примере колец синонимов, либо не ограничиваться отношением эквивалентности и расширить запрос, включив все нижестоящие согласно иерархии дескрипторы (обычно это называют «posting down»). Очевидно, такие методы повышают полноту за счет точности.

Кроме того, существует возможность предоставить больший контроль пользователям, дав им право задать в своем запросе любую комбинацию из предпочтительных, альтернативных, вышестоящих, нижестоящих или ассоциативных дескрипторов. При тщательной интеграции в интерфейс поиска и результаты поиска такие средства дают пользователям возможность при необходимости сужать, расширять и модифицировать свои поисковые запросы.

Поисковый тезаурус может также обеспечить большую гибкость навигации. Можно разрешить пользователям просматривать весь тезаурус или его часть, перемещаясь в соответствии с отношениями эквивалентности, иерархии и ассоциативности. Термины (или комбинацию предпочтительных и альтернативных терминов) можно использовать как заранее подготовленные или «законсервированные» запросы, выполняемые в полнотекстовом указателе. Иными словами, ваш тезаурус может стать подлинным порталом, предоставляя новый способ навигации и получения доступа к потенциально необъятному содержимому. Главное преимущество поискового тезауруса в том, что стоимость его разработки и сопровождения фактически не зависят от объема содержимого. С другой стороны, он предъявляет значительно более высокие требования к качеству эквивалентности и отображения.

Поисковые тезаурусы подробно рассмотрены в следующих статьях:

• Anderson, James D. and Frederick A. Rowley. «Building End User Thesauri From Full Text» (Построение тезаурусов конечного пользователя на базе полного текста) в Advances in Classification Research, Volume 2; Proceedings of the 2nd ASIS SIG/CR Classification Research Workshop, October 27, 1991, eds. Barbara H. Kwasnik and Raya Fidel, 1-13. Medford, NJ: Learned Information, 1992.

• Bates, Marcia J. «Design For a Subject Search Interface and Online Thesaurus For a Very Large Records Management Database» (Проектирование интерфейса тематического поиска и сетевого тезауруса для базы данных, управляющей очень большими записями). American Society for Information Science. Annual Meeting. Proceedings, v. 27, 20-28. Medford, NJ: Learned Information, 1990.


Информационная архитектура



Новости за месяц

  • Август
    2019
  • Пн
  • Вт
  • Ср
  • Чт
  • Пт
  • Сб
  • Вс