Dictionary.com определяет тезаурус как «книгу синонимов, часто содержащую близкие или противоположные слова и антонимы». Такое применение возвращает нас к урокам языка в старших классах, когда

мы находили в тезаурусе такие слова, которые могли произвести впечатление на учителей.

Наша разновидность тезауруса - та, которая интегрируется с веб-сайтом или интрасетью, - имеет общее со знакомым учебным справочником происхождение, но отличается форматом и функциями. Как и этот справочник, наш тезаурус представляет собой семантическую сеть понятий, связывая слова со своими синонимами, омонимами, антонимами, вышестоящими и нижестоящими дескрипторами, а также с ассоциативными дескрипторами.

Однако наш тезаурус имеет формат сетевой базы данных, тесно связанной с пользовательским интерфейсом для веб-сайта или интрасети. И в то время как обычный тезаурус помогает перейти от одного слова ко многим, наш тезаурус выполняет противоположную функцию. Это важнейший инструмент управления синонимами, который отображает многие синонимы и альтернативы слов в один предпочтительный термин или понятие, чтобы неоднозначность языка не помешала пользователю найти нужную информацию.

Таким образом, задачи нашей книги обусловливают следующее определение тезауруса:

Управляемый словарь, в котором определены эквивалентность, иерархические и ассоциативные связи для целей улучшения извлечения информации.

Тезаурус основывается на конструкциях более простых управляемых словарей, моделируя указанные три базовые типа семантических отношений.

Отношение эквивалентности сосредоточено на управлении синонимами. Иерархические отношения позволяют классифицировать предпочтительные термины по категориям и подкатегориям. Ассоциативные отношения обеспечивают важные отношения, не учитываемые иерархическими отношениями или отношениями эквивалентности. Все три типа отношений могут быть различными способами использованы для решения задач извлечения информации и навигации.


Информационная архитектура



Новости за месяц

  • Ноябрь
    2019
  • Пн
  • Вт
  • Ср
  • Чт
  • Пт
  • Сб
  • Вс