Не так просто найти хороший пример открытого веб-сайта, где применяется тезаурус. До недавнего времени не столь многие группы разработчиков располагали знаниями или поддержкой, достаточными для такого существенного капиталовложения. Мы считаем, что в ближайшие годы положение должно измениться, поскольку тезаурусы становятся важным средством, позволяющим справиться с растущими размерами и важностью веб-сайтов и интрасетей. Другое препятствие нахождению хороших примеров состоит в том, что не всегда очевидно, используется ли на сайте тезаурус. При добротной интеграции тезаурус может оказаться невидимым для нетренированного взгляда. Чтобы обнаружить его, надо знать, что искать.

Хороший пример, к которому мы будем обращаться на протяжении этой главы, представляет собой сайт PubMed - служба Национальной медицинской библиотеки США (National Library of Medicine). PubMed предоставляет доступ к более чем 11 миллионам выдержек из MEDLINE и журналов из области наук о жизни. MEDLINE в течение многих лет служит первостепенной по значимости службой электронной информации для врачей, ученых и других медицинских специалистов. Здесь применяется огромный тезаурус, содержащий более 19 000 предпочтительных терминов или «основных тематических заголовков» и предоставляющий мощные возможности для поиска.

PubMed предоставляет упрощенный открытый интерфейс со свободным доступом к выдержкам, но без доступа к полным текстам журнальных статей. Посмотрим сначала на интерфейс, а потом заглянем глубже и разберемся, что происходит.

Допустим, мы изучаем африканскую сонную болезнь. Ввод соответствующей фразы в поисковый механизм PubMed вознаграждает нас первыми 20 результатами из общего числа 2778 найденных. Пока в этой операции поиска не заметно чего-либо особенного. На основании того, что нам известно, можно предположить, что был выполнен полнотекстовый поиск по 11 миллионам журнальных статей. Понять, что происходит, можно, лишь заглянув глубже.

На самом деле никакого поиска в полном тексте статей не было. А был поиск в записях метаданных для этих статей, содержащих комбинацию кратких обзоров и тематических заголовков.

Выбрав в результатах поиска другой элемент, мы увидим запись с предметными заголовками («MeSH Terms»), но без краткого содержания.

Прокручивая весь список терминов, мы не обнаружим в нем африканской сонной болезни. Что произошло? Почему в результаты поиска была включена эта статья? Чтобы ответить на этот вопрос, снизим скорость и посмотрим на MeSH Browser, интерфейс для навигации по структуре и словарю MeSH.

MeSH Browser обеспечивает навигацию путем просмотра иерархических схем классификации внутри тезауруса или с помощью поиска. Задав поиск строки «African sleeping sickness», мы увидим, почему статья «Wolbachia. A tale of sex and survival» попала в результаты поиска. «African sleeping sickness» в действительности представляет собою входной термин для предпочтительного термина заголовка MeSH «Try-panosomiasis, African». Во время поиска в PubMed наш альтернативный термин невидимо для нас был отображен в предпочтительный. К сожалению, PubMed при работе с тезаурусом MeSH на этом останавливается. Как удобно было бы, например, превратить все эти термины MeSH из нашего примера записи в действующие ссылки и предоставить расширенные возможности поиска и просмотра, аналогичные тем, которые предоставляет Amazon.

В данном примере Amazon предоставляет мощные функции поиска и просмотра, опираясь на иерархическую схему классификации и предметные заголовки, и дает пользователям возможность итеративно уточнять свои запросы. Такое усовершенствование, несомненно, пошло бы на пользу PubMed.

К преимуществам применения тезауруса следует отнести огромные мощь и гибкость в формировании и постепенном уточнении интерфейса пользователя. Нельзя сразу работать со всеми функциями, но их можно проверять на пользователях, попутно приобретая опыт и приспосабливаясь. PubMed, возможно, задействовал еще не полностью всю мощь MEDLINE, но приятно иметь в своем распоряжении такую богатую сеть семантических связей, продолжая проектирование и разработку.


Информационная архитектура



Новости за месяц

  • Сентябрь
    2019
  • Пн
  • Вт
  • Ср
  • Чт
  • Пт
  • Сб
  • Вс