Как отмечалось выше, разработка тезаурусов ведется уже давно. В работе «The Evolution of Guidelines for Thesaurus Construction» (Эволюция принципов построения тезаурусов) Дэвид А. Крукс (David A. Krooks) и Ф.У. Ланкастер (F.W. Lancaster) высказали предположение, что «большинство главных проблем построения тезаурусов выявлено и решено к 1967 году».

Такой богатый опыт позволяет опираться на ряд национальных и международных стандартов, относящихся к построению моноязычных тезаурусов. Например:

• ISO 2788 (1974, 1985, 1986, международный)

• BS 5723(1987,британский)

• AFNOR NFZ 47-100 (1981, French)

• DIN 1463 (1987-1993, немецкий)

• ANSI/NISO Z39.19 (1994, США)

В данной книге мы основываемся в целом на американском стандарте ANSI/NISO Z39.19, весьма близком к международному стандарту ISO 2788. Стандарт ANSI/NISO имеет заголовок «Guidelines for the Construction, Format and Management of Monolingual Thesauri» (Принципы построения, формата и управления моноязычными тезаурусами) и может быть приобретен через Интернет (http://www.niso.org/stantech.html). Термин «принципы» в заголовке весьма примечателен. Сравните с тем, что говорит о своей интерпретации этого стандарта производитель программного обеспечения Oracle:

Фраза... стандарт тезауруса несколько вводит в заблуждение. В вычислительной технике «стандартом» считается спецификация поведения или интерфейса. Данные стандарты никакой спецификацией не являются. Если вы ищете здесь функциональный интерфейс стандарта или стандартный формат файла тезауруса, то напрасно. Это руководящие принципы для компиляторов тезаурусов, причем под компилятором понимается человеческая личность, а не программа.

Труд специалистов Oracle состоял в том, чтобы взять идеи, которые есть в этих принципах и в ANSI Z39.19... и использовать их как основу для спецификации собственной разработки. Итак, Oracle поддерживает отношения ISO-2788 или тезаурусы, совместимые с ISO-2788.

Изучив несколько примеров, вы поймете, что стандарт ANSI/NISO обеспечивает простые принципы, применять которые очень трудно. Стандарт содержит важную концептуальную структуру и в некоторых случаях предлагает конкретные правила, которым можно следовать, но это абсолютно не снимает с вас необходимости критически думать, применять творческий подход и брать на себя риск в процессе построения стандарта.

Мы совершенно не согласны с предположением Крукса и Ланкастера, что основные проблемы в этой области решены, и не всегда согласны с принципами, изложенными в стандарте ANSI/ NISO. Что происходит? Просто дух противоречия? Нет, за этими конфликтами в действительности стоит разрушительная сила Интернета. Мы находимся в середине перехода от тезауруса в его традиционном виде к новой парадигме, присущей миру сетей.

Традиционные тезаурусы возникли в научных и библиотечных кругах. Они имели печатный вид и были предназначены в основном для опытных пользователей. Когда мы слушали курсы по библиотечному делу в 80-е и 90-е годы, главным в извлечении электронной информации было обучиться навигации по гигантским томам печатных тезаурусов в библиотеке с целью определения тематических дескрипторов для сетевого поиска в информационной службе Dialog. Необходимо было обучать людей работе с этими инструментами, исходя из предположения, что специалисты должны пользоваться ими регулярно и с течением времени все более умело и эффективно. Вся система была построена с учетом того, что процессорное время и передача данных по сети обходятся дорого.

Затем мир изменился. Сейчас мы работаем с чисто электронными системами. Мы не можем попросить своих клиентов, чтобы они сбегали в библиотеку, прежде чем работать с нашим веб-сайтом. Обычно мы обслуживаем неопытных пользователей, не прошедших формальной подготовки по технике поиска информации в сети. Скорее всего, посещать сайт они будут нерегулярно, поэтому нельзя полагаться на то, что с течением времени они к нему привыкнут. Кроме того, мы действуем в более широкой бизнес-среде, задачи которой могут весьма отличаться от решаемых в научных учреждениях и библиотеках.

В рамках этой новой парадигмы возникает необходимо определить, какие из прежних принципов сохраняют актуальность, а какие - нет. Было бы чрезвычайной расточительностью выбросить такие ценные ресурсы, как стандарт ANSI/NISO, основанный на многолетних исследованиях и практике. Очень многое в нем остается в силе. Однако было бы ошибкой слепо следовать этим принципам - так же как передвигаться по современным шоссе, пользуясь картами издания 1950-х годов.

К преимуществам, которые мы получим, придерживаясь этого стандарта, можно отнести следующие:

• Эти принципы основаны на здравых рассуждениях и интеллекте.

• Большая часть программного обеспечения для управления тезаурусами спроектирована с учетом совместимости со стандартом ANSI/ NISO, поэтому полезно придерживаться этого стандарта с точки зрения интеграции технологий.

• Соответствие этому стандарту обеспечивает лучшие возможности совместимости между базами данных, поэтому объединение двух комплектов словарей при слиянии конкурирующих компаний вызовет меньше трудностей.

Наш совет: прочтите эти принципы, следуйте им, когда это оказывается разумным, но не бойтесь отступить от стандарта, когда это необходимо. В конце концов, именно возможность идти против установленных правил делает жизнь информационного архитектора интересной и увлекательной!


Информационная архитектура



Новости за месяц

  • Октябрь
    2019
  • Пн
  • Вт
  • Ср
  • Чт
  • Пт
  • Сб
  • Вс