Предположим, что поисковый механизм выбран. Какое содержимое следует индексировать для поиска? Разумеется, можно нацелить поисковый механизм на ваш сайт, заказать индексирование полного текста каждого обнаруженного документа и удалиться. В этом в значительной мере заключается ценность поисковых систем - они могут быть всесторонними и быстро покрыть большой объем содержимого.

Однако индексирование всего подряд не всегда наилучшим образом отвечает потребностям пользователей. В обширной и сложной веб-среде, полной разнородных вложенных сайтов и баз данных, следует разрешить пользователям выполнять поиск в хранилище технических отчетов или в справочнике по персоналу, но ни к чему замусоривать результаты поиска директивами отдела кадров о введении рыбных палочек в меню кафетерия. Создав зоны поиска - очаги достаточно однородного содержимого, вы уменьшите эффект смеси яблок с апельсинами и дадите пользователю возможность вести более точный поиск.

Определение предмета поиска состоит не только в выборе правильных зон для поиска. У каждого документа или записи в базе есть некоторая структура, определяемая HTML, XML или полями базы данных. В свою очередь, эта структура хранит компоненты содержимого - его фрагменты или «атомы», которые обычно меньше, чем документ. Часть этой структуры, например имя автора, может быть использована поисковым механизмом, тогда как остальные части, такие как отказ от обязательств внизу каждой страницы, могут быть опущены.

Наконец, после инвентаризации и анализа содержимого сайта у вас появилось некоторое представление о том, какое содержимое можно считать «добротным». Его можно пометить вручную тегами или с помощью какого-нибудь другого механизма. Можно рассмотреть для этого «хорошего» содержимого возможность отдельного поиска наряду с глобальным поиском в рамках сайта. Можно даже запрограммировать поисковый механизм так, чтобы он сначала выполнял поиск в пределах этого «хорошего» материала и только при отсутствии значимых результатов расширял поиск на остальную часть сайта. Например, если большинство пользователей сайта электронной торговли ищет товары, то можно по умолчанию осуществлять поиск среди товаров, а поиск по всему сайту производить при задании соответствующего параметра поиска.

В этом разделе мы обсудим проблемы выбора объектов для поиска как на грубом уровне детализации (зоны поиска), так и на более низком, атомарном уровне поиска внутри документов (в компонентах содержимого).


Информационная архитектура



Новости за месяц

  • Август
    2019
  • Пн
  • Вт
  • Ср
  • Чт
  • Пт
  • Сб
  • Вс