Язык запросов — это специальный набор служебных команд, позволяющих максимально конкретизировать передаваемый поисковой системе запрос с использованием простейших логических функций объединения или исключения слов. Набор команд, составляющих язык запросов, может варьироваться дня различных поисковых машин. Ниже приведена информация о типовом, «усредненном» языке запросов, поддерживаемом практически всеми современными поисковыми серверами. Наиболее распространенными для большинства поисковых систем являются команды так называемого поиска по маске, которые обозначаются символами «*» или «?». Знаком «?» в ключевом слове запроса заменяют один символ, на место которого может быть подставлена любая произвольная буква, а знаком «*» — последовательность символов. Допустим, если вы начисто забыли, как пишется слово «математика», не обязательно лихорадочно перерывать орфографический словарь в поисках правильного варианта, вполне достаточно указать в тексте запроса символ «?» вместо «спорной» буквы, например, следующим образом:

высшая мат?мат?ка

Поисковый сервер самостоятельно расставит недостающие буквы «и» и «е» по своим местам. Если же вам необходимо найти документы, содержащие все возможные производные от слова «контакт», можно использовать вместо его окончания знак «*»: контакт*

Тогда в файл отчета попадут слова «контакт», «контактный», «контактировать», «контактор» и т. д., то есть все словоформы, содержащие корень «контакт» и произвольную последовательность символов, автоматически подставляемую на место знака «*». Команды «+» и «-» позволяют принудительно добавлять или исключать какие-либо слова из текста запроса. Слово, помеченное знаком «+», должно обязательно присутствовать в искомом документе, а помеченное символом «-» — обязательно отсутствовать. Например, если вы хотите найти объявления о продаже недорогих автомобилей марки «жигули», запрос можно сформулировать так: продам жигули +недорого

Поисковая система будет искать все сообщения о продаже автомобилей этой марки, в тексте которых встречается слово «недорого». У вас может возникнуть также необходимость разыскать в Интернете информацию о процессорах Intel Pentium IV, но вы хотели бы исключить из результатов поиска сообщения об их продаже и рекламу компьютерных магазинов. В этом случае запрос следует сформулировать так: процессор Intel Pentium IV -компьютерный -магазин -продажа Оператор «логическое И», обозначающийся знаком ампресанд (&), позволяет перечислять слова, которые должны встречаться в пределах одного предложения искомого документа. Например, запрос коммерческое&предложение

заставит поисковую систему искать документы, включающие предложения, содержащие оба этих слова. Следует отметить, что в файл отчета могут попасть данные с различной степенью релевантности, то есть в результирующем списке вы сможете найти как документы, в тексте которых присутствует фраза «наше коммерческое предложение действительно до 31 декабря», так и фраза «Оценив коммерческое положение своей семьи и размер предлагаемого приданого, он сделал ей предложение*. Учтите, что степень релевантности с точки зрения поискового механизма тем выше, чем ближе стоят искомые слова друг к другу в обнаруженной фразе и чем меньше между ними встречается других слов. Поэтому ссылки на документы, содержащие выражения, подобные первому, будут размещены в начале файла отчета, а подобные второму — в его конце.

Оператор «логическое ИЛИ», обозначающийся символом «|», позволяет искать документы, в тексте которых содержится только одно из перечисленных слов. Например, по запросу рисунок | изображение | иллюстрация

будут найдены файлы, в которых встречается либо слово «рисунок», либо слово «изображение», либо слово «иллюстрация». Символ тильда (~), как правило, описывает действие, аналогичное действию знака «-», то есть исключает из искомого документа отмеченные подобным образом слова. То есть в ответ на запрос программное обеспечение -цена

поисковая система выдаст пользователю список документов, в которых встречается словосочетание «программное обеспечение», но нет слова «цена».

Удвоение какой-либо команды означает, что данное условие необходимо применять не к одному предложению, а ко всему документу в целом. Например, запрос

столица Франции - турфирма

означает, что пользователю необходим список файлов, в которых встречаются слова «столица» и «Франции», но отсутствует слово «турфирма»

в пределах всего документа, а не только в пределах предложения, где были обнаружены данные слова. Запрос строительные && материалы

указывает поисковой системе, что в файл отчета необходимо включать все документы, в тексте которых удастся найти слова «строительные» и «материалы», независимо оттого, расположены они в одном предложении или разбросаны по тексту в произвольном порядке. Логические операторы языка запросов можно комбинировать. Для этих целей служат символы открывающей и закрывающей скобки. Например, запрос

музыка & (beatles I битлз)

означает, что пользователь ищет документы, содержащие либо слова «музыка» и «beatles», либо слова «музыка» и «битлз». В некоторых случаях комбинировать операторы можно и без использования скобок. Например, фраза:

легковые & автомобили && Mercedes — запчасти означает, что пользователю необходимы документы, в которых встречаются слова «легковые» и «автомобили» в пределах одного предложения, слово «Mercedes» в пределах всего текста и ни разу не встречается слово «запчасти».

Некоторые поисковые системы воспринимают кавычки как служебный оператор, означающий, что заключенную в них фразу следует искать только целиком. Другими словами, если запрос поисковой машине будет содержать слова "поюшие гитары"

в кавычках, то в файл отчета будут включены только web-страницы с этим словосочетанием, а фразы вроде «после того, как они взяли в руки гитары, люди, поющие у костра, мгновенно смолкли» будут проигнорированы.

Большинство поисковых машин не различают регистра, в котором пользователь вводит свой запрос, то есть словосочетания «декоративные покрытия», «Декоративные Покрытия» и «дЕКоРАТивныЕ ПокрЫ-тИя» будут восприниматься ими одинаково. Однако ряд таких систем, как, например, популярная в русскоязычном Интернете служба «Яндекс», учитывает регистр, используемый при задании ключевых слов. Поэтому, во избежание ошибок, рекомендуется всегда вводить запрос только строчными буквами, используя заглавный регистр исключительно для имен собственных и географических названий.

Безусловно, описанные директивы языка запросов отнюдь не исчерпывают всех возможностей всех без исключения поисковых машин. Например, тот же «Яндекс» поддерживает еще порядка десяти операторов, позволяющих искать словосочетания, элементы которых разделены строго определенным количеством слов, а также информацию только в заголовках \уеЬ-страниц или в подписях к графическим иллюстрациям, а в поисковой системе «Рамблер» с помощью специальных команд можно включать или отключать функции автоматической генерации производных словоформ от слов, составляющих исходный запрос. В любом случае советую внимательно ознакомиться с инструкциями по использованию языка запросов для каждого конкретного сервера. Развернутую информацию о структуре языка запросов для той или иной поисковой системы можно найти в справочном разделе соответствующего ресурса. Потратив несколько минут на изучение этой документации, вы сэкономите впоследствии гораздо больше времени, научившись составлять грамотные и четко сформулированные запросы, то есть быстро и без особого труда отыскивать именно то, что вы стремились найти.


Информационная архитектура



Новости за месяц

  • Октябрь
    2019
  • Пн
  • Вт
  • Ср
  • Чт
  • Пт
  • Сб
  • Вс