В строку запроса поисковой машины, помимо ключевых слов, можно вводить так называемые операторы — специальные служебные слова или символы, которые сообщают поисковой системе, каким образом нужно обращаться с теми или иными ключевыми словами. Поиск операторов в документе не производится.

У каждой поисковой машйны свой синтаксйс языка запросов. В одних случаях он реализован лучше, в других — хуже.

Не будем рассматривать синтаксис отдельно взятой поисковой системы (детальное описание языка запросов любой системы можно без труда найти на ее сайте), а поговорим об основных операторах и правилах, работающих одинаково в большинстве поисковых машин. Их, как правило, бывает вполне достаточно.

? Операторы. Запрос, состоящий из нескольких слов, может содержать операторы. Каждый оператор имеет левую и правую части (то есть, соответственно, то, что стоит перед оператором и после него).

• ?ND (логическое И) — и левая, и правая части этого оператора должны присутствовать в тексте одновременно. Иными словами, при запросе «самолет AND вертолет» результатом поиска будут документы, которые содержат одновременно и слово «самолет», и слово «вертолет». Как правило, если оператор явно не указан и слова разделены пробелом, то по умолчанию используется оператор AND. Таким образом, запрос «дешевый фотоаппарат» будет истолкован поисковой машиной как «дешевый AND фотоаппарат».

• OR (логическое ИЛИ) — при использовании этого оператора в найденном тексте должна присутствовать или его левая, или правая часть. Этот оператор очень удобен при поиске синонимов. Например, в результате запроса «учеба OR занятие OR обучение» будут найдены документы, содержащие хотя бы одно из перечисленных слов.

• NOT (логическое НЕ) — отсекает документы, находящиеся в его правой части. Так, по запросу «игры NOT компьютерные» будут найдены веб-страницы, в которых есть слово «игры», но нет слова «компьютерные».

Если в запросе присутствует несколько операторов, то поисковая машина будет работать с ними в соответствии с их приоритетом. Обычно операторы AND и NOT имеют более высокий приоритет, нежели ОН. Другими словами, при обработке таких запросов поисковая машина будет сначала группировать ключевые слова по операторам AND и NOT, а только потом по операторам OR. Однако порядок группировки можно изменять. Для этого предусмотрены скобки.

? Скобки. Скобки задают порток действия логических операторов. Они представляют собой превосходный инструмент, позволяющий строить очень гибкие и эффективные запросы.

Ключевые слова, заключенные в скобки, трактуются операторами, как одно целое. Таким образом, появляется возможность изменять приоритеты операторов и строить сложные вложенные запросы. Например, по запросу «мобильный OR сотовый AND телефон» в соответствии с приоритетами будут выданы документы, содержащие либо слово «мобильный», либо одновременно слова «сотовый» и «телефон». При использовании скобок запрос вида «(мобильный OR сотовый) AND телефон» задает поиск документов, где встречается слово «телефон», а также слово «мобильный» или «сотовый».

Можно строить самые разные конструкций. К примеру, вы хорошо владеете китайским языком и хотите найти себе удаленную работу. Тогда формируем запрос «переводчик AND китайский». Дальше логично нацисать что-то вроде «требуется» или «работа». Однако чтобы поиск был более эффективным, лучше предусмотреть как можно больше вариантов. Поэтому добавляем к запросу «(работа OR требуется OR вакансия)». Далее следует показать машине, что вы хотите работать удаленно, поэтому добавляем -«(удаленная OR дистанционная OR внештатная)». Ну а чтобы исключить из списка найденных документов всевозможные резюме таких же, как вы, соискателей, в конце можно дописать «NOT (резюме OR ищу OR предлагаю)». В конечном итоге получим следующий текст запроса:

(переводчик AND китайский ?ND (работа QR требуется ОН вакансия) ?ND (улаленная QR дистанционная 0R внештатная)) NOT (резюме OR ищу 0R предлагаю)

Возможно, это выглядит слегка устрашающе, зато работает довольно эффективно.

? Кавычки. В большинстве поисковых систем по умолчанию поиск учитывает все формы заданного ключевого слова. Чтобы искать точные словоформы, предусмотрены кавычки. Ключевые слова, заключенные в кавычки, ищутся именно в той форме и последовательности, в которой использовались в запросе. Таким образом очень удобно искать, к примеру, цитаты.

? Поиск с расстоянием. Допустим, вы хотите собственными руками собрать радиоприемник и сформировали запрос «схема радиоприемник». Поисковая машина, согласно алгоритму, начнет поиск документов, содержащих оба ключевых слова. В итоге в списке найденных веб-страниц будет огромное количество документов, в которых эти слова совершенно не связаны между собой и находятся в разных частях текста. Чтобы этого не допустить и не получить ссылки на документы, в которых «радиоприемник работал так громко, что мешал изучать схему подземных сооружений»; предусмотрен поиск с расстоянием.

В языках запросов различных поисковых машин расстояние ограничивается по-разному. Например, в Яндексе это осуществляется следующим образом. Если все слова в тексте пронумеровать по порядку их следования, то расстояние между какими-либо двумя словами будет равно разнице между номерами этих слов. Таким образом, расстояние между соседними словами равно 1, а между словами, стоящими наоборот, —1. Для определения расстояния в Ян-* дексе применяется символ «/». Так, на запрос «схема /2 радиоприемник» будут найдены документы, в которых присутствуют слова «схема» и «радиоприемник», причем расстояние между ними составляет не более-двух слов и они находятся в одном предложении. В других поисковых системах синтаксис может быть другим, но суть Примерно та же.

Кроме того, некоторые поисковые системы позволяют искать по адресам сайтов, ключевым словам, аннотациям, подрисуночным подписям и т. д.


Информационная архитектура



Новости за месяц

  • Сентябрь
    2019
  • Пн
  • Вт
  • Ср
  • Чт
  • Пт
  • Сб
  • Вс