Кроме того, поисковая система позволяет искать страницы, в которых введенные слова встречаются в одном предложении. Для этого достаточно поставить между словами искомой фразы символы &. Например, по запросу культура & Россия отобразятся все страницы, содержащие в одном предложении и слово культура, и слово Россия.
Более того, вы можете точно определить максимальное количество слов, которые будут отделять одно искомое слово от другого. Для этого между словами вашего запроса нужно поставить оператор /<максимальное количество слов>. Например, по запросу культура /2 Россия отобразятся все страницы, в которых слово Россия отделяется от слова культура не более чем одним словом.
Усложняя задачу, можно прийти к еще одному виду операторов поисковой системы «Яндекс»: /(<минимальное количество слов><максимальное количество слов>). С помощью такого оператора выполняется поиск фраз, в которых между словами может находиться не более определенного количества слов и не менее другого такого же определенного количества слов. Например, запрос космическая /(2 3) станция найдет страницы, на которых могут присутствовать фразы вида космическая орбитальная станция, космическая российская орбитальная станция, но при этом не будут найдены страницы, на которых есть фразы вида космическая станция.
Если же вы хотите выполнить поиск по жесткой фразе (то есть найти страницы, содержащие точную фразу, которая совпадает с введенной), то следует взять искомую фразу в кавычки. Например, «красная шапочка».
Порядок слов. Если для вашего запроса важен порядок расположения слов искомой фразы, то при его создании следует воспользоваться несколькими дополнительными возможностями поисковой системы «Яндекс».
Так, чтобы найти слова, которые идут в определенном порядке, достаточно поставить между ними знак + (в прямом порядке) или – (в обратном порядке). Например, при запросе Иван + Тургенев будут найдены все страницы, содержащие фразы вида Иван Тургенев и ни одной страницы с фразами вида Тургенев Иван.
Одной из особенностей поисковой системы «Яндекс» является возможность объединения операторов изменения расстояния между словами и операторов изменения порядка слов. Для этого достаточно поставить оператор порядка слов после знака / операторов изменения расстояния между словами. Например, немного усложним предыдущий запрос: Иван / + 2 Тургенев. С его помощью будут найдены все страницы, в которых между словами Иван и Тургенев находится одно слово. Причем, слово Иван всегда должно стоять перед словом Тургенев.
Теперь взгляните на еще один запрос: Васисуалий /(-1 +2) Лоханкин. Данный запрос отобразит перед вами только те страницы, которые содержат одну из фраз следующего вида:
○ Лоханкин Васисуалий;
○ Васисуалий Лоханкин;
○ Васисуалий <слово> Лоханкин.
Логические операторы. Поисковая система «Яндекс» способна обрабатывать логические операторы типа ИЛИ и НЕ.
Так, для того чтобы выполнить поиск или слова 1, или слова 2, нужно поставить между ними знак |. Например, по поисковому запросу отпуск Лондон | Париж будут отображены все страницы, в которых встречаются слова отпуск Лондон или отпуск Париж.
Если же нужно найти все страницы, на которых нет определенного слова, то следует перед этим словом поставить оператор ~~. Например, запрос компьютерный журнал – CHIP отобразит все страницы, на которых встречаются слова компьютерный и журнал, но нет слова CHIP.
Кроме того, поисковая система «Яндекс» поддерживает еще одну разновидность логического оператора НЕ. Вы можете выполнить поиск страниц, на которых определенное слово не встречается рядом с другими словами поискового запроса (в пределах одного предложения). Иными словами, данное слово может встречаться на странице, однако оно не должно находиться рядом с одним из других слов поискового запроса. Для выполнения такого поиска применяется оператор ~. Например, команда дизайн уроки – услуги выполнит поиск всех страниц, на которых встречаются слова дизайн, уроки или услуги и при этом слово услуги не встречается рядом со словами дизайн или уроки.
Настройка морфологии. По умолчанию поиск всех слов, которые вы указываете, выполняется с учетом морфологии. Если же необходимо выполнить поиск без использования морфологии, то следует поставить перед искомым словом символ !. Например, поиск по фразе ! день отобразит все страницы, на которых присутствует слово день. Такие же страницы, на которых встречаются слова дня, дней, дни (а также деть, денешь и т. д., ведь слово день является и одной из форм слова деть) в результаты поиска не попадут.
Одной из проблем поиска с учетом морфологии является то, что формы некоторых слов могут совпадать. Например, форма день слова день и форма день слова деть. Чтобы решить эту проблему, достаточно указать поиск по слову в нормальной форме. Для этого нужно поставить оператор !! перед словом, расположенным в нормальной форме. Например, запрос !!день найдет все формы данного слова (дня, дню, днем и т. д.) и не найдет форм слова деть.
Зависимости между фразами. Мы рассмотрели способы установления зависимостей между отдельными словами, однако, помимо этого, можно определять зависимости между целыми фразами либо даже между зависимостями слов. Это несложно – достаточно взять отдельную фразу в круглые скобки.
В качестве примера рассмотрим такой запрос: мумие && (лечение | лечебный | болезни)—(цена | прайс | рубли | доллар | фирма | магазин). По данному запросу будут найдены все страницы, на которых присутствует слово мумие, а также одно из слов, символизирующих его лечебные качества. При этом на страницах не должно быть слов, связанных с покупкой этого предмета.
Изменение правил релевантности. Еще одной интересной особенностью поисковой системы «Яндекс» является возможность изменения релевантности отдельных слов в поисковом запросе.
Так, чтобы изменить вес отдельного слова, нужно поставить после него оператор :<вес>. Например, запрос поисковые механизмы:5 говорит о том, что на результирующих страницах более важно слово механизмы, а не слово поисковые.
Кроме того, поисковая система позволяет определить уровень нестрогого поиска (коэффициент «мягкости»). Иными словами, вы можете определить, будут ли в результаты поиска включаться страницы, которые содержат не все из тех слов, что вы указали в запросе (пассажи). Для этого предназначены запросы вида (слова через пробел)//<число от 1 до 100>. По умолчанию поиск ведется с коэффициентом мягкости, равным 6.
При коэффициенте мягкости, равном 50, количество найденных документов должно быть примерно равно среднему геометрическому чисел найденных документов при поиске всех возможных неполных пассажей. Подробнее о коэффициенте мягкости можно прочитать на странице http://company.yandex.ru/articles/romip2004.xml.
Команды поиска
Помимо обычных запросов, поисковая система «Яндекс» может обрабатывать и специальные, сформированные при помощи особых команд. Рассмотрим основные команды.
○ $title (искомые слова) – искать указанные слова только в заголовке страниц. Например, взгляните на такой сложный запрос: Максвелл << $title (биография).
○ $anchor (искомые слова) – выполнить поиск указанных слов только в именах страниц. Например, запрос $anchor (one style) отобразит только те страницы, в имени которых встречаются слова one и style.
○ #keywords=(искомые слова) – искать указанные слова только в ключевых словах страниц (то есть внутри тега страницы).
○ #abstract=(искомые слова) – выполнить поиск указанных слов только в описании страниц (то есть внутри тега страницы).
○ #image="название" – искать только изображения, имеющие указанное название.
○ #hint=(искомые слова) – искать только изображения, в подписях к которым встречаются указанные слова.
○ #url="имя сайта" – выполнить поиск только на данном сайте. Например, запрос поисковые системы #url = «www.onestyle.com.ua» отобразит все страницы сайта www.onestyle.com.ua, на которых встречается фраза поисковые системы.
○ host="имя сайта" – выполнить поиск только на данном сайте, а также на всех его зеркалах.
Помимо оператора host, можно использовать оператор rhost. Он аналогичен оператору host во всем, кроме записи имени сайта, – имя сайта при его использовании записывается в обратном порядке. Например, rhost="ru.yandex.*".
○ #link="имя сайта" – выполнить поиск ссылок на указанный сайт.
○ #mime="тип файла" – в качестве результатов поиска отображать только файлы с заданным расширением. Например, команда Vista #mime="doc" отобразит список всех файлов с расширением DOC, содержащих слово Vista. При поиске страниц с несколькими расширениями правильнее было бы использовать запрос следующего вида: (инструкция && микроволновая печь) << (mime="pdf" | mime="rtf"), то есть запретить ранжирование страниц результата запроса по расширениям.
Поисковая система «Яндекс» индексирует содержимое файлов со следующими расширениями: HTML, PDF (Adobe Portable Document Format), DOC (Microsoft Word), PPT (Microsoft PowerPoint), XLS (Microsoft Excel), RTF (Rich Text Format), SWF (Macromedia Flash).
○ lang="язык" – выполнить поиск только среди страниц, написанных на указанном языке. Например, вы можете искать на страницах со следующими языками: