5 Минаев С. Media Sapiens . Повесть о третьем сроке. - М.: Изд-во «Астрель». - 311 с.
167
Как мы отмечали выше, профессиональный поиск, как составная часть
ССИ, предполагает исполнение некоторого заказа с вытекающими отсюда
обязательствами перед заказчиком. Эти обязательства и являются источником
трех дополнительных требований6:
•
контроль полноты охвата ресурсов;
•
контроль достоверности информации, полученной в результате поиска;
•
высокая скорость проведения поиска.
Заказчик вправе потребовать от аналитика, помимо собственно
результатов поиска, еще и некоторых гарантий по указанным выше пунктам.
Такие гарантии может дать лишь человек, хорошо осведомленный в тонкостях
распределения и движения информационных потоков в Интернете.
Контроль полноты охвата ресурсов является необходимым требованием,
так как системный аналитик не может подменять поиск и систематизацию
полной информации установкой на поиск «хотя бы чего-нибудь», так как даже
в малой частице пропущенной информации могут содержаться сведения,
способные радикально повлиять на весь ход и выводы заказанного системного
анализа.
Полномасштабный сбор информации в Интернете по какому-либо
вопросу во многих случаях выводит аналитика за пределы широко освоенного
Web-пространства в область малодоступных баз данных, региональных
телеконференций и даже персональных дневников, размещенных в сети. Знание
всех основных существующих на сегодняшний день типов ресурсов Сети,
понимание технической и тематической специфики их информационного
наполнения и особенностей доступа становится необходимым условием
успешного планирования и проведения поисковых работ.
Контроль достоверности информации, полученной из Сети в результате
поиска, разумеется, может производиться разными средствами.
Традиционными способами проверки являются: локализация источников
информации, альтернативных данному; сверка фактического материала,
установление частоты использования одного источника другими; выяснение
статуса документа и рейтинга узла, на котором он находится средствами
поисковых систем, получение информации о компетентности и статусе автора
материала с помощью специальных поисковых сервисов; анализ отдельных
элементов организации узла с целью оценки квалификации поддерживающих
его специалистов. (…)
Скорость проведения поиска в Сети. Если не принимать во внимание
технические характеристики подключения пользователя, то скорость
проведения поиска зависит, в основном, от двух факторов. Это грамотное
планирование поисковой процедуры и навыки работы с ресурсом выбранного
типа. Под составлением плана поисковых работ понимается, как мы говорили
6 Талантов М. Профессиональный поиск в Интернете: полнота, достоверность, скорость //
КомпьютерПресс. - 1999. - № 7.
168
выше, декомпозиция запроса и определение ключевых для поиска средств. При
этом необходим выбор поисковых сервисов и инструментов, отвечающих
специфике задачи и, что крайне важно, последовательности их применения в
зависимости от ожидаемой результативности.
Для решения проблемы поиска информации в Интернете существует
целый ряд поисковых систем. Их основная задача - давать ответы на вопросы
пользователей. Например, если мы «спросим» у поисковой системы, где в
виртуальном пространстве находится Российская Национальная библиотека, то
она в ответе укажет на ссылку (адрес в сети Интернет), воспользовавшись
которой мы окажемся на сервере библиотеки. Без поисковых систем пришлось
бы наугад перебирать адреса. Может быть, мы даже нашли бы когда-нибудь
нужный адрес (http://www.rnb.ru).
Поисковые системы можно условно разделить на два класса. Первый - это
автоматические роботы-индексаторы, т.е. в нашей терминологии - субъекты
КС, которые без участия человека постоянно сканируют информационное
пространство Интернета и индексируют (т.е. устанавливают связи между
понятиями и содержанием страниц) почти все, что им попадется. Результаты
своей работы они заносят в базу данных, из которой потом извлекается ответ на
запрос пользователя. Такие системы должны постоянно «передвигаться» по
Интернету: искать новые документы и обновлять старые. Для этого они
подключены к Сети через мощные каналы связи.
Второй класс - тематические каталоги, которые с самого начала были
созданы не для того, чтобы собрать под свою крышу абсолютно все. В
каталогах вся информация рассортирована по темам, причем в них содержится
информация, обработанная человеком. Это означает, что по каждому ресурсу
Интернета (страница, документ, сайт, сервер) составляется краткая справка:
содержание, ссылки на другие ресурсы, автор, фирма и т.п. Ценность
информации в каталогах значительно выше, чем в автоматических индексах,
но, к сожалению, ее и значительно меньше. Стоит заметить, что многие
каталоги не бесплатны, особенно это касается тех, которые содержат
коммерческую информацию. Вот несколько рекомендаций по практическому
нахождению информации с помощью поисковых систем:
• необходимо иметь в виду, что ответы на один и тот же вопрос в различных
поисковых системах не совпадают, поэтому для получения полного
ответа на свой вопрос надо провести поиск с помощью нескольких
поисковых систем;
• при первом ознакомлении с интересующей темой лучше всего начинать с
тематических каталогов.
Обзор поисковых систем. Русскоязычным пользователям, которым нужно
найти что-то в Рунете (в доменной зоне имен «.га»), лучше всего начинать
поиск с российских поисковых систем, и в первую очередь - с поисковой
169
машины Япdех. Для следующих этапов поиска вполне подойдут Rambler и
Mail.ru. Во многих случаях уточнить результаты поиска в Япdех можно с
помощью глобальной поисковой системы Google.
Русская буква «Я» среди латинских в названии Япdех не ошибка, а
пожелание авторов системы. В английском варианте название становится более
читаемым - Yandex. Но в любом случае перед нами весьма перспективная
поисковая машина (слово «машина» - это также изыск авторов), которая
находится по адресу: http://www.yandex.ru.
Поисковая система Япdех за последнее время несколько раз меняла свой
дизайн и расширяла сервисные функции, а в локализованной версии Internet
Explorer 5 вошла в число признанных Microsoft поисковых систем. Теперь у
поисковой системы два адреса в Интернете: http://www.yandex.ru и
http://www.ya.ru. По первому адресу находится портал, где можно найти
информацию, получить доступ к новостям, создать свой почтовый ящик. По
второму адресу располагается веб-страница, на которой имеется только форма
для ввода запроса.
Сегодня Япdех декларирует, что работает в режиме обработки запроса на
естественном языке, а также утверждает, что такой возможности нет у других
поисковых систем. В идеале это означает, что машина ищет не просто по всем
словам, указанным в запросе, а «с пониманием смысла». Вы вводите слово или
фразу, а ответ дается в соответствии со смысловой нагрузкой запроса.
Например, если задан запрос «идти», то в результате поиска будут найдены
ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т.д.
На запрос «окно» будет выдана информация, содержащая и слово «окон», а на
запрос «отзывали» - документы, содержащие слово «отозвали».
При составлении запросов надо учесть, что Яndex использует сложный
язык запросов, синтаксис которого только в общих чертах совпадает с языками
запросов у других поисковых систем, например:
+<слово> - искать документы, в которых присутствует данное слово.
Запрос доска объявлений + велосипед покажет все объявления о продаже
велосипедов;
-<слово» - требует отобрать документы, в которых не содержится данное
слово;
“<слово><слово>” - поиск документа с образцом фразы;
<слово>~<слово> - поиск документа, в котором содержится первое
слово, но отсутствует второе.
При поиске следует учесть, что Япdех различает строчные и прописные
буквы (это зависит от режима обработки запроса).
Поисковая машина Япdех обладает самым быстрым механизмом
обновления и поиска новой информации. Можно примерно считать, что для
этого требуется 1-2 недели. Но полностью весь Рунет она не просматривает,
хотя количество выдаваемых ссылок максимально среди остальных поисковых
систем.
На Япdех кроме поисковой машины вы найдете каталог интернет-
ресурсов и другие интересные сервисы. Например, в ряде случаев может быть
170
интересна система «Закладки», которая разрешает пользователям сохранять