Правовая аналитика — страница 34 из 56

5 Минаев С. Media Sapiens . Повесть о третьем сроке. - М.: Изд-во «Астрель». - 311 с.

167

Как мы отмечали выше, профессиональный поиск, как составная часть

ССИ, предполагает исполнение некоторого заказа с вытекающими отсюда

обязательствами перед заказчиком. Эти обязательства и являются источником

трех дополнительных требований6:

контроль полноты охвата ресурсов;

контроль достоверности информации, полученной в результате поиска;

высокая скорость проведения поиска.

Заказчик вправе потребовать от аналитика, помимо собственно

результатов поиска, еще и некоторых гарантий по указанным выше пунктам.

Такие гарантии может дать лишь человек, хорошо осведомленный в тонкостях

распределения и движения информационных потоков в Интернете.

Контроль полноты охвата ресурсов является необходимым требованием,

так как системный аналитик не может подменять поиск и систематизацию

полной информации установкой на поиск «хотя бы чего-нибудь», так как даже

в малой частице пропущенной информации могут содержаться сведения,

способные радикально повлиять на весь ход и выводы заказанного системного

анализа.

Полномасштабный сбор информации в Интернете по какому-либо

вопросу во многих случаях выводит аналитика за пределы широко освоенного

Web-пространства в область малодоступных баз данных, региональных

телеконференций и даже персональных дневников, размещенных в сети. Знание

всех основных существующих на сегодняшний день типов ресурсов Сети,

понимание технической и тематической специфики их информационного

наполнения и особенностей доступа становится необходимым условием

успешного планирования и проведения поисковых работ.

Контроль достоверности информации, полученной из Сети в результате

поиска, разумеется, может производиться разными средствами.

Традиционными способами проверки являются: локализация источников

информации, альтернативных данному; сверка фактического материала,

установление частоты использования одного источника другими; выяснение

статуса документа и рейтинга узла, на котором он находится средствами

поисковых систем, получение информации о компетентности и статусе автора

материала с помощью специальных поисковых сервисов; анализ отдельных

элементов организации узла с целью оценки квалификации поддерживающих

его специалистов. (…)

Скорость проведения поиска в Сети. Если не принимать во внимание

технические характеристики подключения пользователя, то скорость

проведения поиска зависит, в основном, от двух факторов. Это грамотное

планирование поисковой процедуры и навыки работы с ресурсом выбранного

типа. Под составлением плана поисковых работ понимается, как мы говорили

6 Талантов М. Профессиональный поиск в Интернете: полнота, достоверность, скорость //

КомпьютерПресс. - 1999. - № 7.

168

выше, декомпозиция запроса и определение ключевых для поиска средств. При

этом необходим выбор поисковых сервисов и инструментов, отвечающих

специфике задачи и, что крайне важно, последовательности их применения в

зависимости от ожидаемой результативности.

Для решения проблемы поиска информации в Интернете существует

целый ряд поисковых систем. Их основная задача - давать ответы на вопросы

пользователей. Например, если мы «спросим» у поисковой системы, где в

виртуальном пространстве находится Российская Национальная библиотека, то

она в ответе укажет на ссылку (адрес в сети Интернет), воспользовавшись

которой мы окажемся на сервере библиотеки. Без поисковых систем пришлось

бы наугад перебирать адреса. Может быть, мы даже нашли бы когда-нибудь

нужный адрес (http://www.rnb.ru).

Поисковые системы можно условно разделить на два класса. Первый - это

автоматические роботы-индексаторы, т.е. в нашей терминологии - субъекты

КС, которые без участия человека постоянно сканируют информационное

пространство Интернета и индексируют (т.е. устанавливают связи между

понятиями и содержанием страниц) почти все, что им попадется. Результаты

своей работы они заносят в базу данных, из которой потом извлекается ответ на

запрос пользователя. Такие системы должны постоянно «передвигаться» по

Интернету: искать новые документы и обновлять старые. Для этого они

подключены к Сети через мощные каналы связи.

Второй класс - тематические каталоги, которые с самого начала были

созданы не для того, чтобы собрать под свою крышу абсолютно все. В

каталогах вся информация рассортирована по темам, причем в них содержится

информация, обработанная человеком. Это означает, что по каждому ресурсу

Интернета (страница, документ, сайт, сервер) составляется краткая справка:

содержание, ссылки на другие ресурсы, автор, фирма и т.п. Ценность

информации в каталогах значительно выше, чем в автоматических индексах,

но, к сожалению, ее и значительно меньше. Стоит заметить, что многие

каталоги не бесплатны, особенно это касается тех, которые содержат

коммерческую информацию. Вот несколько рекомендаций по практическому

нахождению информации с помощью поисковых систем:

• необходимо иметь в виду, что ответы на один и тот же вопрос в различных

поисковых системах не совпадают, поэтому для получения полного

ответа на свой вопрос надо провести поиск с помощью нескольких

поисковых систем;

• при первом ознакомлении с интересующей темой лучше всего начинать с

тематических каталогов.

Обзор поисковых систем. Русскоязычным пользователям, которым нужно

найти что-то в Рунете (в доменной зоне имен «.га»), лучше всего начинать

поиск с российских поисковых систем, и в первую очередь - с поисковой

169

машины Япdех. Для следующих этапов поиска вполне подойдут Rambler и

Mail.ru. Во многих случаях уточнить результаты поиска в Япdех можно с

помощью глобальной поисковой системы Google.

Русская буква «Я» среди латинских в названии Япdех не ошибка, а

пожелание авторов системы. В английском варианте название становится более

читаемым - Yandex. Но в любом случае перед нами весьма перспективная

поисковая машина (слово «машина» - это также изыск авторов), которая

находится по адресу: http://www.yandex.ru.

Поисковая система Япdех за последнее время несколько раз меняла свой

дизайн и расширяла сервисные функции, а в локализованной версии Internet

Explorer 5 вошла в число признанных Microsoft поисковых систем. Теперь у

поисковой системы два адреса в Интернете: http://www.yandex.ru и

http://www.ya.ru. По первому адресу находится портал, где можно найти

информацию, получить доступ к новостям, создать свой почтовый ящик. По

второму адресу располагается веб-страница, на которой имеется только форма

для ввода запроса.

Сегодня Япdех декларирует, что работает в режиме обработки запроса на

естественном языке, а также утверждает, что такой возможности нет у других

поисковых систем. В идеале это означает, что машина ищет не просто по всем

словам, указанным в запросе, а «с пониманием смысла». Вы вводите слово или

фразу, а ответ дается в соответствии со смысловой нагрузкой запроса.

Например, если задан запрос «идти», то в результате поиска будут найдены

ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т.д.

На запрос «окно» будет выдана информация, содержащая и слово «окон», а на

запрос «отзывали» - документы, содержащие слово «отозвали».

При составлении запросов надо учесть, что Яndex использует сложный

язык запросов, синтаксис которого только в общих чертах совпадает с языками

запросов у других поисковых систем, например:

+<слово> - искать документы, в которых присутствует данное слово.

Запрос доска объявлений + велосипед покажет все объявления о продаже

велосипедов;

-<слово» - требует отобрать документы, в которых не содержится данное

слово;

“<слово><слово>” - поиск документа с образцом фразы;

<слово>~<слово> - поиск документа, в котором содержится первое

слово, но отсутствует второе.

При поиске следует учесть, что Япdех различает строчные и прописные

буквы (это зависит от режима обработки запроса).

Поисковая машина Япdех обладает самым быстрым механизмом

обновления и поиска новой информации. Можно примерно считать, что для

этого требуется 1-2 недели. Но полностью весь Рунет она не просматривает,

хотя количество выдаваемых ссылок максимально среди остальных поисковых

систем.

На Япdех кроме поисковой машины вы найдете каталог интернет-

ресурсов и другие интересные сервисы. Например, в ряде случаев может быть

170

интересна система «Закладки», которая разрешает пользователям сохранять