2.10. Поиск информации в Интернете

Для поиска информации в Интернете используются спе­циальные поисковые серверы, которые содержат в базах данных постоянно обновляемую информацию о Web-сайтах, файлах и других информационных ресурсах Интернета. Раз­ные поисковые серверы могут использовать различные ме­ханизмы поиска, хранения и предоставления пользователю информации.

 image174

Поисковые системы общего назначения Интерфейс по­исковых систем общего назначения содержит поле поиска и список разделов каталога.

Заполнение баз данных поисковых систем. За­полнение баз данных поисковой системы осуществляется с помощью специальных программ-роботов, которые периоди­чески «обходят» Web-серверы Интернета. Программы-роботы читают все встречающиеся документы, выделяют в них ключевые слова и заносят в базу данных, содержащую URL-адоеса документов.

Так как информация в Интернете постоянно меняется (создаются новые Web-сайты и страницы, удаляются ста­рые, меняются их URL-адреса и т. д.), поисковые роботы не всегда успевают отследить все эти изменения. Информация, хранящаяся в базе данных поисковой системы, может отли­чаться от реального состояния Интернета, и тогда пользователь в результате поиска может получить адрес уже не су­ществующего или перемещенного документа.

В целях обеспечения боль: него соответствия между со­держанием базы данных поисковой системы и реальным со­стоянием Интернета большинство поисковых систем разре­шают автору нового или перемещенного Web-сайта самому внести информацию в базу данных, заполнив регистрацион­ную анкету. В процессе заполнения анкеты разработчики сай­та вносит URL сайта, его название, краткое описание содержания сайта, а также ключевые слова, по которым легче всего будет найти сайт.

Поиск по ключевым словам. При поиске по ключе­вым словам в поле поиска вводится одно или несколько ключевых слов, которые, по мнению пользователя, являются главными дня искомого документа. Можно также исполь­зовать сложные запросы, использующие логические опера­ции, шаблоны ит. д.

Через некоторое время после отправки запроса поиско­вая система вернет аннотированный (с короткими коммен­тариями содержания документа) список URL-адресов доку­ментов, в которых были найдены указанные вал-и ключевые слова. Для просмотра этого документа в браузере достаточно активизировать указывающую на пего ссылку.

Если ключевые слова были выбраны неудачно, тс спи­сок URL-адресоз документов может быть слишком большим (содержать десятки и даже сотни тысяч ссылок). Для того чтобы уменьшить список, можно в поле поиска ввести до полнительные ключевые слова или воспользоваться катало­гом поисковой системы.

Поиск в иерархической системе каталогов. Ката­логи составляются редакторами, просматривающими каж­дый новый сайт до его включения в иерархическую систему каталогов. Каталоги обычно организованы в соответствии с предметной классификацией.

Поиск информации в каталоге сводится к выбору опре­деленного каталога, после чего пользователю будет пред­ставлен список ссылок на URL-адреса наиболее посещае­мых и важных Web-сайтов, каждая ссылка обычно аннотирована.

Современные поисковые системы. Одной из наибо­лее полных и мощных поисковых систем является Google (www.googIe.ru), в базе данных которой хранятся 8 миллиар­дов Web-страниц, и каждый месяц программы роботы зано­сят в нее 5 миллионов новых страниц. В Рунете (российской части Интернета) обширные базы данных, содержащие бо­лее 200 миллионов документов, имеют поисковые системы yndex (www.yandex.ru) и Rambler (www .rambler.ru).

Наиболее полный многоуровневый иерархический тема­тический каталог русскоязычных Интернет-ресурсов имеет поисковая система Апорт (www.aport.ru).

Сайты в базе данных ранжируются по количеству их по­сещений в день, неделю или месяц Посещаемость сайтов определяется с помощью специальных счетчиков, которые могут быть установлены на сайте. Счетчики фиксирует каж­дое посещение сайта и передаю' информацию о количестве посещений на сервер поисковой системы.

Современные поисковые системы часто являются ин­формационными порталами, которые предоставляют поль­зователям не только возможности поиска документов в Ин­тернете, но и доступ к другим информационным ресурсам (новостям, информации о погоде, валютном курсе, интерак­тивным географическим картам и т. д.).

Специализированные поисковые системы. Специализи­рованные поисковые системы позволяют искать информацию в других информационных «слоях» Интернета. Существуют специализированные поисковые системы, предназначенные для поиска файлов на серверах фай новых архивов, а также системы поиска адресов электронной почты.

Файловая поисковая система (v;ww filesearcn.ruj является специализированной поисковой системой, в базах данных

которой хранятся сведения о 6 миллионах файлов, разме­щенных на 2 тысячах серверов файловых архивов Рулета.

Системы поиска людей позволяют искать адрес электрон­ной почты по имени человека или, наоборот, имя человека, хозяина определенного адреса электронной почты. В окно по­иска необходимо ввести имя и фамили~о, после чего система осуществит поиск адреса электронной почты в базы данных, содержащей информацию об абонентах, зарегистрированных в системе.

Контрольные вопросы

1.Каким образом наполняются базы данных поисковых систем?

2. В каких случаях активизация найденной с помощью поисковой сис­темы ссылки на документ может выдавать сообщение об ошибке?