Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Белорусские компьютерные новости Выпуск от 10/11/2000 #3


Служба Рассылок Subscribe.Ru проекта Citycat.Ru
Vespol News Poisk in ByNet

ВЕСПОЛ

Белорусские компьютерные новости

10 ноября 2000 г.

 

Где искать в Байнете?

 

Рано или поздно такой вопрос возникает у любого белорусского пользователя Интернета. Ответ очевиден - искать надо с помощью поисковых систем. А это специально созданные узлы WWW, основная функция которых состоит в поиске информации среди различных информационных ресурсов Интернет (серверы WWW, FTP, Gopher, телеконференции, UseNet, списки адресов E-mail). Бывают они разные и классифицируются по методам поиска информации. Существует три основных типа таких систем: поисковые каталоги, поисковые индексы и гибридные системы поиска.

В поисковый каталог информация заносится по инициативе человека. Добавляемая страница должна быть жестко привязана к принятым в каталоге категориям. Результатом является постоянно обновляющийся иерархический (древовидный) каталог, на верхнем уровне которого собраны самые общие категории, такие как "бизнес", "наука", "искусство" и т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные web-страницы и сервера вместе с кратким описанием их содержимого. Предметные каталоги предоставляют также возможность автоматического поиска по ключевым словам. Только поиск происходит не в содержимом самих web-серверов, а в их кратких описаниях, хранящихся в каталоге. Поисковые каталоги обеспечивают высокое качество поиска и по качеству сортировки документов намного превосходят поисковые индексы, проигрывая им по количеству просмотренных документов.

Поисковые или автоматические индексы (spiders, crawlers) постоянно исследуют Интернет с целью пополнения своих баз данных. Обычно это не требует никаких усилий со стороны человека. Программа, в которую загрузили несколько тысяч общеизвестных URL-адресов, будучи запущена на компьютере с доступом к WWW, начинает автоматически скачивать из сети документы по этим URL. Причем из каждого нового документа она извлекает все содержащиеся в нем ссылки и добавляет их в свою базу адресов. Преимуществами этих систем являются большие базы данных и высокая скорость обработки запросов. К недостаткам можно отнести очень большое количество ссылок на выходе, причем большая часть этих документов имеет весьма отдаленное отношение к нужной теме.

Гибридные системы поиска сочетают в себе поисковые каталоги и индексы. Существуют ещё и метапоисковые системы (поисковые службы), которые рассылают запросы пользователя одновременно нескольким поисковым серверам и обращаются к некоторым другим источникам информации. Затем они объединяют полученные результаты и представляют их пользователю в виде HTML-страницы с активизируемыми URL-ссылками.

Какие же есть белорусские поисковые системы и как их можно найти? Конечно, существуют такие поисковики, которые известны практически всем. Ну, что там у нас на слуху? All.by, poisk.com, br.by. Также можно спросить у своих знакомых и друзей. И, наконец, просто поискать в уже известных нам поисковиках. Так и поступим, а заодно и проверим их, устроив своеобразное тестирование. Для этого везде будем вводить одинаковый текст запроса, например "каталог ресурсов" и посмотрим, где и сколько будет соответствий. Попутно обратим внимание на количество ресурсов, заявленных в этих каталогах и на их рубрикатор. Кстати, под ресурсом понимается сайт в целом, а под документом - информация, находящаяся на какой либо страничке сайта. Итак, поехали. А результаты приведём в таблице.

 

Название поисковой службы

Количество ресурсов

Количество категорий

Выдано ресурсов после запроса

Соответствие запросу

"21 век": vek.virtualave.net< o:p>

?< o:p>

-< o:p>

39< o:p>

7< o:p>

BelResource.com.by

6781

9

12

6

Poisk.com

1103

8

1

0

Br.by

996

14

9

5

All.by

1827

8

22

14

Agapov.com

304

14

25

6

"*.by": search.promedia.minsk.by

?

-

18 817 документов

11

Zubr.com

487

12

38

18

 

Таблица 1: Белорусские поисковики и каталоги с функцией поиска

 

Как видно из таблицы, по соответствию запросу, бесспорным лидером этого эксперимента оказался Zubr.com. И количество выданных ссылок реально просмотреть, и соответствий достаточно. Обидно одно, что количество ресурсов пришлось считать самому, как говорится вручную. На втором месте поисковый индекс и каталог All.by. Здесь, кстати, представляется информация не только о количестве ресурсов, содержащихся в базе, но и о количестве документов - 60 070, что, кстати, представляет отдельный интерес. Выдаваемая информация делится на две части: ссылки на ресурсы и ссылки на документы. Очень удобно. Кстати, кто ещё не знает, all.by это новое имя и лицо старого, доброго 09.open.by.

На третьем месте поисковая служба *.by. Как вы заметили, только *.by выдаёт в результате ссылки на документы, а не на сайты. Не знаю, у кого хватит сил и нервов просмотреть всю эту кучу документов. Лично меня хватило на 60 ссылок, в которых я и нашёл 11 соответствий. Вполне возможно, что если просмотреть всё, то можно найти и больше, но это уже не для меня. Есть на этом сайте и приятные вещи, а именно дополнительные параметры запросов, с помощью которых можно повысить точность выдаваемых ссылок, а так же снизить их количество.

Интересно получилось с poisk.com. При поиске по каталогу он выдал только одну ссылку на российский каталог list.ru. Причём, если посмотреть в рубрикаторе, то имеется 13 ссылок на каталоги ресурсов. Почему же они не были выданы при поиске? У poisk.com имеется ещё возможность поиска в Yandex-Беларусь. Вот он то и вывалил ссылки на 479 документов, а это не менее 76 серверов. Просмотрев первые 20 ссылок, я нашел 9 соответствий, а дальше, честно говоря, было просто лень смотреть. Кстати, у poisk.com имеется неплохой расширенный поиск, в котором указывается страна, город, язык, зона, рубрика и др. параметры, что тоже может помочь облегчить поиск. Ну а остальные поисковики выдали по 5-7 соответствий.

Что же мы нашли в результате поиска? Приведем ещё одну таблицу уже с результатами поиска по белорусским каталогам ресурсов. Здесь оцениваемыми параметрами будут количество ресурсов и категорий первого уровня, то есть те категории, которые находятся на заглавной странице каталога.

 

Название

Количество ресурсов

Количество категорий

Акавiта: akavita.kryvia.net

734

54

Винт: bsm.unibel.by/vint/

140

24

Новый век: highwebs.com/vek/

436

A:Я и A:W

Белхом: кv.minsk.by/belhome< o:p>

69

6

Интересные www-сайты в и о Беларуси: аc.by/country/

~4000< o:p>

16

Minsk in Person: mips.virtualave.net

31

-

Биф: bif.by

311

12

BelYahoo: bsuir.edu.by:81/~mak/link/

~1220

22

Весь Белорусский Интернет: danila.w3.to

~400

39

 

Таблица 2: Белорусские каталоги без функции поиска

 

Теперь для анализа будем использовать данные обеих таблиц. Итак, все каталоги можно разделить по количеству ресурсов на два типа. К примеру, на каталоги, содержащие до 1 000 ресурсов и соответственно более 1 000. Как видно из таблиц, к первому типу относится большинство каталогов - 10. Ко второму относится только 5 каталогов. Но заметьте, что у каталогов первого типа рубрикатор в основном больше. Взять, к примеру "Акавiту", "Весь белорусский Интернет" или "Винт". Здесь "Акавiта" вообще лидер, по количеству рубрик дальше всех ушла. С одной стороны это удобно - всё перед вами и не надо лазить по всему дереву каталога, что бы найти интересующую категорию. Но с другой стороны, глаза просто разбегаются, когда смотришь на эти 54 рубрики.

Второй тип каталогов берёт своё количеством ресурсов. Взять, к примеру, BelResource.com.by. Пускай у него всего только 9 категорий первого уровня, но зато более 6 700 ресурсов. Прежде всего, это каталог белорусских ресурсов, но здесь регистрируются не только белорусские сайты. К этому же типу относится еще один привлекательный каталог - "Интересные www-сайты в и о Беларуси". Дело в том, что этот каталог предоставляет ссылки на многоязычные информационные ресурсы, посвящённые нашей стране. Хотите узнать, что пишут и думают о нас в других странах, тогда вперёд. Причём каталог постоянно находится в стадии развития и пополняется почти ежедневно. Там есть что посмотреть и почитать, если конечно вы знаете ещё какой-нибудь язык, кроме русского. Например, здесь можно почитать о Минске на французском или итальянском языках.

Итак, какие же всё-таки будут итоги? Просмотрев эти каталоги, я пришёл к выводу, что:

·        информацию о компьютерах и Интернете лучше всего искать на - belresource.com.by, all.by, br.by, poisk.com;

·        о науке и образовании - belresource.com.by, all.by, br.by, zubr.com, аc.by/country;

·        о политике - all.by, br.by, poisk.com, аc.by/country, belresource.com.by, аkavita.kryvia.net;

·        о культуре и искусстве - belresource.com.by,аc.by/country, all.by, аkavita.kryvia.net, poisk.com;

·        о бизнесе - belresource.com.by, all.by, аkavita.kryvia.net, poisk.com, zubr.com;

·        о здоровье и медицине - belresource.com.by, all.by,br.by, аkavita.kryvia.net;

·        о новостях и СМИ - all.by, br.by, poisk.com,аc.by/country, belresource.com.by, zubr.com;

·        об отдыхе и развлечениях - belresource.com.by, all.by, poisk.com, br.by, аkavita.kryvia.net.

А что касается результатов по запросам, то они, конечно, относительны. Ведь если взять другой текст, то и результат может получиться совершенно отличным от данного. Не берусь утверждать какой поисковик или каталог лучше. Об этом можно спорить очень и очень долго. Лучший вариант - если вы сами попробуете поработать с той или иной поисковой службой и в последствии выберете именно то, что вам нравится и подходит. Я сделал именно так. И теперь вряд ли перестану дружить с All.by.

 

 

Игорь Яковлев

Информационное агентство "Веспол"

vespol@tyt.by

 

 

Новости принимаются по адресу - vespol@tyt.by

 

Архив рассылки - http://www.subscri be.ru/catalog/comp.soft.bymarket

 

 

Данное сообщение проверено с помощью антивирусного пакета AVP Gold.

Обновление антивирусной базы от 07.11.2000

 



http://subscribe.ru/
E-mail: ask@subscribe.ru

В избранное