Статьи

В поисках лучшего поиска

Сеть пожирает кучу времени, это факт. Как сократить время поиска нужной информации в интернете? Вехи большого пути Предком всех поисковых систем был Архи, созданный в 1990 Ланом Эмтайджом, студентом Университета МакГилл в Монреале.

Архи занялся благим делом - собирал и индексировал все FTP (Fie Transfer Protoco) сайты, обеспечивая доступ пользователей к своей базе данных. А первым роботом (программой, исследующей сеть) было творение Мэтью Грэя, называлось оно Wanderer. Сначала Wanderer работал только с серверами. Потом начал просматривать их содержание и собирать UR (адреса ресурсов). База данных, составленная Wanderer, - первая база данных UR в сети. Поисковая система Exite ведет свою историю из проекта Архитекст, созданного студентами Стэнфорда в феврале 1993. Их идея - в статистическом анализе слов и словосочетаний.

Именно этот принцип лежит в основе Exite и многих других поисковых систем. В это же время выпускники того же Стэнфорда Дэвид Фило и Джерри Янг вместо диссертации составляли список своих любимых сайтов. Через год это превратилось в популярнейший каталог Yahoo!, что потом принесло создателям миллиардные состояния. Они такие разные Эксперты подсчитали, что даже самые крупные поисковые системы работают с небольшим сектором сети - около 800 миллионов страниц.

Кроме того, они имеют не только различные базы данных, но и осуществляют поиск в этих базах по-разному. Сейчас в сети доступно более сотни поисковых систем. Вообще-то, поисковая система - это программа, осуществляющая поиск в интернете по заданным ключевым словам. Это могут быть, например, сетевые каталоги, как широко известный Yahoo! (yahoo). Каталоги периодически обновляют и исправляют длинные списки ссылок на каждую из тысяч предметных областей.

Удобно пользоваться, когда точно не знаешь, что ищешь. Другие используют специальное программное обеспечение. Такие программы-роботы называют пауками - spiders. Они исследуют сеть в поисках новых сайтов и индексируют их для занесения в базу данных. Например, AtaVista (atavista) и Excite (excite). Такие базы содержат максимальное количество интернет-страниц, но поиск через них не всегда приводит к нужному сайту. Хотя бы потому, что сообразительные веб-мастера помещают невидимые ключевые слова, которые, по их мнению, повысят посещаемость их сайта. Например, на запрос 'Pamea Anderson ee' AtaVista находит почти 52 000 ссылок.

Двадцатым в этом списке оказался сайт, предлагающий платный доступ к сети, не имеющий никакого отношения к звезде Плэйбоя. А есть и такие системы, как ycos (ycos), которые комбинируют результаты поиска в каталоге и автоматического контентного поиска. Одно время большие надежды возлагали на идею 'метапоиска', воплощенную, например, в MetaCrawer (metacrawer). Суть здесь в просмотре результатов других поисковых систем (ycos, AtaVista, Yahoo!, Excite, WebCrawer, и Infoseek) и выдаче только пересечения данных. Плохо то, что этот метод занимает много времени и не дает принципиально новых результатов.

Русские поисковые системы используют классический контентный метод ранжирования результатов поиска. То есть располагают сайт в списке результатов в зависимости от частоты употребления заданного ключевого слова. По оценкам экспертов, "Яндекс" (yandex) дает более релевантные запросу результаты, чем второй кит поиска в рунете "Рамблер" ( ramber). Новый уровень Последние же разработки вывели поисковые системы на другой уровень. Так, например, Googe (googe) использует для поиска саму природу гипертекста - он располагает сайты в порядке, зависящем от количества ссылок на них со страниц, содержащих те же ключевые слова.

То есть появляются возможности для продолжения самостоятельного поиска, и к тому же первым выдается самый нужный сайт по заданной теме, раз все на него ссылаются. 'Популярный поиск' - так себя характеризует другая относительно молодая система DirectHit (directhit). Она основывается на том, какие сайты смотрели люди по аналогичному запросу, учитывается даже, как долго они были на той или иной странице. Объективно. Хозяйке на заметку: самыми популярными поисковыми системами прошлого года по данным Media Metrix (система замера использования сайтов) стали новички ookSmart и Ask Jeeves.

Формула успеха Сотни левых ссылок в результатах поиска не всегда только проблема пользователя. Поисковые системы обычно виноваты больше - хотя бы в том, что далеко не всегда снабжают посетителя данными о том, как они работают, и как лучше всего использовать их ресурсы себе на пользу. Кроме принципов поиска, системы различаются и по тому, как пользователь должен формулировать запрос. Для большинства подойдет набор ключевых слов - попытайся быть как можно более точным, используй всю информацию, которая уже у тебя есть. Чем реже употребляются слова, которые ты ввел, тем более точным будет результат поиска.

Кроме того, многие поисковые системы поддерживают булеановскую логику. Это логика, использующая слова and, or, not - то есть, можно формулировать запрос как 'Дом и Сад нет Забора'. Еще помогает поставить знак '=' перед словом, если нужно получить сайты, содержащее именно указанное слово, и, наоборот, написать перед ключевым словом 'near', если сфера интересов шире. О том, какие еще возможности поддерживает поисковая система, которой ты решил воспользоваться, не стесняйся читать в Hep или About - ни один самый прожженый серфер не помнит всего. И еще - замечено, что пользователи после нескольких раз просто прикипают сердцем к полюбившейся поисковой системе - поэксперементируй, попробуй что-то новое. Ведь поиск в Сети -это, скорей, искусство, где нет определенных правил.

e-max.it: your social media marketing partner

You have no rights to post comments

СКА - это Светлая утренняя музыка Музыка СКА, очень нравится скинхедам. Но группа Spitfire, которая играет эту музыку, по-всячески гоняет "скинов" со своих концертов.
С каждым днём всё более популярным источником информации становится ИНТЕРНЕТ. Практически каждый телевизионный канал, каждая газета - имеют в "инете" свои собственные стр...
Весна в Питере - замечательное время. В воздухе уже витает ощущение опасности и приключений. Почуяв его, выходят из состояния спячки медведи и байкеры.