Google — самая популярная поисковая машина в интернете — имеет в своем штате группу специалистов, которые помогают разработчикам сайтов улучшать статистику обращений на их страницы.

Матт Куттс — один из этих специалистов — говорит, что компания Google старается обеспечить решение проблем, с которыми сталкиваются разработчики сайтов, путем применения автоматизированных программ, включенных в инструментарий поисковой машины.

По мнению специалистов компании, более 4 млрд. страниц, которые каталогизированы в Google, должны быть созданы в определенном формате, чтобы обеспечить их эффективный поиск с помощью созданного компанией интерфейса.

Однако требовать применения этого формата ко всему этому гигантскому объему информации невозможно. Поэтому Google применяет для решения этой проблемы поэтапный подход. Сделать это позволяют огромные средства, выделяемые на исследования и разработки. В этом году компания намерена потратить 250 млн. долларов на эти цели.

Поисковая машина, созданная компанией Google, отличается от многих прочих тем, что ищет сайты и страницы в интернете не по ключевым словам, а по статистике ссылок или обращений на них. Именно поэтому результаты поиска в этой системе ранжируются иначе, чем в Yahoo или MSN.

Именно из-за этой специфики поисковой машины Google статистику обращения в ней нельзя улучшить за счет просто включения в код страницы ключевых слов. Гораздо важнее тут общая архитектура конкретного сайта и отсутствие ошибок при написании отдельных страниц.

При этом компания не слишком стремится обнародовать сведения о своей структуре и технических ресурсах. Никто не знает, сколько серверов установлено в ее центрах. Оценки колеблются от 10 до 80 тысяч. Через эти машины проходит поток информации объемом более 6 тысяч терабайт.

В отличие от других подобных компаний, Google не тратит деньги на установку дорогостоящих и надежных серверов. Вместо этого компания использует дешевые компьютеры массового производства, которые легко заменять на еще более дешевые и быстродействующие машины.

Секрет эффективности поисковой машины Google заключается в совершенстве применяемых ею методов анализа содержания Всемирной сети. Созданные ее специалистами алгоритмы поиска постоянно обновляются и совершенствуются.

Как рассказывает Матт Куттс, модель индекса Всемирной паутины, на которой базируется поисковая машина Google, постоянно обновляется. В данном случае речь идет о формализованной математической модели всех адресов в Сети и связей между ними. Это нечто вроде оглавления интернета или каталога постоянно растущего числа файлов в нем.

Причем сейчас это делается на более регулярной основе, чем в недалеком прошлом. Тогда такое обновление происходило раз в месяц, что приводило иногда к резким скачкам в статистике.

Как рассказывает Матт Куттс, создание эффективной поисковой системы рассматривается руководством компании Google в качестве плацдарма для развития обширного круга иных услуг, в том числе почтовой службы.

08 июня 2004 г., 14:38 GMT 18:38 MCK

Би-би-си

*