ISO, менеджмент, консалтинг, маркетинг. - материалы об управлении и маркетинге
домой - первая страницаконтактная информацияпользователи сайтаподписка на новости и статьи в RSSсловарь терминовПРАКТИКАФОРУМЫскачать ISO, ГОСТссылкидобавить 
Логин : Пароль:  
       [регистрация] [напомнить пароль]

ФОРУМ
• Типы несоответстви... (23)
 29. Авг 18:04 от guest
• ISO/IEC TR 90005? (80)
 29. Авг 15:55 от Al-cash
• Re: Бизнес процесс... (83)
 28. Авг 17:12 от Alex9994
• Управление докумен... (131)
 21. Авг 16:46 от KochevaED
• Помогите разгадать... (2)
 20. Авг 12:50 от Nasti




место для друзей проекта
 

Google может стать впятеро быстрее

Автор Уинстон Кхай
Ссылка по теме:  ZDNet.ru
оценка читателей: 235 из 470 считают его полезным
раздел: обзоры и интервью / Интернет и маркетинг / WEB-серфинг

Уинстон Кхай (Winston Chai), специально для ZDNet News

Ученые из Стэнфордского университета опубликовали работу о том, как придать поисковой машине Google гигантское ускорение.

Пользователи любят поисковую машину Google за ее быстроту, но команда из Стэнфорда предложила способ сделать ее еще в пять раз быстрее. При таком запасе быстродействия Google можно будет настраивать индивидуально для каждого пользователя. Например, спортивному болельщику по ключевому слову tiger будут выпадать страницы не о крупной азиатской кошке, а об игроке в гольф Тайджере Вудсе.

Сейчас система ранжирования Google использует метод PageRank, изобретение соучредителя компании Ларри Пейджа. Этот алгоритм определяет популярность и релевантность веб-сайтов по тому, как часто на них ссылаются другие сайты. «Вычисление PageRank для миллиарда веб-страниц может занять несколько дней. Сейчас Google ранжирует и разыскивает три миллиарда веб-страниц, и для каждого персонализированного или тематического ранжирования требуются отдельные многодневные расчеты», — говорится в заявлении университета.

Чтобы ускорить работу PageRank, стэнфордские ученые разработали три метода, основанных на линейной алгебре. Эти методы описаны в трех работах, представленных на Двенадцатой ежегодной конференции по World Wide Web в Будапеште (Венгрия).

Первый метод, BlockRank, дает самое значительное — трехкратное — ускорение PageRank. В нем используется сделанное учеными открытие: на большинстве сайтов до 80% ссылок указывают на другие страницы того же сайта, так что каждый сайт похож на толстый блок ссылок. PageRank обрабатывает каждую ссылку отдельно, а более эффективный метод BlockRank рассматривает все эти внутренние ссылки сайта как одно целое и, только покончив с ними, переходит к внешним ссылкам.

Второй метод использует экстраполяцию. Прежде чем сканировать веб, выдвигаются определенные предположения о важности сайта. В процессе сканирования эти предположения либо подтверждаются, либо отбрасываются, так что по мере увеличения числа обработанных ссылок растет и точность оценок. Когда собирается достаточное количество свидетельств, производится экстраполяция — то есть делается догадка о ранге сайта. По сравнению с PageRank, где ранг сайта определяется лишь по окончании обширного обследования веба, метод экстраполяции работает на 50% быстрее.

Третий метод, называемый Adaptive PageRank, опирается на тот факт, что сайты с более низким рангом обычно обсчитываются быстрее, чем сайты с более высоким. Отказавшись от дальнейшей обработки таких быстро обсчитываемых сайтов, можно увеличить быстродействие на величину до 50%.

Хотя у каждого из этих методов свои преимущества, стэнфордская команда уверена, что в сочетании они обеспечат еще лучший результат. «При использовании всех этих методов возможно еще большее ускорение, — говорит один из участников проекта Сепандар Камвар. — Наши предварительные эксперименты показывают, что их комбинация сделает вычисление PageRank впятеро быстрее. Однако нам предстоит решить ряд проблем. Сейчас мы ближе к тематическому PageRank, чем к персонализированному ранжированию».

Пока теории стэнфордцев остаются теориями — не похоже, чтобы они были как-то связаны с самим Google. «Google приветствует любой вклад в дальнейшее изучение методов анализа гиперссылок в вебе», — ответил представитель компании на вопрос CNETAsia о том, рассмотрит ли Google возможность использования предложений ученых.




Добавлено:  28 Мая 2003 г.
хиты: 1273   


вы считаете этот обзор полезным?
Да  нет

[ оглавление обзоров ] [ Добавить комментарий ]





[о проекте] [авторы публикаций] [список пользователей] [РАССЫЛКИ] [реклама на сайте] [создание сайта] [контакты]

Рейтинг@Mail.ruRambler's Top100
Мы разрешаем использовать, цитировать, копировать, транслировать и переводить любые наши материалы в сети Интернет
при условии установки прямой ссылки на этот конкретный материал на сайте KlubOK.net

Для того чтобы опубликовать свой материал (статью, книгу и т.д.),
вам достаточно направить его по адресу fromgarin@yandex.ru
в любом удобном вам формате.
Copyright © 2003-2008 KlubOK.net, Andrey Garin
телефон: +38 067 357 59 59, ICQ и Miranda: 75928817
рейтинг статистики