Словарь TrustRank EigenTrust

PageRank

Andrey Orlov  2008-06-05 11:00

PageRank - алгоритм анализа ссылок между веб-страницами, используемый Google для оценки релевантности страниц поисковому запросу.

Словарь

Основная форма:PageRank
Предметная область::
NeuralNetwork
PageRank на вики

Одним из основных новшеств, введенным поисковой машиной Google является индексирование страниц по тексту, накрытого ссылкой на страницу. Этот индекс, в дальнейшем, используется для поиска страниц по текстовому запросу. Для того, чтобы такой подход можно было использовать, потребовалась оценка релевантности страницы тексту под ссылкой. Используемый Google способ построения такой оценки носит название PageRank.

Идея, лежащая в основе PageRank, состоит в том, что в качестве меры релевантности можно использовать плотность вероятности прохождения пользователем данной страницы при условии, что пользователь начинает со случайной страницы и делает некоторое (ограниченное по вероятности) количество случайных переходов между страницами. При этом предполагается, что со страницы без ссылок пользователь может перейти на любую страницу.

Данная идея, по-видимому, является основным элементом новизны в патенте, выданным на PageRank. Сам алгоритм не содержит ничего особенно нового: это просто поиск собственных векторов матрицы связности, в которой все связи взвешены вероятностями перехода. В основе алгоритма поиска собственных векторов лежит степенной метод, который известен достаточно давно.

Ссылки на эту статью:

EigenTrust
Эпицентр Zope3 Учат тут DreamBot Репозиторий Статистика Редакторам
Официальный сайт Zope3 Московская группа изучения реактивного движения The Dream Bot Site