Я прочитал много описаний, которые смутно касаются индекса поиска google. Например: «Google по существу собирает страницы во время процесса обхода, а затем создает индекс, поэтому мы точно знаем, как искать вещи».Что такое индекс веб-поиска google?
Мой вопрос: 1. Что такое индекс? Это ключевая карта значений?
Если да, то каковы они ключевые и какова ценность? Является ключевым словом поиска, которое мы искали?
Какова ценность карты? Это просто URL-адрес или он хранит фактические HTML-страницы?
Какая база данных используется? MySQL? Какой-то NoSQL?
#BayesianMachineLearning - Существует сумасшедшая сложность в том, как Google обслуживает свою поисковую систему. –
Я думаю, вы можете начать с чтения информации и специально инвертированного индексирования, чтобы вы начали играть. – Ritesh