Какая важная часть технологии поиска?Какая важная часть технологии поиска?
- Распределенная файловая система
- Облачные вычисления система
- хранения
- алгоритмы ранжирования
- алгоритмы поиска
Или что-то еще?
Какая важная часть технологии поиска?Какая важная часть технологии поиска?
Или что-то еще?
Я думаю, что большая проблема, которая еще не завоевана в поиске, - Onotology. У нас очень трудное понимание времени и классификация результатов в дружеской обстановке. Некоторые называют это «семантической паутиной». У нас есть этот недостаток данных и индексов, но мы классифицируем или делаем хорошим его очень плохой способ. Вина заключается в том, что мы не являемся атомарно самовыражающими так, как это может понять поиск (алгоритм).
Поиск и рейтинг критически важны, то же самое с индексацией. Вам нужны эффективные алгоритмы для поиска результатов, которые точно соответствуют введенным ключевым словам (ala google, yahoo и т. Д.), А затем вам нужно оценивать эти результаты.
// Начало саркастический ответа
RAM + CPU + Bandwidth + Действительно Удивительный Software Search Engine
// Конец саркастический ответ
серьезно, что-то так сложно, как технологии поиска будет зависеть по множеству проблем, как вы уже указали. Попытка привязать его к одной единственной серебряной пуле действительно не применима.
Производительность в поисковой системе имеет решающее значение; медленное обслуживание - мертвое, но это не самый важный аспект; этот значок, я думаю, идет на актуальность результатов.
Мы просим поисковые системы сделать невозможное; взять фразу или несколько ключевых слов и как-то вернуть целую кучу результатов, которые касаются именно того, что нам хотели - мы можем не знать точно, что мы искали, но как только мы это увидим, мы можем это распознать. Точно так же мы знаем сразу, когда поисковая система возвращает «неправильную вещь».
В конечном счете, все дело в том, чтобы заставить тупую машину делать то, что мы имеем в виду, а не то, что мы говорим, что в основном является неразрешимой проблемой при вычислении. Лучшими поисковыми решениями всегда будут те, которые имеют самые новые способы ранжирования результатов и связывания их с нашими исходными запросами. Это понятие довольно сильно связано с понятием онтологии, как описывает Вейн Хартман в своем ответе.
Я построил небольшую поисковую систему как часть моего проекта в прошлом году, и могу сказать, что инвертированный индекс является важной частью поисковой системы.
Я также могу сказать, что Crawler - важная часть.
Вы также можете сказать, что алгоритм рейтинга страницы важен.
Вы можете утверждать, что кластеризация важна.
....
Что именно вы ищете? ваш вопрос кажется мне широким.
Я думаю, что аппаратное обеспечение является самой легкой частью. Многие из этих технологий хорошо масштабируются независимо от истинной проблемы - алгоритма и категоризации данных. –
@Wayne Я полностью согласен, я должен, вероятно, обновить свой ответ, чтобы включить «+ действительно потрясающее программное обеспечение для поисковых систем», моя точка зрения заключалась лишь в том, что в уравнении слишком много переменных для привязки к одному конкретному компоненту как важная часть. – Joseph