2009-05-22 3 views

ответ

1

Я думаю, что большая проблема, которая еще не завоевана в поиске, - Onotology. У нас очень трудное понимание времени и классификация результатов в дружеской обстановке. Некоторые называют это «семантической паутиной». У нас есть этот недостаток данных и индексов, но мы классифицируем или делаем хорошим его очень плохой способ. Вина заключается в том, что мы не являемся атомарно самовыражающими так, как это может понять поиск (алгоритм).

0

Поиск и рейтинг критически важны, то же самое с индексацией. Вам нужны эффективные алгоритмы для поиска результатов, которые точно соответствуют введенным ключевым словам (ala google, yahoo и т. Д.), А затем вам нужно оценивать эти результаты.

1

// Начало саркастический ответа

RAM + CPU + Bandwidth + Действительно Удивительный Software Search Engine

// Конец саркастический ответ

серьезно, что-то так сложно, как технологии поиска будет зависеть по множеству проблем, как вы уже указали. Попытка привязать его к одной единственной серебряной пуле действительно не применима.

+0

Я думаю, что аппаратное обеспечение является самой легкой частью. Многие из этих технологий хорошо масштабируются независимо от истинной проблемы - алгоритма и категоризации данных. –

+1

@Wayne Я полностью согласен, я должен, вероятно, обновить свой ответ, чтобы включить «+ действительно потрясающее программное обеспечение для поисковых систем», моя точка зрения заключалась лишь в том, что в уравнении слишком много переменных для привязки к одному конкретному компоненту как важная часть. – Joseph

0

Производительность в поисковой системе имеет решающее значение; медленное обслуживание - мертвое, но это не самый важный аспект; этот значок, я думаю, идет на актуальность результатов.

Мы просим поисковые системы сделать невозможное; взять фразу или несколько ключевых слов и как-то вернуть целую кучу результатов, которые касаются именно того, что нам хотели - мы можем не знать точно, что мы искали, но как только мы это увидим, мы можем это распознать. Точно так же мы знаем сразу, когда поисковая система возвращает «неправильную вещь».

В конечном счете, все дело в том, чтобы заставить тупую машину делать то, что мы имеем в виду, а не то, что мы говорим, что в основном является неразрешимой проблемой при вычислении. Лучшими поисковыми решениями всегда будут те, которые имеют самые новые способы ранжирования результатов и связывания их с нашими исходными запросами. Это понятие довольно сильно связано с понятием онтологии, как описывает Вейн Хартман в своем ответе.

0

Я построил небольшую поисковую систему как часть моего проекта в прошлом году, и могу сказать, что инвертированный индекс является важной частью поисковой системы.

Я также могу сказать, что Crawler - важная часть.

Вы также можете сказать, что алгоритм рейтинга страницы важен.

Вы можете утверждать, что кластеризация важна.

....

Что именно вы ищете? ваш вопрос кажется мне широким.