Шаг 1: Я создал хранилище Blob общего назначения (блок blob) и контейнер (политика доступа, установленная на «контейнер») в нем. Также добавлено 19 документов (pdf, xlsx, docx, ppt, png, jpg, txt), и все документы отображаются на лазурном портале -> Blob Storage Container.Azure Поиск Blob Storage не работает.
Шаг 2: Создал поиск по лазури (базовый ярус) и последовал за этой статьей и выполнил следующее.
Шаг 3: Создано DataSource
POST https://anysearch.search.windows.net/datasources?api-version=2015-02-28-Preview
Content-Type: application/json
api-key: adminkey
{
"name" : "blob-datasource",
"type" : "azureblob",
"credentials" : { "connectionString" : "DefaultEndpointsProtocol=https;AccountName=mystorage;AccountKey=givenkey==" },
"container" : { "name" : "containername"}
}
Шаг 4: Созданный индекс
POST https://anysearch.search.windows.net/indexes?api-version=2015-02-28-Preview
Content-Type: application/json
api-key: adminkey
{
"name" : "my-target-index",
"fields": [
{ "name": "id", "type": "Edm.String", "key": true, "searchable": false },
{ "name": "content", "type": "Edm.String", "searchable": true, "filterable": false, "sortable": false, "facetable": false }
]
}
Шаг 5: Созданный индексатор.
POST https://anyearch.search.windows.net/indexers?api-version=2015-02-28-Preview
Content-Type: application/json
api-key: adminkey
{
"name" : "blob-indexer",
"dataSourceName" : "blob-datasource",
"targetIndexName" : "my-target-index",
"schedule" : { "interval" : "PT5M" }
}
Шаг 6: Запуск статистики индекса и получил результат ниже - DOCUMENTCOUNT = 0
GET https://anysearch.search.windows.net/indexes/my-target-index/stats?api-version=2015-02-28-Preview
api-key: [admin key]
{
"@odata.context": "https://mydocsearch.search.windows.net/$metadata#Microsoft.Azure.Search.V2015_02_28_Preview.IndexStatistics",
"documentCount": 0,
"storageSize": 1728
}
Шаг 7: Искал слова "процесс" и получил результат ниже
GET https://anysearch.search.windows.net/indexes/my-target-index/docs?api-version=2015-02-28&search=process
{
"@odata.context": "https://mydocsearch.search.windows.net/indexes('my-target-index')/$metadata#docs(id,content)",
"value": []
}
Что здесь не так? Почему количество документов равно 0? Почему слово «процесс» или любое другое слово поиска не возвращает никаких результатов?
Пожалуйста, помогите.
С благодарностью
Bhanu.
Это работало как шарм !! Спасибо. Я думал, что не поддерживаемые файлы будут игнорироваться индексом. Спасибо, что указали это. Я удалил jpeg и png-файлы из блоба и снова запустил индекс. Это сработало. – Bhanu
Замечательно. Если вы хотите, чтобы индексщик автоматически пропускал извлечение текста для неподдерживаемых форматов (но все же извлекал некоторые метаданные хранилища), проголосуйте за это [предложение UserVoice] (https://feedback.azure.com/forums/263029-azure-search/ предложения/15094944-блоб-индексатор-РЕКОМЕНДУЕМЫМ-продолжающие индексирование-документы-аф) –