Я тестирую данные для приложения, которое я разрабатываю. Я новичок в U-SQL и Data Lake, и я просто пытаюсь запросить все записи в файле JSON. Прямо сейчас, это только возвращение одной записи, и я не знаю, почему, потому что файл имеет около 200U-SQL Json Extractor вытаскивает только одну запись
Мой код:
DECLARE @input string = @"/MSEStream/output/2016/08/12_0_fc829ede3c1d4cf9a3278d43e7e4e9d0.json";
REFERENCE ASSEMBLY [Newtonsoft.Json];
REFERENCE ASSEMBLY [Microsoft.Analytics.Samples.Formats];
@allposts =
EXTRACT
id string
FROM @input
USING new Microsoft.Analytics.Samples.Formats.Json.JsonExtractor();
@result =
SELECT *
FROM @allposts;
OUTPUT @result
TO "/ProcessedQueries/all_posts.csv"
USING Outputters.Csv();
Пример данных:
{
"id":"398507",
"contenttype":"POST",
"posttype":"post",
"uri":"http://twitter.com/etc",
"title":null,
"profile":{
"@class":"PublisherV2_0",
"name":"Company",
"id":"2163171",
"profileIcon":"https://pbs.twimg.com/image",
"profileLocation":{
"@class":"DocumentLocation",
"locality":"Toronto",
"adminDistrict":"ON",
"countryRegion":"Canada",
"coordinates":{
"latitude":43.7217,
"longitude":-31.432},
"quadKey":"000000000000000"},
"displayName":"Name",
"externalId":"00000000000"},
"source":{
"name":"blogs",
"id":"18",
"param":"Twitter"},
"content":{
"text":"Description of post"},
"language":{
"name":"English",
"code":"en"},
"abstracttext":"More Text and links",
"score":{}
}
}
Благодарим Вас за помощь заранее
Когда я добавляю, что Он ничего не возвращает. Я добавляю пример данных, которые я вытаскиваю в сообщении. – WorkHardWork
Я понял, что происходит, выходной файл является файлом, разделенным строкой. Есть ли способ прочитать его так, или мне нужно, чтобы он был отформатирован как массив? – WorkHardWork
Вы можете написать свой собственный экстрактор, который выполняет линию на обработку строки, расширяя текущий JSONExtractor (посмотрите на некоторые из других экстракторов на нашем GitHub по адресу http://usql.io), или вы можете использовать встроенный редактор, в экстракторе и прочитать JSON как строку (максимальная длина составляет 128 КБ). Например, https://github.com/Azure/usql/blob/master/Examples/DataFormats/Microsoft.Analytics.Samples.Formats/readme.md –