Мы с товарищем по команде обсуждали наш опыт работы, и он сказал, что работал в инструменте Informatica. Его работа включала в себя работу по извлечению необходимой информации из файлов EDI и их трансформации, а затем их загрузке в базы данных. Он сказал, что файлы EDI имеют неструктурированные данные в отличие от таких форматов, как .CSV и .SQL, а в файлах EDI столбцы разделяются символом '|' символ.Что подразумевается под неструктурированными данными? В области использования инструментов ETL для работы с данными?
По-моему, я не вижу разницы между EDI и CSV, только CSV «разделяется», а EDI - «|» то почему бы EDI-файлы были классифицированы как неструктурированные данные?
«EDI» - очень общий термин. Глядя на [тег EDI] (http://stackoverflow.com/tags/edi/info), «Электронный обмен данными - это передача ** структурированных данных ** непосредственно из одной компьютерной системы одной организации в компьютерную систему другой организации ». Структура данных должна быть полностью определена, иначе принимающая система не будет знать, что с ней делать. –
Итак, вы имеете в виду, что не совсем верно, что файлы EDI неструктурированы? – Shyam
Какой пример может быть дан для неструктурированных данных? Да, то, что вы сказали, имеет большой смысл. – Shyam