2015-09-01 6 views
1

Мы с товарищем по команде обсуждали наш опыт работы, и он сказал, что работал в инструменте Informatica. Его работа включала в себя работу по извлечению необходимой информации из файлов EDI и их трансформации, а затем их загрузке в базы данных. Он сказал, что файлы EDI имеют неструктурированные данные в отличие от таких форматов, как .CSV и .SQL, а в файлах EDI столбцы разделяются символом '|' символ.Что подразумевается под неструктурированными данными? В области использования инструментов ETL для работы с данными?

По-моему, я не вижу разницы между EDI и CSV, только CSV «разделяется», а EDI - «|» то почему бы EDI-файлы были классифицированы как неструктурированные данные?

+1

«EDI» - очень общий термин. Глядя на [тег EDI] (http://stackoverflow.com/tags/edi/info), «Электронный обмен данными - это передача ** структурированных данных ** непосредственно из одной компьютерной системы одной организации в компьютерную систему другой организации ». Структура данных должна быть полностью определена, иначе принимающая система не будет знать, что с ней делать. –

+0

Итак, вы имеете в виду, что не совсем верно, что файлы EDI неструктурированы? – Shyam

+0

Какой пример может быть дан для неструктурированных данных? Да, то, что вы сказали, имеет большой смысл. – Shyam

ответ

0

Традиционный ЭОД НЕ является неструктурированным. EDI обычно следует за некоторыми стандартами (X12, EDIFACT, TRADACOMS и т. Д.), Которые конкретно определяют структуру данных. Файлы XML, CSV и разделенные файлы также структурированы. У них есть определенный разделитель полей и терминатор записи.

Примером неструктурированных данных будет файл Excel, который имеет несколько частей данных в собственном формате. Не было бы идентификаторов записей, и анализатор данных не смог бы понять, что такое данные. Он будет отображаться как поток данных/текста, но не будет иметь никакого контекста, который должен был бы преобразовать/интегрировать. Документ Word или PDF можно также считать «неструктурированным».

 Смежные вопросы

  • Нет связанных вопросов^_^