2013-06-03 2 views
0

Есть открытый формат данных для представления таких данных ГИС как дороги, местностей, sublocalities, страны, здания и т.д.Формат для представления данных ГИС

Я ожидаю, что формат будет определять структуру адреса и имена компонентов адреса.
Мне нужен формат данных для возврата в ответ на обратные запросы геокодирования.
Я искал его в Интернете, но кажется, что каждый поставщик геокодирования определяет свой собственный формат.

Должен ли я создать свой собственный формат?

Имеет ли смысл мой вопрос? (Я новичок в ГИС). В случае, если я не понял себя, я не ищу такие форматы данных, как GeoJSON, GML или WKT, поскольку они определяют геометрию и не определяют структуру адресов.

UPD. Я экспериментирую с различными службами геокодирования и пытаюсь изолировать их в отдельный модуль. Мне нужно предоставить один общий интерфейс для всех из них, и я не хочу составлять еще один формат данных (потому что, с одной стороны, я не полностью понимаю домен, а с другой стороны, само поле, кажется, хорошо изучено). Ответственность модуля заключается в частичном адресе (или координатах), таком как «96, Дубининская, Москва», и возвращении структуры данных, содержащей номер дома (96), название улицы (Дубининская), суббокалия (Даниловский р-н), город (Москва), административный (Московская область), страна (Россия). Проблема в том, что в разных странах может быть больше/меньше деления (больше/меньше адресных компонентов), и мне нужно объединить эти компоненты между странами.

+1

Можете ли вы объяснить больше о том, чего вы пытаетесь достичь? Это лучше поможет людям ответить вам. – Jeffrey

+0

[API геокодирования Google] (https://developers.google.com/maps/documentation/geocoding/#JSON) должен быть достаточным или, по крайней мере, прекрасным началом. –

ответ

0

Нет, к сожалению, нет.

Почему вы можете спросить

Beacuse разные народы и страны имеют совершенно разные форматы и требования для хранения адресов.

Здесь, например, в Великобритании определение почтового индекса имеет довольно сложный набор правил, где в качестве почтовых индексов в США 4-значный цифровой префикс с простым кодом состояния в 2 буквы.

Тогда вы должны учитывать вопрос Что именно составляет адрес? опять же это различие не только из страны в страну, но и несколько раз на одной территории.

, например: (Здесь, в Великобритании)

Smith and Sons Butchers 
10 High street 
Some town 

Mr smith 
10 High street 
Some town 

The Occupier 
10 High Street 
Some Town 

Smith and Sons Butchers 
High Street 
Some Town 

все действительные адреса в Великобритании, и во всех случаях пост будет прибыть в правильное место назначения, GPS-однако могут возникнуть проблемы.

База данных GPS может быть настроена так, чтобы каждое здание представляло собой квадратный бит геометрии, причем идентификатор был номером дома.

Это даст нам возможность точно сказать, где находится номер 10, что означает, что сразу же последний всплывает.

Земельные участки могут быть проиндексированы по названию бизнеса, опять же, пока вы не начнете использовать имена людей или общие названия.

Существует так много вариаций, что просто невозможно создать единый формат, который может охватывать все возможные правила, необходимые для того, чтобы любое приложение на планете могло правильно отформатировать любой геокодированный адрес.

Как мы можем решить проблему?

Простой, сужая область действия.

  • Сделка ТОЛЬКО с определенным набором определенных объектов, с которыми вам нужно работать.
  • У вас останется вся информация, необходимая для описания того, что вам нужно описать (Всегда помните, что YAGNI * указан здесь)
  • Используйте стандартные форматы передачи данных, такие как JSON, XML и CSV, что увеличит ваши шансы на то, что вам нужно будет меньше работать код не контролируем, чтобы позволить ему читать ваши выходные данные

(* YAGNI = вы не собираетесь это нужно)

Теперь копать глубже, однако:

Когда речь идет о фактических данных ГИС, есть много стандартных файлов формата, 3 наиболее распространенными являются:

  • Esri Shape Files (* .shp)
  • Кихол размечать Language (* .kml)
  • значений, разделенных запятыми (* .csv)

Все основные пребывания пакетов ГИС свободных и оплаченных может работать с любым из этих 3-х типов файлов, и многое другое.

Файлы формы, безусловно, самые распространенные из них, которые вы собираетесь встретить, почти каждый бит геопространственных данных, с которыми я сталкивался в свои годы в ИТ, был в файле формы, однако я бы НЕ рекомендовал хранить ваши данные в них для обработки, они довольно сложный формат, часто медленный и последовательный для доступа.

Если ваши файлы геометрии будут потребляться в других системах, вы не можете ошибиться с ними.

Они также имеют дополнительный бонус, который вы можете прикрепить атрибуты для каждого элемента данных, также, такие как детали адреса, имена и т.д.

Проблема заключается в том, что не существует стандарта относительно того, что вы могли бы назвать атрибут столбцы или то, что вы включили бы, и, возможно, более резко, имена столбцов ограничены UPPERCASE и ограничены 32 символами.

KML-файлы - это еще одно общепризнанное, и поскольку XML основан на Google и используется Google, вы можете включить в них много дополнительных данных, которые технически самоописаны для машины, читающей ее.

К сожалению, размеры файлов могут быть невероятно громоздкими даже для нескольких простых геометрий, этот компромисс означает, что они довольно легко обрабатываются практически на любом языке программирования на планете.

и это подводит нас к скромному CSV.

Главное пребывание передачи данных (не только геопространственного) с самого начала.

Если вы можете поместить свои данные в таблицу базы данных или электронную таблицу, вы можете поместить ее в файл CSV.

Опять же, нет стандартов, отличных от того, как столбцы могут или не могут быть указаны, а какие точки разделения, но читатели должны заранее знать, что представляет собой каждый столбец.

Кроме того, нет географического элемента хранения «Pre-Made» (на самом деле нет никаких типов данных), поэтому ваше приложение для чтения также должно знать заранее, какими должны быть типы данных столбцов, чтобы он мог проанализируйте их соответствующим образом.

С другой стороны, ВСЕМ можно прочитать их, могут ли они понять их, это совсем другая история.

 Смежные вопросы

  • Нет связанных вопросов^_^