2011-02-05 4 views
1

Нужен пример модели базы данных, которая должна быть привязана к базе данных для качества данных. Лучшая форма ответа, по крайней мере, была бы DDL, которая исполнялась в MySQL; другие RDMS DDL в порядке, я просто отправлю еще один вопрос с просьбой о переносе кода.Модель базы данных качества

Хорошее объяснение было бы огромным плюсом.

Вопросы, комментарии, отзывы и т. Д. - просто комментарий, спасибо!

+0

Я не понимаю ни одного вопроса. Вам нужен DDL? Неважно, что он делает? – GolezTrol

+0

@GolezTrol: Ищет кого-то, кто создал метамодель, который можно подключить к базам данных для регистрации атрибутов качества данных. Кроме того, интересно, что вы проголосовали за закрытие, но задайте вопрос, который заставит меня поверить, что вы даже не понимаете вопроса. – blunders

+0

@blunders, вам нужно что-то вроде инструмента ORM? Что-то, что автоматически разбивает уровень доступа к базе данных, как .NET Entity Framework? (http://www.code-magazine.com/article.aspx?quickid=0711051) –

ответ

1

Самой большой проблемой является определение значимых мер качества. Это настолько сильно зависит от приложения, я сомневаюсь, что кто-то сможет вам очень помочь. (По крайней мере, не без дополнительной информации - возможно, больше, чем вам разрешено давать.)

Но скажем, ваше приложение регистрирует наблюдения птиц отдельными лицами. (Я просто бросал это вместе с верхней частью моей головы. Прочитайте его суть, и ожидать, что детали разрушаться под пристальным вниманием.) При средних полевых условиях,

  • некоторых видов трудно даже для новичка чтобы получить неправильно
  • некоторые виды трудно экспертом, чтобы получить право
  • способность конкретного индивида изменяется неравномерно в течение долгого времени (хорошие дни, плохие дни)
  • люди, как правило, становятся более квалифицированными в течение долгого времени
  • вы могли бы быть высококвалифицированный специалист по идентификации ястребов и полностью сосать при идентификации ИНГ чаек
  • индивидуумы склонны к внушению (которые они с делает разницу в их надежности)

Так, чтобы сделать снимок при оценке качества идентификации, вы можете попытаться записать много информации, кроме наблюдения «3 краснохвостых ястребов на мысе май 05-фев-2011 в 16:30». Вы можете попытаться записать

  • погода
  • освещения
  • температуры (некоторые орнитологи сосать в холоде)
  • часов Afield (некоторые орнитологи сосать через 3 часа или после 20 холодных минут)
  • имена других присутствующих
  • средняя сложность правильного идентификация краснохвостых ястребов
  • вероятность что этот человек мог правильно определить красные хвосты при этих полевых условиях
  • потребление алкоголя

Хотя это может быть «мета» полевых птицеловов, проектировщику базы данных это просто данные. И вы планируете создавать таблицы так же, как вы планируете их для любого другого приложения. Во всяком случае, это то, что я сделал.)

+0

+1 Хотя я не ожидал ответа, действительно как пример - и это говорит о реальном опыте в области качества данных; что для меня является более важным, чем концепция, которая подходит к вопросу. Спасибо за ваш комментарий выше о дополнительных ресурсах по этому вопросу. Еще раз спасибо!! – blunders

+0

Ресурсы, которые я привел, в основном касаются контроля качества в производстве. Но вы можете интерпретировать бизнес как производителя многих продуктов, а один из них - данные - данные различного качества. Я получил эту идею из книги Деминга. Деминг - это тот парень, который позволил японским производителям ударить задницу Америки за последние полвека. Премия Деминга (http://en.wikipedia.org/wiki/Deming_Prize) названа в его честь. –

 Смежные вопросы

  • Нет связанных вопросов^_^