2009-09-15 2 views
21

фона:Любой реальный опыт корпоративного уровня с Transactional NTFS (TxF)?

Я знаю this SO question о транзакционных NTFS (TxF) и this article описания как использовать его, но я ищу реального мира опыт с достаточно крупносерийного предприятия система, где много данных о блобе (например, документы и/или фотографии) должно быть сохранялось после транзакции и много раз читалось.

  • Мы ожидаем несколько десятков тысяч документов, написанных в день, и читаем несколько десятков тысяч в час.
  • Мы могли либо хранить индексы в файловой системе, либо в SQL Server, но должны иметь возможность масштабировать ее в нескольких ячейках.
  • Мы должны сохранить возможность резервного копирования и восстановления данных для аварийного восстановления.

Вопрос:

  • Любой реальный мир, корпоративный класс опыт транзакционной NTFS (TxF)?

Похожие вопросы:

  • Кто-нибудь пробовал распределенные транзакции с использованием TxF, где тот же файл привержен двух зеркальных серверов одновременно?
  • Кто-нибудь пробовал распределенную транзакцию с файловой системой и базой данных?
  • Любые проблемы с производительностью/надежность/данные о производительности, которыми вы можете поделиться? Кто-нибудь даже сделал что-то в этом масштабе до того, когда транзакции вызывают беспокойство?

редактирует: Для того, чтобы быть более ясным, я исследовал другие технологии, в том числе нового типа FILESTREAM данных SQL Server 2008, но этот вопрос specificially нацелен на транзакционной файловой только системы.

Дополнительные ресурсы:

  • В статье MSDN Magazine на TxF называется "Enhance Your Apps With File System Transactions".
  • Веб-трансляция под названием "Transactional Vista: Kernel Transaction Manager and friends (TxF, TxR)". Это видео цитирует накладные расходы с использованием TxF 2-5%, при этом обсуждение производительности начинается примерно через 25 минут. Это первый набор жестких чисел, которые я нашел. И видео - очень хороший обзор того, как это работает под капотом. Около 34:30 докладчик описывает очень похожий сценарий на этот вопрос.
  • Канал 9 screencast под названием "Surendra Verma: Vista Transactional File System". Он говорит о производительности, начиная примерно через 35 минут. Нет жестких цифр.
  • Список TxF articles на блоге B # .NET.
  • Сценарий 9-го канала под названием "Transactional NTFS".

ответ

6

К сожалению, похоже, что ответ «Нет».

Почти две недели (одна неделя с 100-процентной щедростью) и 156 просмотров никто не ответил, что они использовали TxF для любых приложений большого объема, как я описал. Я не могу сказать, что это было неожиданно, и, конечно, я не могу доказать отрицательный результат, но, похоже, эта функция Windows не известна или часто используется, по крайней мере, активными членами сообщества SO на момент написания.

Если я когда-нибудь перейду к написанию какого-либо доказательства концепции, я опубликую здесь то, что я узнаю.

+4

Быстрая перемотка вперед на 2012 год: Microsoft теперь намерена осудить TxF и «настоятельно рекомендует» разработчикам искать альтернативы ... так что это действительно кажется мертвой лошадью. Жаль, идея была очень приятная. – Philipp

+0

@Philipp - любая ссылка для подтверждения этого? – xhafan

+4

отвечает на меня - http://msdn.microsoft.com/en-us/library/windows/desktop/hh802690%28v=vs.85%29.aspx – xhafan

3

Вы считаете filestream support в SQL Server 2008 (если вы используете SQL Server 2008, конечно)? Я не уверен в производительности, но он предлагает транзакцию и поддерживает резервное копирование/восстановление.

+1

+1 для отличного предложения. Тем не менее, я уже исследовал это и специально заинтересован в опыте работы с файловой системой транзакций. Я обновил вопрос, чтобы отразить это. –

0

Хотя у меня нет обширного опыта с TxF, у меня есть опыт работы с MS DTC. Сам TxF достаточно эффективен. Когда вы бросаете MS DTC для обработки нескольких менеджеров ресурсов на нескольких компьютерах, производительность сильно падает.

Из вашего описания, похоже, что вы храните и индексируете очень большие объемы неструктурированных данных. Я предполагаю, что вам также нужна возможность поиска этих данных. Таким образом, я настоятельно рекомендую изучить что-то вроде Microsoft's Dryad или Google's MapReduce и высокопроизводительную распределенную файловую систему для обработки неструктурированного хранения и индексирования данных. Лучшие примеры крупных корпоративных систем, которые хранят и индексируют огромные объемы данных blob, - это поисковые системы Интернета, такие как Bing и Google.

Имеется достаточно ресурсов для управления высокопроизводительными неструктурированными данными, и они, вероятно, будут решать вашу проблему более эффективно, чем SQL Server и NTFS.

Я знаю его немного дальше, чем вы, вероятно, искали ... но вы упоминали, что вы уже исчерпали все другие поисковые проспекты вокруг окна NTFS/TxF/SQL. ;)

+1

Спасибо, jrista. Я ценю информацию, но я не могу официально принять ваш ответ, потому что он специально не касается TxF. Я снова уточнил вопрос, чтобы быть более явным. Еще раз спасибо за помощь. –

8

Я полагаю, что опыт «реального мира, корпоративного уровня» более субъективен, чем кажется.

Центр обновления Windows использует TXF. Поэтому он используется довольно сильно с точки зрения частоты. Теперь он не выполняет многоузловую работу, и он не проходит через DTC или ничего подобного, но использует TXF для управления состоянием файла. Он координирует эти изменения с изменениями в реестре (TXR). Это так?

Мой коллега представил this talk to SNIA, который довольно откровенен относительно большой работы вокруг TXF и может пролить немного больше света. Если вы думаете об использовании TXF, это стоит прочитать.

+0

Трудно это увидеть, но у меня была щедрость на этом и он должен был принять «нет» ответ, чтобы не налагать очки. Вы правы, что Windows Update является хорошим примером чего-то реального мира. Это также большой объем, но не так, как я думал (на машину это довольно низкий объем). Еще +1 за этот ответ. Благодарю. –

-2

Ronald: FileStream накладывается поверх TxF.

JR: Хотя Windows Update использует TxF/KTM и демонстрирует его полезность, это не приложение с высокой пропускной способностью.

+0

Подождите, пока у вас будет достаточно комментариев для комментариев. –