Мы делаем статистику и т. Д. На больших наборах данных. Сейчас все делается на одной машине. Мы изучаем возможность перехода к парадигме уменьшения карты, где мы разлагаем данные на подмножества, выполняем некоторые операции над этим, а затем объединяем результаты.Для заданных операций с большим набором данных существует ли способ определить, могут ли данные быть разложены в операции преобразования данных?
Есть ли какой-либо математический тест, который может быть применен к набору операций для определения того, могут ли данные данные работать?
Или, может быть, список где-то говорит, что может и не может быть разложено?
Например, я не думаю, что есть способ, чтобы разложить стандартное отклонение, но есть ...
редактировать: добавлены теги