Я работаю над анализом потребности в сырьевых материалах в моей компании, и подход, который я принимаю, заключается в использовании записей о продажах готовой продукции в сочетании со спецификацией материалов для каждого готового товара. Проблема в том, что каждый готовый продукт состоит из нескольких компонентов, а многие готовые продукты имеют общие компоненты. Я стараюсь сохранить все индивидуальные показатели продаж для каждого готового товара и использовать UnitsSold для умножения с единицей для каждого компонента, чтобы получить спрос на сырье. Вот код для образцов наборов данных:dplyr объединить два набора данных для продаж готовой продукции и спецификации материалов
fg_Sales <- data_frame(FG_PartNumber=rep(c("A","B","C"),2),
Order_Date=seq.Date(as.Date("2011-1-1"),as.Date("2012-1-10"),length.out = 6),
FG_UnitsSold=c(100,200,300,400,500,600))
bill_materials <- data_frame(FG_PartNumber=rep(c("A","B","C"),4),
Components=c("C1","C2","C3","C4","C5","C6","C7","C7","C7","C8","C8","C9"),
Qty=rnorm(3,1,n = 12))%>%
arrange(FG_PartNumber)
я знаком с left_join в dplyr, но это, кажется, не работает, потому что она всегда дает мне с первым компонентом для каждого готового продукта.
Может ли кто-нибудь помочь с этим? Спасибо.
Привет, evgeniC, это именно то, что мне нужно. Спасибо за вашу помощь! –