У меня есть некоторые проблемы для сравнения двух dataframes в том, как я хотел бы:сравнить пересечение некоторых столбцов dataframes размера другого
df1=pd.DataFrame({"code1": ['A', 'B', 'C', 'C','D'],
"code2": ["1", "0", "1", "1","1"],
"column1":['value1','value2','value3','value4','value5']})
code1 code2 column1
0 A 1 value1
1 B 0 value2
2 C 1 value3
3 C 1 value4
4 D 1 value5
df2 = pd.DataFrame({"code1": ['A','B','C'],
"code2": ["0", "0", "1"],
"column2":['valuex','valuey','valuez']})
code1 code2 column2
0 A 0 valuex
1 B 0 valuey
2 C 1 valuez
Таковы два dataframe Я хотел бы сравнить. Мне нужно сделать что-то вроде
df1[['code1','code2']].isin(df2[['code1','code2']])
с целью получения результата:
code1 code2 column1
0 B 0 value2
1 C 1 value3
2 C 1 value4
Я хочу сохранить строки, имеющие ту же «code1» и «Кодекса2» в обоих df1 и df2, и другие столбцы df1. Знаете ли вы, как это сделать? Я хотел бы избежать циклов, мне нужно, чтобы это было эффективно. Большое спасибо заранее
Спасибо! И что, если я хочу сохранить удаленные случаи в другом фрейме данных ??? –
@ emilio.molina, посмотрите пожалуйста UPDATE – MaxU
безупречный, большое спасибо !! поэтому «индикатор» - это параметр, который решает, какую часть блока данных вы сохраняете, не так ли? –