У меня было аналогичное требование для удаления дублирующих строк адреса. Таким образом, я создал новый столбец (скажем, COMPLETE_ADDRESS) и сцепляются улицы, города, области, страны и ZipCode поля с помощью нижеприведенного выражения Grel
cells["STREET"].value + " " + cells["CITY"].value + " " + cells["PROVINCE"].value + " " + cells["COUNTRY"].value + " " + cells["ZIPCODE"].value
Тогда я сделал следующее:
- кластерных новый COMPLETE_ADDRESS с алгоритмом по умолчанию
- Слияние значений в каждом кластере (теперь значения являются идеальными дубликатами)
- Сортировка столбца постоянно.
- Выполняйте операцию «пустого вниз».
- Наконец выбрать только ненулевые значения в COMPLETE_ADDRESS
Сказав, что, как это письмо, не существует функция для объединения независимых столбцов. Единственный способ сделать это - разделить COMPLETE_ADDRESS на отдельные столбцы подходящим образом. В этом случае вам нужно будет использовать лучший разделитель, такой как труба «|» символ, который не будет конфликтовать с существующими значениями.
Ваше предложение отлично работает. Благодаря! –