У меня есть следующий тип набора данных:SQL/Vertica - группировка многофакторный комбинаций
user_id country1 city1 country2 city2
1 usa new york france paris
2 usa dallas japan tokyo
3 india mumbai italy rome
4 france paris usa new york
5 brazil sao paulo russia moscow
Я хочу, чтобы сгруппировать комбинации country1
, city1
, country2
и city2
где порядок (что-то country1
или country2
) не имеет значения. Как правило, я хотел бы попробовать:
SELECT country1
, city1
, country2
, city2
, COUNT(*)
FROM dataset
GROUP BY country1
, city1
, country2
, city2
Однако этот фрагмент кода считает строки с user_id=1
и user_id=4
как два отдельных случаях, когда я хотел бы рассматривать их как равнозначные.
Любой, кто знает, как сотрудничать с этой проблемой?
Заранее благодарен!