У меня возникли проблемы с выяснением способа сортировки большого набора данных в более полезные данные.Как отсортировать несколько столбцов файла CSV с помощью python?
Исходный файл в формате CSV показан ниже - данные указывают положения x, y, z и, наконец, энергию. Координаты x, y, z распространяются по-разному, это небольшой фрагмент ниже - в основном это был поиск энергии по объему.
-2.800000,-1.000000,5.470000,-0.26488315
-3.000000,1.000000,4.070000,-0.81185718
-2.800000,-1.000000,3.270000,1.29303723
-2.800000,-0.400000,4.870000,-0.51165026
К сожалению, его очень сложно построить в необходимых четырех измерениях, поэтому мне нужно обрезать эти данные. Я хотел бы сделать это таким образом, чтобы я превратил объем в поверхность на самой низкой оси z энергии. На меньших наборах данных это было просто, в excel сортировать по X, затем Y и затем энергию, а затем удалять все энергии выше самого низкого. Это было достаточно легко для небольших наборов данных, но быстро стало проблематичным.
Я пробовал различные способы сделать это, например, расщепление csv и использование команды sort, но мне не повезло. Любые советы о том, как подойти к этому, будут высоко оценены.
Это, кажется, отлично работает, две проблемы, которые я реализую, - это то, что z должна быть минимальной энергией, и в настоящее время вы получаете максимум. – Daniel
Не уверен, что вы имеете в виду .. он группируется по столбцам 1 и 2 и берет минимальную сумму столбца 3 для каждой группы. Вы хотите группировать столбец 4, а не 3? – agf
Я немного изменил его. Если вы хотите сортировать по разным столбцам, просто измените 'x, y, z' на' x, y, e' или что угодно. – agf