Предположим, у меня есть два CSV-файла, каждый из которых имеет 100 строк. Каждая строка в двух файлах CSV имеет один и тот же индекс и метку, таким образом, эти 100 строк можно рассматривать как набор парных данных.shuffle CSV файлы данных в соответствии с их метками
Моя цель - перетасовать файлы из CSV, чтобы сделать данные непарными в соответствии с их разными метками.
Например, входной сигнал:
1st CSV 2nd CSV label
data_1 data_1' 12
data_2 data_2' 6
... ... ...
Выход:
data_1 data_2'
... ...
Поскольку данные_1 и данные_2' имеет различные метки (12 и 6 соответственно), таким образом, они рассматриваются как непарные данные. Моя цель - выбрать любое количество данных с разными метками с данными_1.
Есть ли какие-либо библиотеки или методы python для его создания?
Он принимает 3 шага: прочитать данные, используя [CSV] (https://docs.python.org/ 2/library/csv.html), перетасуйте данные с помощью [random] (https://docs.python.org/2/library/random.html), напишите данные, используя [csv] (https: // docs. python.org/2/library/csv.html) – zvone
@zvone Как убедиться, что данные непарные с разными метками? – Kun
Если вы перетасовываете его, он будет непарным. Шанс иметь матч на 100 рядах после перетасовки составляет от 1 до 9.33e + 157 – zvone