2016-07-04 5 views

ответ

2

shuffle используется для случайного перемешивания ваших матриц. Программно, случайные последовательности генерируются с использованием номера семени. У вас гарантированно будет такая же случайная последовательность, если вы используете одно и то же семя. Параметр random_state позволяет вам предоставлять это случайное семя методам sklearn. Это полезно, поскольку позволяет воспроизводить случайность для ваших целей разработки и тестирования. Итак, в методе shuffle, если я использую тот же самый random_state с тем же набором данных, то я всегда гарантированно получаю тот же случайный тасот. Рассмотрим следующий пример:

X = np.array([[1., 0.], [2., 1.], [0., 0.]]) 
X = shuffle(X, random_state=20) 

Если это дает мне следующий вывод,

array([[ 0., 0.], 
     [ 2., 1.], 
     [ 1., 0.]]) 

Теперь я всегда гарантировано, что если я использую random_state = 20, я всегда буду получать точно такую ​​же перестановку. Это особенно полезно для модульных тестов, где вы хотели бы иметь воспроизводимые результаты для подтверждения ваших условий тестирования.

Надеюсь, что это поможет!