2016-08-02 5 views
4

Я пытаюсь создать загрузочный образец из мультииндекса данных в Pandas. Ниже приведен код для генерации данных, которые мне нужны.Как получить случайный образец (bootstrap) из pandas multiindex

from itertools import product 
import pandas as pd 
import numpy as np 

df = pd.DataFrame({'group1': [1, 1, 1, 2, 2, 3], 
         'group2': [13, 18, 20, 77, 109, 123], 
         'value1': [1.1, 2, 3, 4, 5, 6], 
         'value2': [7.1, 8, 9, 10, 11, 12] 
         }) 
df = df.set_index(['group1', 'group2']) 

print df 

ФР dataframe выглядит следующим образом:

    value1 value2 
group1 group2     
1  13   1.1  7.1 
     18   2.0  8.0 
     20   3.0  9.0 
2  77   4.0 10.0 
     109  5.0 11.0 
3  123  6.0 12.0 

Я хочу, чтобы получить случайную выборку из первого индекса. Например, предположим, что случайные значения np.random.randint(3,size=3) дают [3,2,2]. Я хотел бы результирующую dataframe выглядеть следующим образом:

    value1 value2 
group1 group2     
3  123  6.0 12.0 
2  77   4.0 10.0 
     109  5.0 11.0 
2  77   4.0 10.0 
     109  5.0 11.0 

Я потратил много времени на изучение этого и я не смог найти подобный пример, когда мультииндексных значения являются целыми числами, вторичный индекс переменной длины, а первичные образцы индекса повторяются. Вот как я думаю, что подходящая реализация для начальной загрузки будет работать.

ответ