2016-10-21 2 views
2

У меня есть dataframe персональных характеристик, таких как школьные классы, возраст, вес и высота. Я хочу исследовать распределение плотности этих данных в морском море Facetgrid.Как избежать пустых сеток на морском берегу FacetGrid

import pandas as pd 
import seaborn as sns 
import random 
import matplotlib.pyplot as plt 

# creation of artifical data 
random.seed = 10 
high = [random.uniform(3.0,6.0) for i in range(50)] 
uni = [random.uniform(1.0, 4.0) for i in range(50)] 
math = [random.uniform(1.0, 6.0) for i in range(50)] 
bio = [random.uniform(1.0, 6.0) for i in range(50)] 
history = [random.uniform(1.0, 6.0) for i in range(50)] 
age = [random.randint(15,45) for i in range(50)] 
height = [random.randint(150,210) for i in range(50)] 
weight = [random.randint(50,100) for i in range(50)] 

df = pd.DataFrame() 
df["value"] = high + uni + math + bio + history + age + height + weight 
df["type"] = 100*["final_exam"] + 150*["grade"] + 150*["body"] 
df["id"] = 50*["highschool"] + 50*["university"] + 50*["math"] + 50*["bio"] + 50*["history"] + 50*["age"] + 50*["heigt"] + 50*["weight"] 
df["group"] = "A" 
df = df[["group", "id", "type", "value"]] 
df["para"] =df[["type", "id"]].apply(lambda x: "_".join(x), axis=1) 


# Plotting function 
def plot_poll(df, **kwargs): 

    def plot_densitiy_distribution(data, **kwargs): 
     sns.kdeplot(data["value"], shade=True) 

    grid_ts = sns.FacetGrid(df, sharey=False, legend_out=True, hue="group",col="type", row="id") 
    grid_ts = grid_ts.map_dataframe(plot_densitiy_distribution) 
    plt.tight_layout() 
    plt.show() 

# main 
plot_poll(df) 

dataframe будет выглядеть, как это для одного человека, но в общей сложности 50 человек были опрошены:

+=======+============+============+=======+=======================+ 
| group |  id  | type | value |   para   | 
+=======+============+============+=======+=======================+ 
| A | highschool | final_exam | 2.7 | final_exam_highschool | 
+-------+------------+------------+-------+-----------------------+ 
| A | university | final_exam | 2.0 | final_exam_university | 
+-------+------------+------------+-------+-----------------------+ 
| A | math | grade | 3.3 |  grade_math  | 
+-------+------------+------------+-------+-----------------------+ 
    .............................................................. 
+-------+------------+------------+-------+-----------------------+ 
| A | age  | body | 27 |  body_age  | 
+-------+------------+------------+-------+-----------------------+ 
    .............................................................. 
+=======+============+============+=======+=======================+ 

фигура выглядит следующим образом:

enter image description here

Как вам может видеть, там много пустых участков, и я хотел бы перестроить сюжет, в котором присутствуют только сетки с данными. В столбцах должны быть показаны сетки, которые имеют одинаковые type. Пример (созданный с помощью Paint) можно увидеть ниже. Кроме того, ось X масштабируется одинаково для всех столбцов. Как я могу масштабировать ось x отдельно (даже, возможно, логарифмически).

rearranged figure (with Paint)

Заранее спасибо за поддержку, Christian

+0

«* Как вы можете увидеть там много эмппи-сюжетов, от которых я бы хотел избавиться * «Что это значит? Должны ли быть чистые участки после удаления осей? Должны ли только оси с данными быть перегруппированы в компактную сетку? Вам нужно быть конкретным и сказать, что нужно делать. –

+0

* «Как я могу масштабировать ось x отдельно (даже, возможно, логарифмически)» * Вы уже делаете это самостоятельно по оси Y с помощью параметра «sharey = False». Сделайте то же самое с 'sharex'. Чтобы установить оси x в виде шкалы журнала, вы можете «grid_ts.set (xscale = 'log'). Однако я не рекомендую это делать. Если ваши данные логарифмически распределены, вы должны вычислить KDE в журнале данных. –

+0

@PaulH Спасибо за ваши вопросы. 1) _ «Если только оси с данными будут перегруппированы в компактную сетку?» _ - Да, это именно то, что я хочу – ChristianH

ответ

2

Если вы просто хотите, чтобы скрыть участки для представления цели (но сохранить общую структуру сетки):

for (i,j,k), data in fg.facet_data(): 
     if data.empty: 
      ax = fg.facet_axis(i, j) 
      ax.set_axis_off() 
+0

Это прекрасно. –