Я изучаю, как использовать библиотеку python pandas
. Я пытаюсь решить проблему, которая, вероятно, не самая простая вещь, которой не было получено никакого опыта с pandas
, ни какой-либо статистический язык, такой как Stata
.Перекрестная вкладка с использованием условных подгрупп
Предположим, у меня есть набор данных из запроса о чувствах людей к пирогам и пирожным. Большинство вопросов, которые я задал, имеют следующий вид:
«Вы предпочитаете пироги с пирожными?» или «Вы проголосуете за вишневый пирог для президента Соединенных Штатов в 2020 году?»
Это приводит к ответам «Да» или «Нет».
Предположим, у меня есть 1000
людей, которые ответили, но у них есть некоторые различия, которые важны для моего предстоящего анализа, как Gender
, Eye-Color
и primary-hand-use
(правый/левый/симметричная). Также предположим, что у меня есть сотни этих различий и что в конечном итоге я хочу сравнить их все с одним и тем же вопросом.
Теперь из моего cake-pie.DTA
файла я могу запустить:
frame = pandas.read_stata("cake-pie.DTA")
answers = ["Yes", "No"]
pandas.crosstab(frame["Question_1", frame["Eye_Color"]], answers, normalize="columns")
И это даст мне следующее:
col_0 yes
col_1 no
Question_1 eye_color
Yes Blue 0.1500
Hazel 0.050
Brown 0.2100
Green 0.050
No Blue 0.2850
Hazel 0.0000
Brown 0.2450
Green 0.010
Однако мои 1000 людей, которые откликнулись не из равных пропорций каждого цвета глаз. Возможно, мое население выглядит следующим образом:
Blue 435 (43.5%)
Hazel 50 (5.0%)
Brown 455 (45.5%)
Green 60 (6.0%)
Информация, которую я хотел бы иметь выход не является оценка вероятности ЗЕЛЕНЫЙ & ДА, а скорее, вероятность Да | ЗЕЛЕНЫЙ (вероятность да дается зеленым глазам.)
Я понимаю, что я могу разделить вручную по сумме субпопуляции, чтобы получить этот ответ, но я не уверен, как разделить на pandas Series
данные, которые являются моей таблицей глазного цвета выше для этого в одной перекрестной вкладке.
Вы добавили 0 для Hazel и Green. –
@TedPetrou Урх, у меня мозг болит. Не могли бы вы изменить мой вопрос от моего имени, что на самом деле складывается? – BlackVegetable