2017-02-23 11 views
0

Я собрал данные игроков НБА из их трехкратных игр и хотел бы узнать, кто получил самые взрывоопасные данные в среднем.tabstat: Как отсортировать/заказать выход по определенной переменной?

Источник является «Баскетбол - Справочник игрока Game Finder - Тройной Парный» (Извините, что я не могу отправить прямой URL из-за отсутствия репутации)

Я генерировал сводную таблицу описательной статистики (. например, рассчитывать среднее) для нескольких переменных (pts trb ast stl blk) с помощью:

tabstat pts trb ast stl blk, statistics(count mean) format(%9.1f) by(player)

Что я получаю следующую таблицу:

tabstat RESU л:

enter image description here

Как я могу сказать Stata фильтровать игроков по count >= 10 (которые получили 10 или более тройных-двойники когда-либо) в качестве колонки затем отсортировать таблицу pts и получите:

Ideal результат:

enter image description here

как выше, я бы сказал, Майкл Джордан и Джеймс Харден являются Top-наиболее взрывоопасными тройными двойными игроками и Даррелл Уокер т он самый экономичный.

ответ

0

Проведите исследование https://stackoverflow.com/help/mcve о том, как представить пример, с которым другие люди могут работать сразу. Кроме того, избегайте спортивного жаргона, который не будет общеприемлемым и больше ориентирован на общую проблему программирования. К счастью, вам все же кажется ясным.

Для этого вам необходимо создать переменную, определяющую заказ, необходимый до вашего вызова tabstat. Чтобы получить его (значение) по вашему желанию, используйте labmask (search labmask, а затем загрузите с Stata Journal).

Вот несколько методов.

sysuse auto, clear 

egen mean = mean(weight), by(rep78) 
egen count = count(weight), by(rep78) 

egen group = group(mean rep78) if count >= 5 
replace group = -group 
labmask group, values(rep78) 
label var group "`: var label rep78'" 

tabstat mpg weight , by(group) s(count mean) format(%1.0f) 

Summary statistics: N, mean 
    by categories of: group (Repair Record 1978) 

group |  mpg weight 
-------+-------------------- 
    2 |   8   8 
     |  19  3354 
-------+-------------------- 
    3 |  30  30 
     |  19  3299 
-------+-------------------- 
    4 |  18  18 
     |  22  2870 
-------+-------------------- 
    5 |  11  11 
     |  27  2323 
-------+-------------------- 
Total |  67  67 
     |  21  3030 
---------------------------- 

Ключевые детали:

  1. основана группирования переменная не только на средства, которые вы хотите отсортировать по, но и от исходной переменной группировки, только в случае, если есть связи по средствам.

  2. Чтобы получить заказ с наивысшего значения вниз, переменная группировки должна быть сведена к нулю.

  3. tabstat не показывает переменные метки в теле таблицы. (Обычно для них не хватит места.)