У меня есть набор данных, который имеет 14 столбцов (мне приходилось использовать только 4 столбца: класс путешествий, пол, возраст и стоимость проезда), которые я разделил на поезд и тестовые наборы данных. Мне нужно создать вертикальную гистограмму из набора данных поезда для распределения пассажиров путешествующим классом (1, 2 и 3 - классы). Мне не разрешено использовать NumPy, Pandas, SciPy и SciKit-Learn.Задать набор данных по подсчетам категорий переменной
Я очень новичок в Python, и я знаю, как строить очень простые графики, но когда дело доходит до более сложных графиков, я немного теряюсь.
Это мой код (я знаю, что есть много плохого):
travelling_class = defaultdict(list)
for row in data:
travelling_class[row[0]]
travelling_class = {key: len(val) for key, val in travelling_class.items()}
keys = travelling_class()
vals = [travelling_class[key] for key in keys]
ind = range(min(travelling_class.keys()), max(travelling_class.keys()) + 1)
width = 0.6
plt.xticks([i + width/2 for i in ind], ind, ha='center')
plt.xlabel('Tracelling Class')
plt.ylabel('Counts of Passengers')
plt.title('Number of Passengers per Travelling Class')
plt.ylim(0, 1000)
plt.bar(keys, vals, width)
plt.show()
import matplotlib.pyplot as plt
classes = travelling_class[1, 2, 3]
plt.hist(classes)
plt.show()
@TrakJohnson Это оригинальный Аскер вопроса - жаль, что я случайно как-то удалил свой профиль, должен был сделать новый. Большое вам спасибо за вашу помощь. Проблема в том, что мой набор данных составляет 1045 строк, поэтому может быть сложно перечислить все из них. Означает ли это вышеизложенное?
Вы пытались закодировать? – iparjono
Привет, да у меня есть :) –
Я вставил свой код в сообщение –