В настоящее время я работаю с массивом NumPy memmap с данными из 2,000,000 * 33 * 33 * 4 (N * W * H * C). Моя программа читает случайные (N) индексы из этого массива.Numpy memmap лучше IO и использование памяти
У меня 8 ГБ оперативной памяти, 2TB HDD. Жёсткий диск чтения IO составляет всего около 20 Мб/с, объем использования ОЗУ составляет 2,5 ГБ. Кажется, что есть узкое место на жестком диске, потому что я получаю случайные индексы, которые, очевидно, не входят в кеш memmap. Поэтому я хотел бы, чтобы кеш memmap использовал RAM как можно больше.
Есть ли способ для меня сообщить memmap, чтобы максимизировать использование IO и RAM?