Это более простой вопрос.Создание тестовой среды с небольшими моделями Spacy
Мы используем Spacy в нашей производственной системе. Во время тестирования много раз мы должны загружать полные неспешные модели (парсер + словарные векторы), которые могут быть очень медленными (~ 30 минут) и разочаровывают. Возможно, лучшей стратегией могло бы стать создание пользовательской легкой модели для проверки, например, с использованием только 1000 слов vocab и меньшей модели синтаксического анализа.
Предлагаются стратегии/рекомендации при тестировании с использованием большой модели данных, которая может быть применена к этому сценарию?
Я предпочитаю не издеваться над критическими частями, такими как spacy, чтобы наши тесты были максимально реалистичными и «интеграционными». Однако, как вы сказали, CI, который мы используем сейчас (Circle CI), позволяет кэшировать модель. Таким образом, время загрузки намного лучше. Благодаря! – Rajhans