Рабочие нагрузки YCSB используют автоматически сгенерированные данные. Есть ли способ привязать публичный набор данных Twitter или других сервисов в качестве входных данных для рабочих нагрузок? Мне нужно использовать атрибут причинности этих наборов данных. (Например, {id, твит, parent-id ..}Присоединить поток твиттера/публичный набор данных в качестве входных данных для рабочих нагрузок YCSB
1
A
ответ
0
Вы не можете использовать ванильный YCSB, но вместо этого вы можете использовать fork KV-replay. Рабочая нагрузка (трассировка) должна быть изменена в их формат ввода, но это должно быть легко сделать в Python или bash.