У меня есть файл csv/log из 35 = S (Quote messages; «Tag = Value»), и мне нужно извлечь ставки в правильный CSV-файл для сбор данных. Это не строго связано с FIX, это скорее связанный с R вопрос о том, как очистить набор данных.Преобразование формата сообщения FIX («Tag = Value») в CSV
Необработанные сообщения выглядеть примерно так:
190=1.1204 ,191=-0.000029,193=20141008,537=0 ,631=1.12029575,642=0.000145,10=56
190=7.20425,191=0.000141 ,537=0 ,631=7.2034485,10=140 , ,
190=1.26237,191=0 ,537=1 ,10=068 , , ,
мне нужно сначала добраться до промежуточного набора данных, который выглядит следующим образом, где одни и те же метки совмещены.
190=1.1204 ,191=-0.000029,193=20141008,537=0,631=1.12029575,642=0.000145,10=56
190=7.20425,191=0.000141 , ,537=0,631=7.2034485 , ,10=140
190=1.26237,191=0 , ,537=1, , ,10=068
, который в свою очередь, должны быть преобразованы в это:
190 ,191 ,193 ,537,631 ,642 ,10
1.1204 ,-0.000029,20141008,0 ,1.12029575,0.000145,56
7.20425,0.000141 , ,0 ,7.2034485 , ,140
1.26237,0 , ,1 , , ,068
Я посреди разработки Баш скрипт с AWK, но мне интересно, если я могу сделать это в R. В настоящее, моя самая большая задача - добраться до промежуточной таблицы. От промежуточного к финальному столу я подумал об использовании R с пакетом tidyr, в частности, функции «отдельно». Если кто-нибудь может предложить лучшую логику, я буду очень признателен!
Можете ли вы пояснить, насколько обширны эти записи? Сколько столбцов и строк данных CSV? – vpipkt
10000 строк и столбцов могут быть более 20, зависит от типа сделки. Это выше всего лишь фрагмент, чтобы получить точку в – fabiog