Я пытаюсь создать файл csv для интеллектуального анализа данных, где каждый отдельный экземпляр имеет атрибут subject
, который имеет 40
возможных значений и соответствующий grade
также атрибут. Каждый экземпляр может иметь максимум 4
subjects
и grade
. Как я могу создать файл csv в excel
, представляющий каждого субъекта {p,q,r,s,t,u,v,w,x,y,z,aa,ab,...}
как sub-attribute
предмета с оценкой {A,B,C,D,E,F,O}
как значение, чтобы я не терял зависимость и отношения.Переформатирование CSV-файлов в R
Они, по-видимому расположены (subject->sub, grade->grd)
ниже
|id|sex|sub1 |grd1 |sub2 |grd2 |sub3 |grd3 |sub4 |grd4 |
|--|---|-----|-----|-----|-----|-----|-----|-----|-----|
|1 |M |x |A |y |B |u |O |s |C |
|2 |F |p |E |aa |E |t |A |r |B |
|3 |M |q |B |z |D |aa |A |v |C |
|4 |F |t |D |ab |O |y |B |u |A |
, что я хочу, чтобы преобразовать атрибут
|id|sex|subject |
|--|---|-----------------------------------------------|
|1 |M |x |A |y |B |u |O |s |C |
|2 |F |p |E |aa |E |t |A |r |B |
|3 |M |q |B |z |D |aa |A |v |C |
|4 |F |t |D |ab |O |y |B |u |A |
заранее спасибо
** почему **? никакое приложение не сможет прочитать этот формат. Потому что это ** не CSV **. –
Эти две таблицы выглядят идентичными, за исключением заголовков столбцов, поэтому трудно понять, какой тип преобразования вы ищете. Вы можете уточнить? Обычно широкомасштабные преобразования в Excel, как правило, сложнее, чем использование инструмента OpenRefine или языка, такого как Python. –