2015-06-16 4 views
0

Я хочу построить корреляционную матрицу с двумя разными ячейками двух разных CSV-файлов. Кто-нибудь может помочь мне рассказать, как я могу указать один столбец из одного файла и тот же, что и другой файл ?.Build Correlation Matrix для использования двух разных ячеек двух файлов Csv в Rapid miner

ответ

1

Вам необходимо создать новый пример, объединив два столбца вместе с оператором Join, а затем вы можете вычислить корреляционную матрицу. Убедитесь, что при объединении двух наборов примеров одинаковый атрибут идентификатора. В приведенном ниже блоке кода показан пример процесса выбора и объединения двух атрибутов.

<?xml version="1.0" encoding="UTF-8" standalone="no"?> 
<process version="6.4.000"> 
    <context> 
    <input/> 
    <output/> 
    <macros/> 
    </context> 
    <operator activated="true" class="process" compatibility="7.0.000-SNAPSHOT" expanded="true" name="Process"> 
    <process expanded="true"> 
     <operator activated="true" class="retrieve" compatibility="7.0.000-SNAPSHOT" expanded="true" height="60" name="Retrieve Iris" width="90" x="45" y="75"> 
     <parameter key="repository_entry" value="//Samples/data/Iris"/> 
     </operator> 
     <operator activated="true" class="select_attributes" compatibility="7.0.000-SNAPSHOT" expanded="true" height="76" name="Select Attributes" width="90" x="179" y="75"> 
     <parameter key="attribute_filter_type" value="single"/> 
     <parameter key="attribute" value="a1"/> 
     </operator> 
     <operator activated="true" class="retrieve" compatibility="7.0.000-SNAPSHOT" expanded="true" height="60" name="Retrieve Iris (2)" width="90" x="45" y="255"> 
     <parameter key="repository_entry" value="//Samples/data/Iris"/> 
     </operator> 
     <operator activated="true" class="select_attributes" compatibility="7.0.000-SNAPSHOT" expanded="true" height="76" name="Select Attributes (2)" width="90" x="179" y="255"> 
     <parameter key="attribute_filter_type" value="single"/> 
     <parameter key="attribute" value="a2"/> 
     </operator> 
     <operator activated="true" class="join" compatibility="7.0.000-SNAPSHOT" expanded="true" height="76" name="Join" width="90" x="380" y="165"> 
     <list key="key_attributes"/> 
     </operator> 
     <operator activated="true" class="correlation_matrix" compatibility="7.0.000-SNAPSHOT" expanded="true" height="94" name="Correlation Matrix" width="90" x="581" y="165"/> 
     <connect from_op="Retrieve Iris" from_port="output" to_op="Select Attributes" to_port="example set input"/> 
     <connect from_op="Select Attributes" from_port="example set output" to_op="Join" to_port="left"/> 
     <connect from_op="Retrieve Iris (2)" from_port="output" to_op="Select Attributes (2)" to_port="example set input"/> 
     <connect from_op="Select Attributes (2)" from_port="example set output" to_op="Join" to_port="right"/> 
     <connect from_op="Join" from_port="join" to_op="Correlation Matrix" to_port="example set"/> 
     <connect from_op="Correlation Matrix" from_port="matrix" to_port="result 1"/> 
     <portSpacing port="source_input 1" spacing="0"/> 
     <portSpacing port="sink_result 1" spacing="0"/> 
     <portSpacing port="sink_result 2" spacing="0"/> 
    </process> 
    </operator> 
</process> 
+0

@DavidAmu Что делать, если выбрать два столбца из одного файла и сопоставить их. Возможно ли сопоставить два столбца одного файла? – Anaya

+0

Конечно, вы можете сопоставлять столбцы из одного файла. Если вы используете оператор «Корреляционная матрица», он рассчитает корреляцию между всеми атрибутами ввода набора примеров. Если этот пример установлен, это результат одного импорта файла или объединения нескольких файлов (как в примере выше) не имеет значения. – David

+0

[IMG] http://i57.tinypic.com/wulzzd.png [/ IMG] [IMG] http://i61.tinypic.com/4r2cdt.png [/ IMG] здесь два изображения, один примерный набор и вторая - корреляционная матрица. В моем примере корреляция между двумя столбцами одного файла, но не коррелирует значения. @DavidAmu – Anaya