Я использую инструмент WEKA для кластеризации анализа данных, однако в некоторых из моих атрибутов в домене есть много значений. В частности, мне нужно представить некоторую информацию о белках, и информация, которую мне нужно включить, - это термины, связанные с их функциями.Как я могу иметь дело с несколькими значениями в каком-либо атрибуте?
Например, эти значения включают в тот же атрибут «Function»:
«РНК-связывающий белок», «РНК bindingstructural составляющей ribosomerRNA связывания», «перевод», «intracellularribosomeribonucleoprotein комплекс».
И эти термины разнообразны.
Может кто-нибудь мне помочь?