2016-05-27 2 views
1

Я использую pandas для подсчета повторяющихся имен пользователей из двух разных больших текстовых файлов. Как получить мой код для одновременного анализа данных из обоих файлов? Прямо сейчас мне удалось запустить только один текстовый файл, поэтому ничего не происходит более одного раза.iPython: Использование Pandas, Как объединить несколько текстовых файлов, чтобы найти повторяющиеся имена пользователей?

Вот мой код:

import pandas as pd 
fixed_df = pd.read_csv('sample.txt', sep=';', encoding='latin1') 
fixed_df['User Name'].value_counts().nsmallest() 

ответ

1

Объединение файлов, как это

fixed_df1 = pd.read_csv('sample1.txt', sep=';', encoding='latin1') 
fixed_df2 = pd.read_csv('sample2.txt', sep=';', encoding='latin1') 
fixed_df = pd.concat([fixed_df1, fixed_df2])