В настоящее время я работаю над программой, которая помещает каждое слово в текстовый файл в xlsxwriter. Это означает, что я должен разделить линии.Python-Replacing Duplicatte информация в текстовом файле
Моя проблема заключается в том, что я должен избавиться от дублированной информации до тех пор, пока не будет создан первый элемент в строке. Я не могу придумать, как справиться с этим.
Текст Пример
Dave likes fresh green apples
Dave likes fresh green peppers
Dave hates fresh green apples
Dave hates rotten green apples
Jane likes fresh green apples
желаемого результата в xlsxwriter
C1 C2 C3 C4 C5
R1 Dave likes fresh green apples
R2 X X X X peppers
R3 X hates fresh green apples
R4 X X rotten green apples
R5 Jane likes fresh green apples
Благодаря
Вы красивый человек, и я люблю тебя за это. Я должен был внести несколько корректировок, но он работает хорошо. Мне пришлось изменить строку «для строки в test.splitlines():». Сначала я вложил текстовый файл в список и использовал список в цикле for без «разделенных линий», иначе я получил ошибку. При использовании списка переменная temp = line.split() видит достаточно. –
Я использую test.splitlines(), потому что я делаю все из IDLE без чтения файла, но это эквивалентно 'test = open (" test.txt "). Read()', в вашем случае вы можете делать 'с open ("test.txt") в качестве теста: '' record = dict() '' для строки в тесте: 'и остальное то же самое. Во второй раз, когда я использую 'temp = line.split()', нужно обновить запись последней строкой, как она есть, в случае, если это было изменение X на предыдущем шаге, не сохраняйте это. Теперь, когда я думаю об этом, dict тоже не нужен, хорошо, если вы интересны только в предыдущей строке, в этом случае достаточно списка – Copperfield
Когда я прокомментировал запись [temp [0]] = temp [1:] программа не работала должным образом. Так как это прямо сейчас, dict кажется необходимым –