Я прочитал два текстовых файла: первый содержит арабский текст, я разделил его. Второй содержит стоп-слова. Я хочу, чтобы удалить все стоп-слова (во втором файле) из первого файла, но я не знаю, как это сделать:Удалить стоп-слова из текстового файла в C#
FileStream fs = new FileStream(@"H:\\arabictext.txt", FileMode.Open);
StreamReader arab = new StreamReader(fs,Encoding.Default,true);
string artx = arab.ReadToEnd();
richTextBox1.Text = artx;
arab.Close();
char[] dele = {' ', ',', '.', '\t', ';','#','!' };
string[] words = richTextBox1.Text.Split(dele);
FileStream fsw = new FileStream("H:\\arab.txt", FileMode.Create);
StreamWriter arabw = new StreamWriter(fsw,Encoding.Default);
foreach (string s in words)
{
arabw.WriteLine(s);
}
Положить стоп-слова в HashSet «стоп-слова». Прокрутите «слова», напишите все, что не содержится в «стоп-словах» для арабского. –
Как отформатирован второй файл? Одно слово на каждой строке? –
Насколько велики эти файлы? –