Я пишу код, который дает мне правильные существительные в предложении в верхнем регистре. Я использую тегеры NER для получения тегов, таких как PERSON и LOCATION. Я хочу, чтобы мой код выводил текст между тегами в верхнем регистре. Я делаю это следующим образом, но не работает:Найдите текст между двумя тегами и замените его на прописную букву того же текста
Matcher m1 = Pattern.compile("<PERSON>(.+?)</PERSON>|<LOCATION>(.+?)</LOCATION>").matcher(NER);
while(m1.find())
{ String newDecapTitle = m1.appendReplacement(sb, decapTitle.get(m1.group().toUppercase()));
........
}
Здесь sb представляет собой строковый буфер. Чтобы дать вам пример:
Джеймс Мюррей отправился в Лос-Анджелес
получает разобрано как
<PERSON>James murray</PERSON> went to <LOCATION>Los angeles</LOCATION>
, и я хочу, чтобы мой выход будет -
Джеймс Мюррей отправился в Лос-Анджелес
.
Но я не знаю, как много тегов предложение будет так, как я могу это объяснить? – serendipity