У меня есть извлеченный кириллический контент с HTML-страницы в текстовый файл. В этом файле кириллица в порядке. Затем я использую этот файл для создания файла RDF с помощью Jena. Вот мой код:Запись кириллицы в RDF-файл с использованием библиотеки jena
private void createRDFFile(String webContentFilePath) throws IOException {
// TODO Auto-generated method stub
Model model = ModelFactory.createDefaultModel();
RDFWriter writer = model.getWriter("RDF/XML");
writer.setProperty("showXmlDeclaration", "true");
writer.setProperty("showDoctypeDeclaration", "true");
writer.setProperty("tab", "8");
Writer out = new BufferedWriter(new OutputStreamWriter(
new FileOutputStream(rdfFilePath), "UTF8"));
Resource resDest = null;
Property hasTimeStart = model.createProperty(ns + "#hasTimeStart");
Property distrName = model.createProperty(ns + "#distrName");
Property moneyOneDir = model.createProperty(ns + "#moneyOneDir");
Property moneyTwoDir = model.createProperty(ns + "#moneyTwoDir");
Property hasTimeStop = model.createProperty(ns + "#hasTimeStop");
BufferedReader br = new BufferedReader(new FileReader(
webContentFilePath));
String line = "";
while ((line = br.readLine()) != null) {
String[] arrayLine = line.split("\\|");
resDest = model.createResource(ns + arrayLine[5]);
resDest.addProperty(hasTimeStart, arrayLine[0]);
resDest.addProperty(distrName, arrayLine[1]);
resDest.addProperty(moneyOneDir, arrayLine[2]);
resDest.addProperty(moneyTwoDir, arrayLine[3]);
resDest.addProperty(hasTimeStop, arrayLine[4]);
}
br.close();
model.write(System.out, "RDF/XML");
writer.write(model, out, null);
}
Когда я открываю файл ФРР кириллица, как РўР РђРќРЎРљРћРџ-ВР РўРћР> Рђ?. Может ли кто-нибудь мне помочь?
Я был неправ. Сначала я забыл настройки кодировки utf-8 в OutputStreamWriter, а затем я не перезагрузил файл в текстовом редакторе, с которого я открывался. Теперь в текстовом редакторе все в порядке, но в eclipse я все еще получаю эти странные символы. – vikifor
Итак, ваш файл в порядке, за исключением случаев, когда вы открываете его в Eclipse? Вы должны установить кодировку по умолчанию для Eclipse в UTF-8, см. Http://www.eclipse.org/forums/index.php/t/29511/ для некоторых предложений или других вопросов StackOverflow по аналогичной теме. –