Я вставляю в cassandra с помощью Spark.Как узнать количество строк Вставлено с помощью Spark In cassandra
CassandraJavaUtil.javaFunctions(newRDD)
.writerBuilder("dmp", "dmp_user_user_profile_spark1", mapToRow(UserSetGet.class)).saveToCassandra();
logger.info("DataSaved");
Мой вопрос в том, что RDD имеет 5 тыс. Строк, а при вставке в Кассандру по какой-то причине работа терпит неудачу.
Будет ли откатить для строк, которые были вставлены из 5k
и если нет, то как я буду знать, сколько строк были фактически вставлено, так что я могу начать свою работу снова с отказавшим подряда.
Hi Abhishek благодарит за ответ, но проблема здесь в таблице есть столбец app_count, который увеличивается с каждым обновлением. Поэтому мне нужно знать, какие строки были обновлены, когда произошел сбой. –
Обновлен ответ. Или, возможно, вы должны ввести дополнительный столбец для отслеживания такого рода вещей в cassandra, может быть Date или даже целочисленным столбцом. –
Привет, Abhishek, я делал то же самое, то есть разделял RDD на фиксированные размеры, но мой вопрос состоял в том, не получится ли он в середине, в то время как вставка, т.е. из 5000 только 2000, вставлена, а затем она не удалась. , Моя таблица огромна, поэтому я пытаюсь ввести дополнительный столбец (например, AutoIncrement int), используя zipWithIndex. В любом случае спасибо за ответ –