Класс Pyspark DataFrameWriter
имеет jdbc
function для записи dataframe в sql. Эта функция имеет опцию --ignore
, о которой говорится в документации:Не игнорирует ли параметр функции Pyspark DataFrameWriter jdbc игнорировать всю транзакцию или просто оскорбляет строки?
Молчаливое игнорирование этой операции, если данные уже существуют.
Но проигнорирует ли она всю транзакцию или будет игнорировать вставку строк, которые являются дубликатами? Что делать, если я должен был объединить --ignore
с флагом --append
? Изменится ли поведение?