Разница между LEFT, RIGHT и FULL внешними соединениями в PySpark заключается в том, как они объединяют строки из двух DataFrames: 24
- LEFT внешнее соединение (также известное как левое соединение) объединяет все строки из левого DataFrame с соответствующими строками из правого DataFrame. 4 Если для строки в левом DataFrame не найдено соответствия, в несовпадающих столбцах из правого DataFrame заполняются нулевые значения. 4
- RIGHT внешнее соединение (или правое соединение) объединяет все строки из правого DataFrame с соответствующими строками из левого DataFrame. 4 Строки в правом DataFrame без соответствующего ключа в левом DataFrame будут иметь нулевые значения в несовпадающих столбцах. 4
- FULL внешнее соединение (также известное как полное соединение) объединяет все строки из обоих DataFrames, включая те, без соответствующих ключей. 4 Когда совпадение не найдено, в несовпадающих столбцах заполняются нулевые значения. 4
Таким образом, в отличие от LEFT и RIGHT соединений, которые отдают приоритет одному DataFrame, FULL внешнее соединение рассматривает обе стороны одинаково. 2