Ложная корреляция возникает, когда два фактора кажутся связанными друг с другом, но на самом деле такой связи нет. 3 Несколько причин, почему может появиться ложная корреляция:
- Случайное совпадение. 2 Если анализировать тысячи рандомных переменных, среди них почти наверняка найдутся пары, показывающие высокую ложную корреляцию. 2
- Общий тренд. 2 Две переменные могут показывать рост или спад синхронно просто потому, что обе вписываются в общий временной тренд. 2
- Плохие данные. 2 Маленькая или смещённая выборка, либо присутствие выбросов могут создавать ложное впечатление о наличии связи. 2 В отдельных случаях даже один-два выброса способны значительно изменить коэффициент корреляции. 2
- Предвзятость и ожидания. 1 Если верить, что два события должны быть связаны, можно увидеть взаимосвязь там, где её на самом деле нет. 1
Чтобы избежать ложной корреляции, рекомендуется анализировать большие объёмы данных, проводить контрольные эксперименты, быть критичными к предположениям и консультироваться с экспертами. 1