Parametrische correlatie
Wanneer men tussen twee variabelen een lineair verband verwacht, kan men naast de genoemde niet-parametrische correlaties ook een lineaire correlatiecoëfficiënt uitrekenen. Uit een lineaire regressie met de methode van de kleinste kwadraten kan men voor de relatie tussen de twee variabelen een helling a afleiden en een asafsnede b'' zodat geldt dat
Waarbij de kwadratische som van ε over alle gemeten paren (V1, V2) is geminimaliseerd. De lineaire correlatie ρ is in zo'n geval gedefinieerd als:
Net als de niet-parametrische correlatie die boven beschreven is ligt deze waarde tussen -1 (perfecte anti-correlatie) en +1 (perfecte correlatie).
Toepassingen
De correlatie coëfficient wordt vaak toegepast bij metingen van dynamische processen, zoals bij het meten van trillingen. Bij een complex trillend systeem is het soms van belang om de bron van een trilling vast te stellen. Dit kan door te meten op het trillende onderdeel en op de vermoedelijke bron.
Een andere toepassing is bij het uitvoeren van een modale analyse. Hierbij wordt een transferfunctie gemeten tussen de excitatie en de respons. Als de correlatie coëfficient tussen deze twee te laag is, zou de meting terzijde moeten worden gelegd.
Ook bij sociologische studies wordt een oorzaak-effect relatie vaak door een niet-parametrische correlatie gemeten.
In de analytische scheikunde wordt veelvuldig gebruik gemaakt van lineaire ijklijnen om de gevoeligheid van een meting vast te stellen. Wanneer men van zo'n ijklijn gebruik maakt om onbekende monsters te kwantificeren streeft men naar een correlatiecoëfficiënt die meer dan drie negens heeft: 0.999 of hoger. Zo'n hoge correlatie betekent naast de goede herleidbaarheid ook dat de meting een reproduceerbaar resultaat zal opleveren.
Valkuilen
Wanneer bij een onderzoek een hoge correlatie tussen twee variabelen wordt gevonden kan niet direct worden geconcludeerd dat de een oorzaak en de ander effect is. Ook een gemeenschappelijke oorzaak zou de grondslag kunnen zijn, of een algemene trend. Een bekend voorbeeld is de correlatie in de 20e eeuw tussen het vóórkomen van kanker en het aantal antenness op de daken van de huizen: beide namen gedurende enkele decennia sterk toe, maar er was geen enkel oorzakelijk verband.
Een andere valkuil is het zoeken naar een correlatie. Wanneer men enkele tientallen variabelen bestudeert en paarsgewijze correlaties uitrekent, komt men eenvoudig aan honderden correlatiecoëfficienten. Zelfs wanneer de variabelen allemaal niets met elkaar te maken hebben kan er toevallig best een goede correlatie voorkomen. Een mooi voorbeeld is de correlatie tussen het vóórkomen van de ooievaar en het aantal baby's dat wordt geboren dat soms wordt gevonden voor bepaalde periodes van jaren in een bepaald land: er zijn heel veel jaren in heel veel landen waar deze correlatie niet opgaat, maar het is eenvoudig om deze eenvoudig te vergeten en alleen naar het interessante resultaat te kijken.