SVD, pseudoinverse en PCA: SVD, pseudoinverse en PCA
Pseudoinverse en kleinste kwadraten methode
Stel dat een ()-matrix is en een vector in is en je de vergelijking wilt oplossen. Als het beeld van de hele ruimte is, dan heeft de vergelijking een oplossing, namelijk . Maar wat te doen als niet in het beeld van zit? Dan kunnen we een vector in het beeld van bepalen met kortste afstand tot : voor alle . Wat we zoeken is dan de orthogonale projectie van op het beeld van , oftewel, we zoeken een vector zodanig dat Zo'n vector heet een kleinste-kwadratenoplossing van de vergelijking . We weten dat loodrecht op het beeld van staat en dus is voor alle . Opgeschreven als matrixproduct hebben we: voor alle . Dus met het inproduct: voor alle . In het bijzonder geldt dit voor en dus: . Maar dan moet gelden dat , Met andere woorden: is element van de kern van . Omdat equivalent is met geldt, onder de conditie dat inverteerbaar is, dat
Als een ()-matrix is met , dan is inverteerbaar en is de pseudoinverse van , ook wel Moore-Penrose inverse genaamd, de matrix gedefinieerd door
Merk op dat de pseudoinverse van een ()-matrix een ()-matrix is.
Toepassing van de pseudoinverse van een matrix op een vector levert dus de kleinste kwadraten benadering van de vector op. Het verband tussen pseudoinverse en singulierewaardenontbinding is als volgt en generaliseert de definitie van pseudoinverse tot een willekeurige matrix.
Algemene definitie van pseudoinverse Laat een ()-matrix zijn met singulierewaardenontbinding , waarbij een ()-matrix met ()-diagonaalmatrix waarbij op de hoofddiagonaal de singuliere waarden van ongelijk aan nul staan, dat wil zeggen, . De pseudoinverse van is dan de ()-matrix gedefinieerd door waarbij de ()-matrix is.
Nu geldt:
Het probleem heeft een unieke kleinste-kwadratenoplossing zodat het dichtst bij ligt en wel
Laten we als voorbeeld een eerder regressieprobleem bekijken: een regressielijn voor de punten , en . Bij het regressietype hoort de matrix We kunnen de pseudoinverse van berekenen: met determinant . Dus is de inverse van deze -matrix als volgt: De pseudoinverse is nu: Om de regressielijn te bepalen, moeten we nu het volgende matrix-vector product uitrekenen om de coëfficiënten van de regressielijn te bepalen: We hebben dus de lijn gevonden.