L'analisi CV è definita su ogni stazione come l'analisi ottenuta su
quel punto senza usare quella osservazione, ma usando le osservazioni fornite
da tutte le altre stazioni. In questo modo ogni osservazione viene usata
come informazione indipendente.
Il
Cross Validation score, o
CV score , è una stima
dell'errore dell'analisi ottenuta prendendo il valore RMS
(
root-mean-square) dei residui tra analisi CV e osservazioni.
Spesso il CV score viene indicato proprio come
RMSE
(
root mean square error).
L'analisi CV attua implicitamente una degradazione locale della densità
osservativa. Quindi,
su piccole scale, la stima dell'errore mediante CV score è
di fatto una stima per eccesso.
Il CV score non può, comunque, avvicinarsi indefinitamente a zero
perché l'analisi filtra le scale più piccole.
Per chi ha familiarità con l'Optimal Interpolation, può valer
la pena di osservare che l'analisi CV può essere stimata a partire
dall'analisi se si conoscono gli elementi diagonali della matrice di
influenza.
In tal caso non è quindi necessario iterare la procedura di analisi
tante volte quante sono le osservazioni.
L'algoritmo di calcolo della matrice di influenza è descritto in
Uboldi et al., 2008, ed ha un'altra
utile applicazione nell'interpolazione delle osservazioni di
vento.
In quel caso infatti, al fine di non filtrare troppo eventi di vento intenso,
è stato scelto di far dipendere dai valori osservati
gli elementi diagonali della matrice di covarianza degli errori osservativi.