Francesco Uboldi    CONTACT BY E-MAIL home  indice interpolazione  precedente

Approfondimenti: controllo di qualità automatico (coerenza spaziale) segnale questa pagina contiene equazioni!
Questo lavoro è stato fatto in collaborazione con Cristian Lussana e Marta Salvati di ARPA Lombardia.

presentazione EMS 2009

ARTICOLO:   C. Lussana, F. Uboldi and M. R. Salvati, 2010. A spatial consistency test for surface observations from mesoscale meteorological networks. Quarterly Journal of the Royal Meteorological Society, 136, 1075-1088.   DOI: 10.1002/qj.622

Un sistema che assicuri la qualità dei dati forniti da una rete osservativa meteorologica dovrebbe essere composto da numerose componenti integrate fra loro: manutenzione delle stazioni della rete, sistema operativo di trasferimento dei dati, validazione delle misure attraverso la combinazione di strumenti automatici e competenza di operatori esperti.
A causa del gran numero di stazioni che compongono una rete meteorologica, anche se di dimensioni ridotte (reti regionali o provinciali), è necessario avvalersi di controlli automatizzati, che forniscano indicazioni affidabili sulla qualità di ogni misura valutandone le seguenti caratteristiche: plausibilità, ridondanza (dove possibile), coerenza temporale, coerenza spaziale.
Test di qualità automatici sono essenziali, in particolare, ogni volta che le misure sono utilizzate per elaborazioni numeriche operative, come la produzione di mappe di analisi oggettiva, o il calcolo di indici di attenzione o di allerta in relazione a fenomeni specifici - per non parlare dell'assimilazione in modelli prognostici.

I principali metodi (Lorenc, 1984; Gandin, 1988) per controlli di coerenza spaziale (spatial consistency check) propongono di calcolare il quadrato dello scarto (differenza) tra il valore osservato in una determinata stazione, yo, e un valore di riferimento, e confrontarlo con una soglia proporzionale allo scarto quadratico medio, stimato per quella stazione. Il coefficiente di proporzionalità usato per il confronto dipende dalle caratteristiche "globali" della rete osservativa. Come valore di riferimento si possono usare: il valore di background, yb, oppure il valore di analisi, ya, oppure il valore di analisi CV, yCVa, per quella osservazione.

La scelta dell'analisi CV come valore di confronto per le osservazioni -e del corrispondente scarto quadratico medio per la soglia- permette di realizzare un test specifico per ogni stazione, che tiene conto della densità della distribuzione di stazioni in quel punto. Di conseguenza, il test risulta automaticamente meno restrittivo per stazioni isolate (ovvero completamente decorrelate dalle altre stazioni), e più restrittivo per stazioni che si trovano in zone "coperte" da altre stazioni.

Le proprietà dell'algoritmo di interpolazione (nell'ipotesi, ragionevole per dati da stazione, che gli errori osservativi non siano tra loro correlati) stabiliscono una relazione tra residuo dell'analisi ( ya - yo ) e residuo dell'analisi CV ( yCVa - yo ). Ciò permette di scrivere il test in una forma equivalente, secondo cui la quantità che viene confrontata è il prodotto di tali residui: in questo modo il test continua a tenere conto in modo automatico della distribuzione delle stazioni sul territorio, sebbene la soglia non dipenda dalla singola osservazione, ma solo da proprietà globali della rete. Le osservazioni che falliscono il test sono quelle per cui:

( yCVa - yo ) ( ya - yo )   >   T2 σo2

Le quantità a destra del ">" sono uguali per tutte le stazioni: in particolare σo2 è la varianza dell'errore osservativo mediata su tutte le stazioni (stimata statisticamente su un anno di dati). La quantità T2 è stata ottimizzata in relazione al numero di scarti su un periodo annuale, con l'obiettivo di scartare solo dati affetti da errori grossolani, e di conservare le anomalie dovute alle piccole scale dinamiche realmente presenti in atmosfera.

Per capire come il test tiene conto della densità di stazioni, si osserva che per una stazione isolata, ovvero completamente decorrelata dalle altre, l'analisi CV coincide con il valore di background ( yCVa = yb ) e il test si riduce (c'è di mezzo qualche passaggio) a usare il background come quantità di riferimento:

( yb - yo )2   >   T2 <( yb - yo )2 >


Al contrario, per una stazione ridondante l'analisi CV coincide con l'analisi ( yCVa = ya ). In questo caso il test diventa:

( ya - yo ) 2   >   T2 σo2

Il grafico rappresenta l'effetto del test per osservazioni di temperatura. Sugli assi sono rappresentati i residui in °C: dell'analisi ( ya - yo ) in ascissa, e dell'analisi CV ( yCVa - yo ) in ordinata. Se ci sono stazioni isolate devono stare sulla retta inclinata blu, mentre la diagonale verde ( yCVa = ya ) è il luogo delle stazioni (esattamente) ridondanti. L'iperbole viola rappresenta la soglia del test: tre osservazioni superano l'iperbole, quindi falliscono il test in questo caso.
Si vede inoltre che il test è meno restrittivo per stazioni isolate perché il punto di intersezione tra l'iperbole e la retta blu è il più lontano dall'origine. La pendenza della retta blu dipende dall'incertezza relativa attribuita a osservazioni e background: più si dà credito alle osservazioni rispetto al background, più la retta blu si avvicina alla verticale.
Il primo scarto riguarda l'osservazione corrispondente al punto più in basso, a sinistra.

dqchyp 1

Come sempre nelle procedure di controllo di qualità, gli scarti vengono effettuati uno per volta, e dopo ogni scarto analisi e analisi CV vengono ricalcolate. Infatti una stazione da scartare può influenzare l'analisi su una stazione vicina (buona), "gonfiandone" i residui. Per questo motivo la posizione dei punti (soprattutto nel primo quadrante) cambia tra i grafici relativi al primo e al secondo scarto: quando l'osservazione viene scartata, il residuo si riduce per le stazioni vicine, e alcuni punti si avvicinano all'origine.
In questo caso sono state scartate in totale tre osservazioni.

dqchyp 1 dqchyp 1

Quando non si trovano (più) osservazioni da scartare, l'analisi viene calcolata anche sui punti di griglia e vengono realizzate le mappe.
top