Dr. G. Visco; Regressione e correlazione, parametrici o non parametrici

Rome University, La Sapienza Chemistry Department Rome, Italy, Europe	Dr. Giovanni Visco Cenni di statistica di base. Calcoli di regressioni e correlazioni dicembre 2006	Corso di Laurea in: Scienze Applicate ai Beni Culturali ed alla Diagnostica per la loro Conservazione Corso di laurea in: Chimica Ambientale
previous slide, 25	all lessons, these slides index	next slide, 27

Parametrici o non parametrici [parametric or non-parametric tests]

The Gold Standard Test and Class Selectivity, Specificity ...

Nella correlazione una volta definita cosa e' la correlazione, a quale tipo di classe appartengono le variabili che abbiamo a disposizione, quali sono i limiti di misura di ogni singola variabile dobbiamo scegliere se utilizzare metodi di correlazione (test) parametrici o non parametrici. Per alcune classi di variabili possiamo usarli entrambi, ma partiamo dalle definizioni qui di seguito.

Parametrici [parametric test]

Si dicono parametrici appunto perche' usano "parametri" cioe media, varianza, e tutti gli altri che si possono calcolare su di una distribuzione. Si usano per variabili numeriche sia a rapporti sia ad intervallo, non per le altre. La varianza delle distribuzioni deve essere omogenea.

Si dice che per usare questi test la distribuzione deve essere normale, in qualche caso sono utilizzabili anche se le due variabili da confrontare hanno la stessa distribuzione.

Non sono utilizzabili per piccoli campioni. La dimensione del campione puo' falsare il test di correlazione in modo positivo o negativo. Come per la distribuzione di Gosset (Student) di solito si definiscono pochi campioni se minori di 15, molti se maggiori di 30.

Sono anche utilizzati per confronti fra medie, fra varianze.

Non parametrici [non-parametric test]

Non usano i parametri della distribuzione ma spesso la posizione relativa dopo qualche tipo di ordinamento. Per le variabili con scala ordinale o nominale si possono usare solo questo tipo di test. Queste variabili sono di solito non numeriche e se lo sono i numeri sono una posizione in una scala. Sono utilizzabili per piccoli campioni, per scale ridotte, per confrontare risultati di panel-test, anche per studiare risultati di campionamenti non probabilistici.

Molte pubblicazioni e lavori scientifici oggi puntano sempre di piu' su questi test, anzi si e' invertito l'onere della prova: i test parametrici sono accettati solo quando sono rispettate tutte le condizioni preventive (forma della distribuzione, indipendenza, etc.) se no meglio questi ma con le formule e le tabelle giuste.

Questo e' un breve elenco, magari non esaustivo, dei test non parametrici, tratteremo solo i piu' utilizzati. Non richiedono che i dati abbiano una distribuzione normale. Possono essere utilizzati per confronti fra ranghi, fra percentuali, fra frequenze. Sono anche definiti come distribution-free methods.

Si possono utilizzare anche per le variabili con scale a rapporti e scale ad intervallo per confrontare i risultati ottenuti con altri test, oppure quando una distribuzione anomala in queste scale non permette l'uso di test parametrici. Necessitano per validare il risultato di piu' misure e replicate.

La facilita' d'uso e di calcolo di questi metodi pero' non deve portare chi li conosce ad un abuso, citando uno dei padri della chemiometria da poco scomparso, They have the advantage of always being valid and only require very simple calculation. Therefore, once one knows these methods, one is tempted to use them on every occasion. However, it should be stressed that they are less efficient and require more replicate measurements than the parametric methods for a certain level of α. D.L. Massart.

il Gold Standard Test

Questo e' un test ipotetico, come per esempio le leggi dei gas ideali, che ci permette di studiare quanto uno dei test che usiamo sia "peggiore" del riferimento. Non esiste un test che abbai questi requisiti.

Un ipotetico Gold Standard Test ha una sensibilita' [sensitivity] del 100% (esso identifica tutti gli oggetti con l'attributo richiesto, cioe' non ha nessun risultato falso-negativo) ed ha una specificita' [specificity] del 100% (esso non identifica per errore qualche oggetto che non ha l'attributo richiesto, cioe' non ha risultati con falso-positivo).

Via via che gli strumenti di misura e diagnostici migliorano, come anche la trattazione statistica, il Gold Standard Test reale puo' spostarsi in avanti. Facciamo un esempio clinico.

La rottura della parete dell'aorta e' una emergenza medica che porta spesso alla morte anche se avviene nell'ambulatorio di un ospedale. Fino a poco tempo fa quello che poteva essere considerato il test diagnostico per eccellenza era un aortogramma (registrazione grafica delle pulsazioni dell'aorta) con sensibilita' del 83% e specificita' del 87%. Ora con l'angiogramma in risonanza magnetica (grafica, oggi anche 3D, dell'aorta vista in sezione durante il funzionamento) con sensibilita' del 95% e specificita' del 92% questo e' considerato il test piu' vicino al Gold Standard Test in attesa che diventi da tutti accettato, diffuso, poco costoso. Si usa percio' quest'ultimo per dirimere i casi dubbi.

La Comunita' Europea quando cita la diagnostica applicata al settore Ambiente o al settore Alimentare parla di B.A.T. cioe' della miglior tecnica disponibile al momento in cui si svolge la misura (Best Available Technicques), senza tener conto dei costi-benefici. Praticamente quella piu' vicina, oggi, al Gold Standard Test.

Ecco un documento esplicativo, sempre nel settore ambiente Best Available Techniques and best environmental practices: Guidance, principles and cross-cutting considerations, o su questo server se non lo trovate piu'! (~760 KBytes, .DOC, oct 07).

Selettivita', Specificita', Sensibilita' ... di Classe

Se il carattere rilevato e' un attributo (vero-falso, malato-sano, vero-copia), la sensibilita' e' misurata dalla frazione di unita' che possiedono l'attributo e sono classificate correttamente, in rapporto alle unita' totali che realmente possiedono l'attributo (rilevati solo 21 invece di 24 malati, delle 73 unita da misurare). La sensibilita' percio' va da zero ad 1.

I casi che, possedendo l'attributo ma sono classificati erroneamente, si dicono falsi negativi. I casi che, non possedendo l'attributo ma sono classificati positivamente, si dicono falsi positivi.

Perche' ritradurre una frase ben espressa? Riprendiamola direttamente da un lavoro gia' pubblicato:

A high Selectivity indicates that the clustering algorithm is able to give a good separation of the groups and allows an object to fall inside one of them.
Ed anche,
A high Specificity refers only to one cluster, so called one versus all other, the objects inside this cluster must be well distinguished from the other clusters (but in the worst case, they form an unformed mass of extraneous objects).
Finally, Sensitivity refers to the rate of the number of objects retained by the cluster on the total number of objects that surely are member of the cluster (and this concept includes the Precision: number of objects classified correctly over total number of objects classified as cluster members). Often this measure is improperly called Recall.

previous slide, 25

all lessons, these slides index

next slide, 27