El primer que s’ha de fer és estandaritzar les dades recollides al camp o al laboratori.
Per exemple:
- posar sempre el mateix número de decimals,
- definir si els decimals són comes o punts,
- en les variables categòriques, que les abreviacions de cada categoria sempre siguin iguals (exemple, no posar “Barcelona” i “BCN”, per categoritzar el mateix).
En segon lloc hem de triar el test estadístic que volem fer per comprovar la nostra hipòtesi.
DISTRIBUCIÓ DE LES VARIABLES
Segueixen una normal?
S’ha d’avaluar la manera en la que es distribueixen les dades al llarg de les variables.
- Distribució de Poisson: Tracta freqüències. Utilitza valors discrets.
- Distribució binomial: és la que té 2 resultats possibles à Control/Experiment, Mascle/Femella…
- Distribució normal: Utilitza valors continus i es descriu mitjançant la mitjana i la variància. Una distribució normal ideal és la que segueix la campana de Gauss.
Segueixen una variància constant?
HOMOSTECEÏTAT
Quan les variàncies són iguals.
HETEROSTECEÏTAT
Quan les variàncies són diferents.
Tipus d’anàlisi
- Estadística descriptiva: Quan volem resumir, observar, descriure i/o explicar com és una població. És on utilitzem: la mitjana, la mediana, percentatges, dispersió…
- Estadística de diferències: Quan volem comparar 2 o més categories de dades. És on utilitzem: t-test, ANOVA, Xi2.
- Estadística de relacions: Quan volem veure si existeix alguna relació entre les variables, és a dir, veure si hi ha un patró en el qual quan una variable canvia l’altre també ho faci. És on utilitzem: regressió, correlació…
- Anàlisi multivariant: Quan volem treballar amb un gran nombre de dades i variables. És on fem servir l’anàlisi multivariant. És on utilitzem: PCA.Tipus de test
Tests paramètrics
S’han de complir les següents condicions:
- Les variables han de seguir una distribució determinada. Si la distribució que se’ns demana seguir és normal, i observem que no ho és, primer provem de transformar les variables:
- Hi ha d’haver homoscedasticitat
- Hi ha d’haver relació lineal en el cas de l’anàlisi de relacions
Exemples tests paramètrics: t-test, ANOVA, Xi2, R-Pearson…
Tests NO paramètrics à alternativa si no es compleixen les condicions dels test paramètrics. Indueix errors i és millor evitar-la.
Exemples: U Mann-Whitney, Wilcoxon test, Kruskal Wallis, Friedman Test, S-Spearman, T-Kendall…
SELECCIÓ DEL TEST
Quan tenim clares les variables que voldrem mesurar podem proposar un test per tal d’acceptar o rebutjar la hipòtesi.
Hem de saber si les variables són quantitatives o qualitatives i a partir d’aquí podem proposar un test.
I recordar si s’ha d’utilitzar un test paramètric o no, en funció de si les variables segueixen una normal, tenen variància constant i si hi ha momosteceïtat.
QUIN TEST ÉS MÉS ADIENT?
La clau dicotòmica de la estadística.
A continuació es mostra un clau dicotòmica per a fer servir en anàlisis de relacions i diferències:
1) Vull fer una anàlisi de relacions…………………………………………………………………………………….2
Vull fer una anàlisi de diferències…………………………………………………………………………………..7
2) Les dades segueixen una distribució normal……………………………………………………………………3
Les dades no segueixen una distribució normal……………………………………………………………….6
3) Les dades són independents…………………………………………………………………………………………4
Les dades no són independents…………………………………………………...S-Spearman o T-Kendall
4) Hi ha homoscedasticitat……………………………………………………………………………………………….5
No hi ha homoscedasticitat…………………………………………………………S-Spearman o T-Kendall
5) Hi ha relació lineal entre les variables………………………………………………………………..R-Pearson
No hi ha relació entre les variables………………………………………………..S-Spearman o T-Kendall
6) Transforma les variables i ara sí hi ha distribució normal………………………………………………….3
Transforma les variables i segueix sense haver distribució normal…… S-Spearman o T-Kendall
7) Es vol comprar 2 variables qualitatives…………………………………………………………………………Xi2
Es vol comparar 1 variable quantitativa i 1 variable qualitativa………………………………………….8
8) La variable quantitativa es de 2 categories………………………………………………………………………9
La variable quantitativa es de més de 2 grups………………………………………………………………..16
9) Les dades són dependents………………………………………………………………………………………….10
Les dades són independents………………………………………………………………………………………13
10) Les dades segueixen una distribució normal………………………………………………………………..12
Les dades no segueixen una distribució normal……………………………………………………………11
11) Transforma les variables i ara sí hi ha distribució normal………………………………………………12
Transforma les variables i segueix sense haver distribució normal……………….. Wilcoxon-Test
12) Hi ha homoscedasticitat…………………………………………………………………………….Paired t-test
No hi ha homoscedasticitat………………………………………………………………………Wilcoxon-Test
13) Les dades segueixen una distribució normal………………………………………………………………..15
Les dades no segueixen una distribució normal……………………………………………………………14
14) Transforma les variables i ara sí hi ha distribució normal………………………………………………15
Transforma les variables i segueix sense haver distribució normal…………….U-Mann Whitney
15) Hi ha homoscedasticitat…………………………………………………………………………Unpaired t-test
No hi ha homoscedasticitat………………………………………………………………….U-Mann Whitney
16) Les dades són dependents………………………………………………………………………………………..17
Les dades són independents……………………………………………………………………………………..20
17) Les dades segueixen una distribució normal………………………………………………………………..19
Les dades no segueixen una distribució normal……………………………………………………………18
18) Transforma les variables i ara sí hi ha distribució normal………………………………………………19
Transforma les variables i segueix sense haver distribució normal………………...Friedman Test
19) Hi ha homoscedasticitat………………………………………………………………………….Paired ANOVA
No hi ha homoscedasticitat………………………………………………………………………Friedman Test
20) Les dades segueixen una distribució normal………………………………………………………………..22
Les dades no segueixen una distribució normal……………………………………………………………21
21) Transforma les variables i ara sí hi ha distribució normal………………………………………………22
Transforma les variables i segueix sense haver distribució normal………………..Kruskal-Wallis
22) Hi ha homoscedasticitat………………………………………………………………………One-way ANOVA
No hi ha homoscedasticitat………………………………………………………………………Kruskal-Wallis