MISURARE L’OUTCOME IN FISIOTERAPIA

SCALE DI MISURA IN FISIOTERAPIA

Per ogni disciplina scientifica è di fondamentale importanza la misurazione dei fenomeni oggetto di studio, poiché solo in tal modo è possibile quantificare le variabili osservate. La misurazione rappresenta il mezzo per superare il livello di valutazione soggettiva, verso l’oggettivazione ed il controllo dei risultati.
E’ indispensabile in fisioterapia (e in riabilitazione) poter disporre di strumenti e procedure specifiche per la misurazione multidimensionale dello stato di salute, rilevando dati su funzioni e strutture corporee, attività e partecipazione dell’individuo [1] al fine di documentare e monitorare l’efficacia degli interventi riabilitativi/fisioterapici, impostare protocolli di ricerca, identificare indici prognostici.


Cosa sono le SCALE di MISURA?

 
Per scale di misura si intendono tutte quelle “procedure di valutazioni che permettono di attribuire un oggetto ad una classe e di identificare,se possibile, nell’ambito della classe alcune relazioni riconducibili a espressioni numeriche”. [2]


A che cosa SERVONO?


Le scale di valutazione permettono al fisioterapista di raccogliere dati e informazioni sullo stato funzionale del paziente/cliente in base alla sua storia clinica.
L’utilizzo di scale, test e misurazioni consentono al fisioterapista di:
Identificare e caratterizzare segni e sintomi, alterazioni di funzioni e strutture corporee, limitazioni alle attività, restrizioni della partecipazione [1] conseguenti ad un quadro clinico
Stabilire una diagnosi ed una prognosi funzionale, selezionare l’intervento terapeutico e documentare cambiamenti dello stato del paziente/cliente.
Valutare l’esito dell’intervento (outcome) e quindi garantire appropriatezza e adeguatezza nei tempi e termine del trattamento.
I fisioterapisti selezionano le scale e i test da somministrare al proprio paziente sulla base della raccolta dati effettuata e l’esame fisico sullo specifico caso attraverso un processo di ricorsivo e non solo basandosi su una predeterminata diagnosi.


Cosa si intende per MISURARE?


La misurazione è il processo che permette di associare in modo univoco ad una grandezza un valore numerico. Misurare è l’operazione che consente di determinare quante volte una grandezza fisica contiene un’altra grandezza fisica di riferimento, l’unità di misura [3]. Consiste nel mettere in relazione proprietà degli eventi (Sistema Empirico) con proprietà dei numeri reali (Sistema Numerico), attraverso una funzione. [4]

Si descrivono diversi livelli di misurazione che si possono classificare:
a) Livello nominale (misura qualitativa) in cui sono possibili confronti del tipo dicotomici, “uguale” o “diverso”, senza definire ordini gerarchici di importanza o priorità; esempi sono la suddivisione in gruppi per genere, per stato civile, localizzazione di paralisi per arti ecc.
b) Livello ordinale (misura semi-quantitativa) in cui la variabile è classificata secondo un criterio maggiore-minore e in cui gli intervalli tra categorie non sono uguali fra loro per cui non è possibile affermare che la voce con punteggio 2 corrisponda al doppio della voce con punteggio 1; esempi sono la forza misurata con l’esame muscolare manuale, gli stadi di una patologia ecc.
c) Livello quantitativo intervallare in cui nel sistema di misura è previsto un intervallo costante e definito tra due consecutive unità; esempi di misure intervallari sono l’articolarità misurata in gradi angolari, la temperatura in gradi Celsius, il tempo. Una scala intervallare permette di effettuare operazioni aritmetiche (addizioni/sottrazioni), ma non rapporti in quanto lo zero, corrispondente all’assenza della quantità in oggetto, non è assoluto, bensì un valore di riferimento scelto arbitrariamente.
d) Livello quantitativo di rapporto in cui la scala intervallare ha uno zero assoluto per cui fra le misure è possibile individuare diversità, definirne la differenza o il rapporto; esempi sono la lunghezza, la forza misurata con dinamometro, la velocità, la temperatura con gradi Kelvin, ecc.

Qualunque sia la scala di misura dei dati, sarà necessario sapere come questi si “comportano”. Si utilizzano quindi delle informazioni sintetiche che ci permettono di descrivere i dati (Statistica descrittiva) e di effettuare appropriate indagini statistiche (Statistica Interferenziale).
I parametri che descrivono sinteticamente i dati sono le misure di tendenza centrale (nota 1) e quelle di dispersione.(nota 2) Le prime ci indicano intorno a quali valori i dati si concentrano , le seconde ci danno una misura di quanto questi si disperdono, cioè quanto differiscono fra loro.


Quali sono i CRITERI per selezionare lo strumento/scala di misura più adatto?


Rothstein [5] sottolineava che “soltanto quando dimostrano di essere affidabili e valide, le misurazioni contengono informazioni, mentre differentemente sono destinate a fornire solo numeri o categorie che inducono a una falsa impressione di credibilità”.
Vi sono otto criteri che devono essere considerati nella selezione degli strumenti per la valutazione del paziente. [6]
  • Appropriatezza: il contenuto dello strumento è adeguato alle richieste a cui cerca di rispondere?
  • Accettabilità: lo strumento è accettabile per i pazienti?
  • Fattibilità: lo strumento è facile da somministrare e da gestire?
  • Interpretabilità: come sono interpretabili i punteggi dello strumento?
  • Precisione: quanto sono precisi i punteggi dello strumento?
  • Affidabilità: lo strumento è in grado di produrre risultati che siano riproducibili e internamente coerenti?
  • Validità: lo strumento misura ciò che dice di misurare?
  • Sensitività o responsività: lo strumento è in grado di rilevare i cambiamenti nel tempo, che sono importanti e significativi per i pazienti?
  • Specificità : lo strumento è in grado di rilevare le risposte negative per i soggetti non malati? [2]

Questi criteri non sono descritti in letteratura in modo uniforme, né possono avere la priorità in termini di importanza, ma devono essere considerati in relazione al quesito clinico proposto. [7]


Quali sono i requisiti PSICOMETRICI principali di una scala di misura?

Il campo di studio della Psicometria (nota 3) è particolarmente volto verso lo studio delle differenze fra gli individui. Coinvolge due aspetti importanti della ricerca:
1. La costruzione degli strumenti e delle procedure per la misura;
2. Lo sviluppo ed il perfezionamento dei metodi teorici della misura.
Quando si utilizza una scala di misura l’elenco di domande è innumerevole e dipende principalmente dal contesto di applicazione della stessa: la scala misura la dimensione osservata? Le misure sono riproducibili da un’osservazione all’altra? Le misure sono confrontabili con quelle di uno strumento di misura? La misura rilevata è uguale se eseguita da differenti osservatori? Tutte queste domande fanno riferimento a diverse qualità psicometriche di una scala, concetti sviluppati a partire dall’inizio del XX secolo nel quadro della teoria classica dei test. [8]
I requisiti principali di una scala di misura sono affidabilità (reliability), validità (validity), sensibilità al cambiamento (sensitivity or responsiveness to change), utilità clinica. [9]

L’Affidabilità [9] si riferisce alla capacità del sistema di misura di fornire risultati costanti, anche se effettuata in tempi e da operatori diversi, a patto ovviamente che la grandezza in esame non abbia subito variazioni. Si descrivano tre tipi di affidabilità:
Consistenza interna (internal consistency): il grado in cui gli item di una scala sono in relazione e la capacità di misurare un singolo concetto o dominio /dimensione di un concetto con minimo errore. La consistenza interna viene valutata con il coefficiente alpha di Cronbach [10], che misura la correlazione globale fra gli elementi (items) all’interno di una scala. Un coefficiente alpha del valore di 0.70 è considerato il livello minimo accettabile di consistenza interna per strumenti di neo-creazione, mentre 0.80 è il minimo accettabile per strumenti già ideati.
Stabilità o test-retest (intra-rater reliability): il grado in cui lo strumento riproduce stessi risultati per lo stesso individuo quando le misurazioni sono effettuate in differenti occasioni. La stabilità è frequentemente valutata con il coefficiente di correlazione; un coefficiente > 0.70 indica un livello accettabile di stabilità. [10]
Equivalenza o inter-esaminatore (inter-rater reliability): il grado di accordo fra valutatori/esaminatori sulla medesima misurazione. È esaminata utilizzando i seguenti test statistici4: percentuale di accordo fra esaminatori, coefficiente Kappa di Cohen, coefficiente di correlazione di Pearson coefficiente di correlazione intraclasse. Un coefficiente con valore ≥ 0.80 indica una affidabilità iter-esaminatore accettabile.

La Validità [9] si riferisce a quanto accuratamente un test misura effettivamente ciò che intende misurare. Possono essere valutate diversi tipi di validità:
Validità di Contenuto: il grado con cui il contenuto degli item compresi nello strumento copre tutti i domini e aspetti effettivamente significativi dell’ambito /concetto che intende misurare. Solitamente viene valutata da esperti e supportata da procedimenti statistici che ne rilevino frequenza di appartenenza o rilevanza dei singoli item a qule dominio testato. Un indice di validità di ≥ 0.80 rappresenta un livello accettabile di accordo fra esperti che supporta una buona validità di contenuto
Validità di criterio o concorrente: il grado con cui una misurazione si correla con altri parametri assumibili come valori di riferimento (es. gold standard) somministrati allo stesso o in tempi successivi (per es. un altro strumento che misura lo stesso concetto). Questo tipo di validità è valutata dal calcolo di un coefficiente di correlazione o dall’analisi di sensitività e specificità. Un coefficiente di correlazione ?0.50 e un valore di sensitività e specificità ?90% dà un supporto empirico per la validità di criterio o concorrente dello strumento di misura.
Validità di costrutto: valuta se uno strumento di misura si riferisce ad un costrutto teorico precedentemente definito. Viene valutata utilizzando statistiche differenti ( es. test parametrici , non parametrici) a seconda delle scale utilizzate.

La Sensibilità al cambiamento [9] si riferisce alla capacità dello strumento di registrare i cambiamenti sulla variabile presa in esame. L’evidenza di sensibilità consiste nel rilevare differenze significative nei punteggi medi ottenuti in differenti fasi di valutazione, ad esempio prima e dopo il trattamento. Tale evidenza è rafforzata quando i cambiamenti nei punteggi sono correlati con altri indicatori di cambiamento, come ad esempio i cambiamenti clinici. Non sono stati ben identificati specifici criteri di sensibilità.

Utilità clinica [9]: gli strumenti che sono applicati usati dai professionisti nella loro pratica clinica quotidiana devono essere utili. Per essere utile clinicamente uno strumento deve essere semplice, non deve richiedere troppo tempo per essere somministrato, facile da compilare e facilmente interpretabile per i punteggi. Anche se non vi sono criteri ben definiti per valutare la utilità clinica andrebbero definiti per singolo strumento di misura i seguenti aspetti: numero degli items che lo compongono, tempo richiesto (in minuti) per completare la somministrazione, disponibilità eventuale di punteggi soglia (cut-off) o di norme per interpretare i punteggi ( per es. istruzioni di somministrazioni o classificazioni cliniche per i pazienti).

Una proprietà correlata è la Fattibilità che è relativa alla facilità di gestione ed elaborazione di uno strumento. Queste considerazioni sono importanti per il ricercatore e per le persone che raccolgono ed elaborano le informazioni prodotte da strumenti che si riferiscono al paziente/utente. Gli strumenti che sono difficili da gestire e da elaborare possono compromettere lo svolgimento della ricerca e interrompere la cura clinica. Per esempio sono da considerare le risorse supplementari necessarie per la gestione, intervistatore più auto-somministrazione. La complessità e la lunghezza di uno strumento avrà implicazioni sulla forma di somministrazione e sarà necessaria una formazione del personale prima di intraprendere la somministrazione dell’intervista. Può essere utile avere personale disponibile ad aiutare i pazienti che hanno difficoltà con l'auto-somministrazione. Quindi gli atteggiamenti del personale e l'accettazione degli strumenti possono creare sostanziali differenze di accettabilità e risposta.


Cosa si intende per processo di ADATTAMENTO CULTURALE di una scala?


Si intende il processo di traduzione e adattamento culturale di una scala per rendere equivalente da un punto di vista grammaticale, lessicale, semantico e dei contenuti la versione originale con la traduzione nella lingua scelta. Non si tratta quindi solo di una semplice traduzione nella lingua scelta, ma anche la ricerca di equivalenza della scala per le due culture da un punto di vista culturale, esperienziale nella vita dell’individuo. In letteratura sono riportate le linee guida per attuare il processo di traduzione e adattamento culturale di una scala, redatte da D. Beaton [11] Queste suggeriscono sei passaggi fondamentali da eseguire affinchè il processo sia valido:
1. traduzione
2. sintesi delle traduzioni
3. traduzione inversa
4. revisione di un comitato di esperti
5. test sulla versione prefinale
6. presentazione della documentazione tradotta ai produttori della scala originale per l’approvazione del processo.


NOTE

  • Nota 1. Le Misure di tendenza centrale sono Media , Mediana e Moda. La Media è il totale delle osservazioni diviso per il numero delle stesse (es. media aritmetica); la Mediana è il valore osservato che divide in parti uguali il campione /popolazione osservato, richiede di ordinare i dati in sequenza; la Moda è il valore più frequentemente osservato.
  • Nota 2. Le Misure di dipersione sono Range, Varianza , Deviazione Standard ( radice quadrata della varianza) e Coefficiente di variazione.
  • Nota 3. La Psicometria è il campo di studio della teoria e della tecnica della misura in psicologia, incluse la misura della conoscenza, delle abilità, degli atteggiamenti e delle caratteristiche della personalità.(dizionario www.wikipedia.org_ 18/07/2011)
  • Nota 4. Test Statistici: si distinguono Test Parametrici e Test Non Parametrici. I primi si riferiscono al controllo di ipotesi relative ad uno o più parametri di una popolazione e presuppongono la conoscenza della legge distributiva del carattere nella popolazione da cui è stato estratto il campione. Ad esempio il t test, test di correlazione e di regressione. Per i test non parametrici il controllo di ipotesi non presuppone la conoscenza della legge distributiva del carattere nella popolazione da cui il campione è stato estratto. Vengono utilizzati quando non è possibile postulare le ipotesi richieste dai test parametrici, generalmente per la normalità distributiva e frequentemente in presenza di piccoli campioni. Ad esempio il Mann-Whitney Test, il test Wilcoxon dei dati appaiati [9]



Bibliografia essenziale


1. World Health Organization. ICF Classificazione Internazionale del Funzionamento, della Disabilità e della Salute. Erickson Trento, 2002.

2. Lantieri, Risso, Ravera. Statistica medica. McGraw-Hill, 2004.

3. Franchignoni F et al. Considerazioni metodologiche sull’uso di misure e valutazioni in riabilitazione. Pavia: Fondazione Clinica del Lavoro Edizioni, 1995:71-80.

4. Chiesi F, Primi C. Schemi di statistica. CUSL ed.(FI),2002.

5. Rothstein JM. Measurement and clinical practice: therory and application. NY Churchill Livingstone, 1985:1-46

6. World Confederation for Physical Therapy. http://www.wcpt.org/node/29658 (20/06/2011)

7. Fitzpatrick R,C Davey, Buxton MJ et DR Jones. Evaluating patient-based outcome measures for use in clinical trial. Health Technology Assessment, 1998:2(14);1-74

8. Penta M,Arnould C, Decruynaere C. Analisi di Rash e questionari di misura. (ed it a cura di Luigi Tesio) Springer,2005

9. Doran Diane M. Nursing Outcomes:the state of the science. Jones&Bartlett Learning, 2010

10. Streiner DL, Norman GR. Health measurement scales. Oxford University Press, 1995.

11. Norman GR., Streiner DL. Biostatistica. Casa Editrice Ambrosiana, 2004

12. Beaton, Dorcas E et al .Guidelines for the process of Cross-Cultural Adaption of Self-Report Measures. Spine 2000;25(24):3186-3191.

13. American Physical Therapy Association: http://www.apta.org/tests/measures (15/06/2011)

© 2010 SIF - Società Italiana Fisioterapia - PI 06067250487 - Email - Terms & Conditions

Powered by Railsyard CMS - Design and Develop by Cantiere Creativo