In questo lavoro si considerano esperimenti con output casuale binario (successo/insuccesso), per i quali all’aumentare del numero dei dati sperimentali campionari aumenti la probabilità di successo dell’esperimento, detta potenza (es. i trial clinici, che hanno per output un test statistico).
Fissando la potenza desiderata (es. 90%) esiste quindi una dimensione campionaria ideale (M) che fornisce tale potenza. Tuttavia, la potenza è incognita in quanto dipende dalla distribuzione di probabilità del fenomeno in studio (F), e pertanto anche M non è calcolabile. In pratica, avendo a disposizione un campione di n dati proveniente da un esperimento pilota, si può stimare tale numerosità ideale M.
Metodi tradizionali utilizzano il criterio della stima puntuale, che consiste nell’assumere che la distribuzione stimata nell’esperimento pilota (Fn) corrisponda alla vera F. In questo modo la stima di M sarà una volta su due sotto quella ideale, e quindi si otterrebbe con probabilità 50% un esperimento sottopotenziato.
Alternativamente, per ridurre tale probabilità ad un prefissato valore 1-γ (es. 25%), si adotta il criterio della stima γ-conservativa della dimensione campionaria (come recentemente suggerito dalla FDA).
Tale criterio risulta a volte difficilmente applicabile per motivi tecnici (es., per test statistici parametrici con potenza analiticamente difficile da calcolare, oppure per test statistici non parametrici).
Pertanto, viene qui presentato un metodo, basato sul calcolo intensivo, che permette di effettuare una stima γ-conservativa della dimensione campionaria in ambito generale.
Si consideri ora il fatto che spesso gli esperimenti vengono “lanciati” se precedenti esperimenti pilota hanno dato esiti sufficientemente buoni, ossia se l’effetto stimato è risultato maggiore di una soglia minima δ.
Applicando in questo contesto il metodo della stima γ-conservativa della numerosità campionaria, al crescere di γ si ha che: 1) la probabilità di lanciare l’esperimento decresce; 2) la potenza dell’esperimento, una volta lanciato, cresce.
Viene quindi proposto un criterio di ottimizzazione vincolata per la scelta di γ, basato sui dati del campione pilota, che ha portato a definire una procedura di stima conservativa-ottima della dimensione campionaria (COS).
Con potenze sperimentali tra l’80% ed il 90%, con dimensioni del campione pilota da 1/3 a 4/3 di M, e con effetti reali da 2 a 5 volte δ, COS fornisce, rispetto alle strategie standard γ-conservative (ossia γ=50%, 75%, 84.1%), un guadagno tra il 5% ed il 10% in termini di potenza ed una riduzione tra il 20% ed il 100% della dimensione campionaria stimata. |