I ricercatori possono avere bisogno di aiuto per i risultati che non corrispondono alla realtà della comunità di riferimento. Le cause sono numerose, ma il bias di selezione è il più importante. Si verifica quando il campione dello studio deve rappresentare accuratamente la popolazione di interesse, con conseguenti variazioni nei risultati della ricerca.
La comprensione dei bias di selezione, del loro impatto pratico e dei modi migliori per evitarli vi aiuterà a gestirne gli effetti. In questo post troverete tutto ciò che dovete sapere su come migliorare il vostro processo di raccolta dei dati.
Che cos’è il bias di selezione?
Il bias di selezione si riferisce a errori sperimentali che portano a una rappresentazione imprecisa del campione di ricerca. Si verifica quando il gruppo di partecipanti o i dati non rappresentano il gruppo target.
Una causa significativa di bias di selezione si ha quando il ricercatore non considera le caratteristiche del sottogruppo. Essa provoca disparità fondamentali tra le variabili dei dati del campione e la popolazione della ricerca.
I bias di selezione si verificano nella ricerca per diverse ragioni. Se il ricercatore sceglie la popolazione campione utilizzando criteri non corretti, può trovare numerosi esempi di questa distorsione. Può anche accadere a causa di elementi che influenzano la volontà dei volontari dello studio di partecipare.
Tutti i modelli statistici nelle scienze dell’apprendimento richiedono dati. La disponibilità di dati validi è fondamentale per sviluppare una serie di modelli statisticamente validi, ma è sorprendentemente facile ottenere informazioni insufficienti. I pregiudizi di selezione colpiscono i ricercatori in tutte le fasi del processo, dalla raccolta dei dati all’analisi.
Per esempio, i ricercatori devono rendersi conto che i loro risultati potrebbero non essere applicabili ad altre persone o a contesti diversi. Questo tipo di errore presenta individui assegnati in modo casuale a uno di due o più gruppi, ma solo alcune persone che possono essere iscritte partecipano effettivamente.
Ciò significa che le persone considerate idonee per un determinato programma possono scegliere di partecipare o meno. Pertanto, coloro che partecipano al programma possono avere caratteristiche diverse da coloro che non vi partecipano. L’esistenza di un processo di selezione non casuale può portare a inferenze errate sul nesso di causalità e alle relative statistiche, nonché all’invalidazione dei dati raccolti.
Abbiamo pubblicato un blog che parla dell’analisi dei sottogruppi; perché non lo consultate per avere altre idee?
Tipi di bias di selezione
Esistono molti tipi di bias di selezione, ognuno dei quali influisce in modo specifico sulla validità dei dati. Vediamo alcuni dei più comuni:
- Bias di campionamento:
Il bias di campionamento è una forma di bias di selezione che si verifica quando non raccogliamo dati da tutte le persone che potrebbero far parte della nostra popolazione su una variabile cruciale. Alcuni dei motivi potrebbero essere che il ricercatore raccoglie il proprio campione per lo più da campionamenti di convenienza o di comodo, o talvolta selezionando accuratamente individui che sono simili e hanno caratteristiche simili ai soggetti dello studio, ma che non sono ancora stati scelti casualmente dalla popolazione.
Questo può falsare qualsiasi analisi statistica e la comprensione dei risultati in quel caso specifico.
Per saperne di più: Bias nella ricerca di QuestionPro
- Bias di autoselezione:
Questo tipo di bias di selezione, noto anche come “bias del volontario”, si verifica quando le persone che scelgono di partecipare a uno studio non sono rappresentative della più ampia popolazione di interesse. Ad esempio, se si vogliono studiare le preferenze degli studenti per le carriere, si può essere in grado di attirare solo studenti provenienti da scuole note per attirare studenti benestanti. Il pregiudizio dei volontari può verificarsi anche quando uno studio esamina persone di una certa razza ma non ha un numero sufficiente di partecipanti che si identificano come membri di quella razza.
Come ogni altra forma di pregiudizio, anche quello dell’autoselezione distorce i dati raccolti nella ricerca. Nella maggior parte dei casi, il ricercatore finirà per ottenere risultati altamente imprecisi e l’inesistente validità della ricerca sistematica.
- Disturbo da mancata risposta
La distorsione da mancata risposta si verifica quando le persone non rispondono a un sondaggio o non partecipano a un progetto di ricerca. Ciò accade spesso nelle ricerche di sondaggio quando i partecipanti non hanno le capacità adeguate, non hanno tempo, o provano senso di colpa o vergogna per l’argomento.
Ad esempio, i ricercatori sono interessati a sapere come gli informatici vedono un nuovo software. Hanno condotto un sondaggio e hanno scoperto che molti informatici non hanno risposto o non hanno finito.
I ricercatori hanno scoperto che gli intervistati ritenevano il software eccellente e di alta qualità dopo aver ricevuto i dati. Tuttavia, hanno scoperto di aver ricevuto soprattutto critiche sfavorevoli dopo aver rilasciato il nuovo software all’intera popolazione di informatici.
I partecipanti al sondaggio erano informatici di primo livello che non erano in grado di individuare i difetti dei programmi. I partecipanti al sondaggio non rispecchiano la popolazione più significativa di informatici. I risultati sono quindi imprecisi.
- Bias di esclusione:
Il bias di inclusione si verifica quando il ricercatore include intenzionalmente alcuni sottogruppi nella popolazione campione. È strettamente correlato al bias di campionamento senza risposta e influisce sulla validità interna dell’indagine sistematica.
Gli esperti definiscono il bias di inclusione come “il termine collettivo che copre i vari potenziali bias che possono derivare dall’inclusione post-randomizzazione dei pazienti in uno studio e dalle successive analisi”. Quando ciò accade, i risultati della ricerca possono stabilire una falsa connessione tra le variabili.
Il bias di esclusione si verifica quando si escludono intenzionalmente alcuni sottogruppi dalla popolazione campione prima di randomizzarli in gruppi. Potreste aver escluso i pazienti affetti da determinate patologie, come il cancro o l’HIV/AIDS, perché non sarebbe stato etico studiare queste persone senza il loro consenso. O forse li avete esclusi perché non volevate dare loro accesso a un’altra opzione terapeutica durante la sperimentazione clinica. Alcuni ricercatori scelgono anche di non includere persone troppo malate o troppo anziane per partecipare agli studi clinici (perché queste persone potrebbero non essere in grado di partecipare efficacemente o non ricevere sufficienti benefici dalla partecipazione).
- Bias di richiamo:
Una delle forme più comuni di distorsione del ricordo è la distorsione retroattiva della memoria. La distorsione della memoria retroattiva si verifica quando le persone ricordano eventi ed esperienze in un modo che si adatta alle loro esigenze attuali piuttosto che allo scopo originale. Per esempio, qualcuno potrebbe ricordare un evento come se fosse stato un’esperienza positiva o addirittura piacevole, se invece era inteso come negativo. Inoltre, la distorsione retroattiva della memoria può verificarsi quando le persone hanno difficoltà a ricordare dettagli importanti per l’argomento della ricerca, come fatti relativi alla propria vita o a quella degli altri.
La distorsione retroattiva della memoria può verificarsi anche quando le persone includono informazioni imprecise nei loro resoconti. Questo accade quando si riporta qualcosa che non è mai accaduto o che è avvenuto in un momento diverso da quello in cui si è effettivamente verificato.
Ad esempio, una persona potrebbe dichiarare di aver impiegato cinque ore per andare dal lavoro a casa in un determinato giorno, mentre in realtà ne ha impiegate solo tre perché ha pranzato prima alla sua scrivania e se ne è dimenticato fino a tardi.
- Pregiudizio di sopravvivenza
Il Survivorship bias si verifica quando un ricercatore sottopone delle variabili a un concorso di screening e seleziona quelle che completano con successo la procedura. Questo metodo di selezione preliminare elimina le variabili fallite a causa della loro scarsa visibilità.
I pregiudizi sulla sopravvivenza si concentrano sui fattori di maggior successo, anche se non dispongono di dati rilevanti. Può alterare i risultati della ricerca e portare a opinioni inutilmente positive che non riflettono la realtà.
Supponiamo che stiate facendo una ricerca sulle variabili di successo di un imprenditore. La maggior parte degli imprenditori famosi non ha finito l’università. Potrebbe far pensare che uscire dall’università con un concetto forte sia sufficiente per avviare una carriera. Ma la maggior parte di chi abbandona l’università non diventa ricco.
In realtà, sono molte di più le persone che hanno abbandonato l’università per lanciare imprese di scarso successo. In questo esempio, il survivorship bias si verifica quando si presta attenzione solo agli abbandoni che hanno avuto successo e si ignora la grande maggioranza degli abbandoni che hanno fallito.
- Pregiudizio di abbandono
La distorsione da abbandono si verifica quando alcuni intervistati abbandonano il sondaggio mentre è ancora in corso. Di conseguenza, i risultati della ricerca presentano molte incognite, il che riduce la qualità delle conclusioni.
Il più delle volte, il ricercatore cerca le tendenze tra le variabili di abbandono. Se riuscite a identificare queste tendenze, potreste essere in grado di determinare il motivo per cui i rispondenti hanno abbandonato improvvisamente il vostro sondaggio e di prendere i provvedimenti del caso.
- Pregiudizio di sottocopertura
La distorsione da sottocopertura si verifica quando un campione rappresentativo viene estratto da una percentuale inferiore della popolazione target. I sondaggi online sono particolarmente vulnerabili alla distorsione da sottocopertura.
In un sondaggio online sulla salute autodichiarata, supponiamo che ci si concentri sui comportamenti di consumo eccessivo di alcol e fumo. Tuttavia, a causa del vostro modo di condurre il sondaggio, state deliberatamente escludendo le persone che non usano Internet.
In questo modo, gli individui più anziani e meno istruiti vengono esclusi dal campione. Poiché gli utenti e i non utenti di Internet differiscono in modo significativo, non è possibile trarre risultati affidabili dal sondaggio online.
Come evitare i pregiudizi di selezione
Stimare la forza di una relazione tra un risultato (la variabile dipendente) e diverse variabili predittive è essenziale per molte domande di ricerca. I metodi di analisi bivariata e dianalisi multiregressiva sono comunemente utilizzati per evitare i bias di selezione.
L’analisi bivariata è un’analisi quantitativa spesso utilizzata per determinare la relazione empirica tra due variabili. In questo metodo, i ricercatori misurano ogni variabile predittiva individualmente e poi applicano test statistici per determinare se influisce sulla variabile di risultato.
Se non c’è alcuna relazione tra le variabili predittive e l’esito, non sarà possibile trovare alcuna prova di distorsione della selezione nel processo di raccolta dei dati. Tuttavia, se esiste una sorta di relazione tra queste variabili, è possibile che ci sia stato un certo livello di bias di selezione nella raccolta dei dati.
I metodi di regressione multipla consentono ai ricercatori di valutare la forza di questa relazione tra un risultato (la variabile dipendente) e diverse variabili predittive.
È molto probabile che i risultati del sondaggio siano stati influenzati da un errore di selezione. Per evitare errori di selezione, consultate i seguenti consigli:
Durante la progettazione dell’indagine
Provate alcuni di questi suggerimenti per evitare pregiudizi di selezione quando sviluppate la struttura del vostro sondaggio:
- Assicuratevi che gli obiettivi del sondaggio siano evidenti.
- Specificare gli standard da rispettare per il pubblico a cui ci si rivolge.
- Consentire a tutti i possibili partecipanti un’equa opportunità di prendere parte all’indagine.
Durante il campionamento
Considerate di mettere in pratica alcune di queste strategie durante il processo di selezione dei campioni:
- Quando si utilizza il campionamento casuale nei processi, è necessario garantire una randomizzazione adeguata.
- Assicuratevi che l’elenco dei partecipanti sia aggiornato e rappresenti accuratamente il pubblico a cui è destinato.
- Assicuratevi che i sottogruppi rappresentino la popolazione nel suo complesso e condividano i fattori essenziali.
Durante la valutazione
Durante il processo di valutazione e convalida, è necessario pensare di mettere in pratica alcune di queste idee per evitare pregiudizi di selezione:
- Se volete assicurarvi che la selezione del campione, la procedura e la raccolta dei dati siano prive di pregiudizi, è bene che un secondo ricercatore vi guardi le spalle.
- Applicate la tecnologia per monitorare le variazioni dei dati, in modo da poter identificare i risultati inattesi e indagare rapidamente per riparare o evitare dati imprecisi.
- Controllate le tendenze dei dati della ricerca fondamentale precedente per verificare se la vostra ricerca è sulla buona strada per una forte validità interna.
- Invitate le persone che non hanno risposto al sondaggio a partecipare a un altro sondaggio. Un secondo turno potrebbe produrre più voti per una comprensione più chiara dei risultati.
Imparate a evitare le distorsioni di selezione con questo rapido video video Audience by QuestionPro !
Quali sono gli impatti dei bias di selezione?
Nella ricerca esiste sempre la possibilità di errori casuali o sistematici che compromettono l’affidabilità dei risultati della ricerca. I bias di selezione possono avere vari impatti e spesso è difficile dire quanto siano significativi o in quale direzione siano gli effetti. Gli impatti possono comportare diversi problemi per le aziende, tra cui i seguenti:
- Rischio di perdita di fatturato e reputazione
Per la pianificazione e la strategia aziendale, gli approfondimenti ottenuti da campioni non rappresentativi sono molto meno utili perché non si allineano con la popolazione target. Se le decisioni aziendali si basano su questi risultati, si rischia di perdere denaro e reputazione.
- Impatta sulla validità esterna dell’analisi
La ricerca diventa meno affidabile a causa di dati imprecisi. Pertanto, la validità esterna dell’analisi è compromessa a causa del campione distorto.
- Questo porta a decisioni aziendali inappropriate
Se i risultati finali sono distorti e non rappresentativi dell’argomento, non è sicuro affidarsi ai risultati dello studio per prendere importanti decisioni aziendali.
Conclusione
Comprendere i bias di selezione, le loro tipologie e il modo in cui influiscono sui risultati della ricerca è il primo passo per affrontarli. Abbiamo scoperto dati cruciali che ci aiuteranno a identificarlo e a lavorare per ridurne al minimo l’impatto. È possibile evitare i pregiudizi di selezione utilizzando QuestionPro per raccogliere dati di ricerca affidabili.
Diverse situazioni possono causare bias di selezione, ad esempio quando campioni non neutrali sono combinati con problemi di sistema. Uno strumento di ricerca di livello aziendale da utilizzare nella ricerca e nelle esperienze di alterazione è la suite di ricerca QuestionPro.
QuestionPro Audience può aiutarvi a raccogliere dati preziosi dal vostro campione ideale.
Quando si conduce una ricerca, è essenziale comprendere la natura dei bias di selezione. Si tratta della tendenza dei risultati della ricerca ad essere influenzati dalle caratteristiche dei partecipanti o delle persone che vi partecipano. campione .
Se state conducendo uno studio sugli effetti dello zucchero sul diabete, per esempio, e avete un gruppo di persone con diabete che sono tutti membri della vostra chiesa, questo potrebbe essere una fonte di bias di selezione. È possibile che siano più propensi a partecipare alle attività della chiesa rispetto a coloro che non hanno il diabete e che quindi si ritrovino più facilmente nel campione.
Se si vuole evitare questo tipo di distorsione nel proprio studio, è necessario raccogliere i dati da un’ampia varietà di fonti affidabili con QuestionPro Audience