Estimating design effect and calculating sample size for respondent-driven sampling studies of injection drug users in the United States

AIDS Behav. 2012 May;16(4):797-806. doi: 10.1007/s10461-012-0147-8.

Abstract

Respondent-driven sampling (RDS) has become increasingly popular for sampling hidden populations, including injecting drug users (IDU). However, RDS data are unique and require specialized analysis techniques, many of which remain underdeveloped. RDS sample size estimation requires knowing design effect (DE), which can only be calculated post hoc. Few studies have analyzed RDS DE using real world empirical data. We analyze estimated DE from 43 samples of IDU collected using a standardized protocol. We find the previous recommendation that sample size be at least doubled, consistent with DE = 2, underestimates true DE and recommend researchers use DE = 4 as an alternate estimate when calculating sample size. A formula for calculating sample size for RDS studies among IDU is presented. Researchers faced with limited resources may wish to accept slightly higher standard errors to keep sample size requirements low. Our results highlight dangers of ignoring sampling design in analysis.

El muestreo dirigido por los participantes (RDS, por sus siglas en inglés) es cada vez más utilizado para tomar muestras de poblaciones ocultas, como las de usuarios de drogas inyectables (UDI). Sin embargo, los datos del RDS son muy particulares y requieren de técnicas de análisis especializado, muchas de las cuales no se han desarrollado. Para estimar el tamaño de la muestra del RDS es necesario conocer los efectos del diseño (DE, por sus siglas en inglés), los cuales solo pueden ser calculados en forma posterior. Pocos estudios han analizado el DE del RDS utilizando datos empíricos reales. Nosotros analizamos el DE de 43 muestras de UDI recolectadas a través de un protocolo estandarizado. Determinamos que la recomendación anterior de que por lo menos se duplique el tamaño de la muestra, congruente con DE = 2, subestima DE verdaderos, por lo que recomendamos a los investigadores utilizar DE = 4 como una estimación alternativa para calcular el tamaño de la muestra. Se presenta una fórmula para calcular el tamaño de la muestra para estudios con RDS que incluyan UDI. Es posible que los investigadores que cuenten con pocos recursos tengan que aceptar errores estandarizados ligeramente superiores para mantener limitados los requisitos del tamaño de la muestra. Nuestros resultados destacan los peligros al ignorar el diseño del muestreo en el análisis.

Publication types

  • Multicenter Study

MeSH terms

  • Adolescent
  • Adult
  • Drug Users / statistics & numerical data*
  • Epidemiologic Research Design
  • Female
  • HIV Seropositivity / epidemiology*
  • Humans
  • Male
  • Middle Aged
  • Peer Group
  • Referral and Consultation
  • Risk-Taking
  • Sample Size
  • Sampling Studies
  • Sentinel Surveillance
  • Substance Abuse, Intravenous / epidemiology*
  • United States / epidemiology
  • Young Adult