Método analítico para detectar evaluadores atípicos.
HogarHogar > Noticias > Método analítico para detectar evaluadores atípicos.

Método analítico para detectar evaluadores atípicos.

Aug 22, 2023

BMC Medical Research Methodology volumen 23, número de artículo: 177 (2023) Citar este artículo

112 Accesos

Detalles de métricas

Los estudios epidemiológicos y médicos a menudo dependen de evaluadores para obtener mediciones de las exposiciones o los resultados de los participantes del estudio, y las estimaciones válidas de las asociaciones dependen de la calidad de los datos. Aunque se han propuesto métodos estadísticos para ajustar los errores de medición, a menudo se basan en supuestos no verificables y podrían conducir a estimaciones sesgadas si se violan esos supuestos. Por lo tanto, se necesitan métodos para detectar evaluadores potenciales "atípicos" para mejorar la calidad de los datos durante la etapa de recopilación de datos.

En este artículo, proponemos un algoritmo de dos etapas para detectar evaluadores "atípicos" cuyos resultados de evaluación tienden a ser superiores o inferiores a los de sus homólogos. En la primera etapa, los efectos de los evaluadores se obtienen ajustando un modelo de regresión. En la segunda etapa, se realizan pruebas de hipótesis para detectar evaluadores "atípicos", donde consideramos tanto el poder de cada prueba de hipótesis como la tasa de descubrimiento falso (FDR) entre todas las pruebas. Llevamos a cabo un extenso estudio de simulación para evaluar el método propuesto e ilustramos el método detectando posibles audiólogos "atípicos" en la etapa de recopilación de datos para el Grupo de Evaluación de Audiología del Estudio de Conservación de la Audición, un estudio epidemiológico para examinar los factores de riesgo de pérdida auditiva. en el Estudio de Salud de las Enfermeras II.

Nuestro estudio de simulación muestra que nuestro método no sólo puede detectar verdaderos evaluadores "atípicos", sino que también es menos probable que rechace falsamente a verdaderos evaluadores "normales".

Nuestro algoritmo de detección de "valores atípicos" de dos etapas es un enfoque flexible que puede detectar eficazmente evaluadores "atípicos" y, por lo tanto, la calidad de los datos se puede mejorar durante la etapa de recopilación de datos.

Informes de revisión por pares

Muchos estudios médicos y epidemiológicos que investigan las relaciones entre los factores de riesgo y los resultados de las enfermedades dependen de múltiples evaluadores (por ejemplo, médicos, técnicos) para medir las exposiciones o los resultados de interés entre los participantes del estudio. Por ejemplo, en grandes estudios epidemiológicos sobre pérdida auditiva, las mediciones de audiometría de tonos puros suelen ser obtenidas por varios audiólogos o técnicos capacitados en cabinas insonorizadas [1,2,3]. De manera similar, en grandes estudios de visión, las pruebas de visión a menudo las realizan múltiples evaluadores en un entorno clínico [4, 5]. Además, los posibles problemas relacionados con la recopilación de datos por parte de múltiples evaluadores también pueden extenderse a estudios que dependen de datos recopilados mediante métodos de prueba no humanos, como audiómetros automatizados [6], para obtener mediciones de prueba. Obtener estimaciones precisas de la asociación entre los factores de riesgo y los resultados de la enfermedad no sólo depende de los métodos estadísticos utilizados, sino también de la calidad de los datos en sí. Aunque se han propuesto muchos métodos analíticos para ajustar los errores de medición que surgen de datos recopilados con mala calidad, esos métodos generalmente se basan en suposiciones no verificables [7] y pagan el costo de la precisión de las estimaciones. Por lo tanto, se prefiere recopilar datos de mejor calidad que utilizar métodos estadísticos para ajustar los sesgos inducidos por datos de peor calidad durante la etapa de análisis estadístico. En este artículo, proponemos métodos para el control de calidad durante la etapa de recopilación de datos para que los problemas con las mediciones de las exposiciones o los resultados puedan descubrirse y abordarse rápidamente.

Nuestro trabajo está motivado por el Estudio de Conservación de la Audición (CHEARS), una investigación de los factores de riesgo de pérdida auditiva entre los participantes en los Estudios de Salud de Enfermeras II (NHS II), un estudio de cohorte en curso que consta de 116.430 enfermeras registradas en los EE. UU. entre 25 y 42 años en el momento de la inscripción en 1989 [8]. El CHEARS Audiology Assessment Arm (AAA) evaluó el cambio longitudinal en los umbrales auditivos audiométricos de conducción ósea y aérea de tonos puros (la intensidad del sonido de un tono puro en el que se percibe por primera vez) medido en decibeles en el nivel de audición, o dB HL, en toda la gama de frecuencias convencionales (0,5-8 kHz) [9]. Se realizaron pruebas de referencia en 3.749 mujeres cuyo estado auditivo autoinformado era "excelente", "muy bueno" o tenían "un pequeño problema de audición", y residían cerca de uno de los 19 sitios de pruebas CHEARS en los EE. UU. [9]. Las pruebas de seguimiento de 3 años se completaron en 3.136 participantes (84%). Para obtener mediciones de audición confiables, es fundamental detectar posibles audiólogos "atípicos" que tienden a tener mediciones de pruebas de audición más altas o más bajas que otros audiólogos. Una vez que se identifica a un audiólogo "atípico", se pueden examinar los dispositivos utilizados por este audiólogo y se puede llevar a cabo una intervención temprana durante la etapa de recopilación de datos, si es necesario. Además, esta información atípica puede tener implicaciones importantes para el enfoque del análisis de datos.

Hasta donde sabemos, no existen métodos estadísticos para detectar evaluadores "atípicos". En este artículo, desarrollamos un algoritmo innovador de dos etapas para detectar evaluadores "atípicos". En la primera etapa, en lugar de evaluar directamente las mediciones observadas, extraemos los efectos de los evaluadores sobre las mediciones mediante análisis de regresión donde se pueden tener en cuenta las influencias de otras variables. En la segunda etapa, realizamos pruebas de hipótesis para detectar evaluadores "atípicos" basados ​​en los coeficientes estimados y las varianzas del análisis de regresión de la primera etapa.

El documento está organizado de la siguiente manera. En la sección "Métodos", presentamos el algoritmo de dos etapas para detectar evaluadores "atípicos" para escenarios en los que cada participante del estudio tiene mediciones únicas o múltiples. En la sección 'Simulación', realizamos un estudio de simulación para investigar el rendimiento de nuestro algoritmo de dos etapas. La sección 'Aplicación' presenta un análisis de datos reales para detectar audiólogos 'atípicos' en CHEARS AAA. La sección 'Discusión' concluye el artículo.

Primero consideramos el escenario en el que cada participante del estudio solo tiene una medición que debe obtener un evaluador. A lo largo del artículo, asumimos que la exposición o el resultado de la prueba de cada participante del estudio será medido por un solo evaluador, pero un evaluador puede medir a múltiples participantes del estudio. Sea \(i\in \{1,2,\ldots , N\}\) un índice de los participantes del estudio; \(j\in \{1,2,\ldots ,M\}\) indexa los evaluadores que miden la exposición o el resultado de la prueba. Sea \(n_j\) el número de participantes del estudio que son evaluados por el j-ésimo evaluador, de modo que \(\sum _{j=1}^{M}n_j=N\).

Para estimar los efectos de los evaluadores en las mediciones, en la primera etapa ajustamos la siguiente regresión lineal:

donde \(Y_i\) es la medida para el i-ésimo participante del estudio, \(\text {T}_i^{(j)}\) es un indicador del evaluador que es 1 si la exposición o el resultado del i-ésimo participante del estudio es evaluado por el evaluador j-ésimo, y 0 en caso contrario, \(\varvec{X}_i\) es un vector p-dimensional que contiene posibles factores de confusión para la relación evaluador-\(Y_i\) y predictores de \(Y_i\) , y \(\varvec{\gamma }^T\) es la transpuesta del vector de coeficiente p-dimensional \(\varvec{\gamma }\). Usamos T para denotar la transpuesta de un vector o matriz en todo el artículo. Sin más especificaciones, todos los vectores son vectores de columna en este documento. Tenga en cuenta que la regresión de la primera etapa puede ir más allá de la linealidad, donde se pueden incluir algunas formas no lineales de \(\varvec{X}_i\) para una explicación más precisa de los efectos de las covariables en la medición. El coeficiente de regresión \(\beta _j\) representa el efecto medio del evaluador j en la medición después de ajustar por \(\varvec{X}\), y en ausencia de evaluadores 'atípicos', \(\beta _j, j =1,\ldots , M\), debe ser similar entre diferentes evaluadores.

En la práctica, puede haber múltiples mediciones para todos o parte de los participantes del estudio. Sea \(k\in \{1,2,\ldots ,t_i\}\) indexar las medidas del i-ésimo participante del estudio. Por ejemplo, en CHEARS AAA, los audiólogos examinan ambos oídos de los participantes del estudio y, por lo tanto, tenemos \(t_i=2\) para cada participante en cada frecuencia.

En CHEARS AAA, los coeficientes de correlación de Pearson entre los resultados de las pruebas de audición del oído izquierdo y derecho son superiores a 0,7 independientemente de las frecuencias. Para tener en cuenta la correlación entre múltiples mediciones y, mientras tanto, poder estimar el efecto medio de los evaluadores en las mediciones después de controlar posibles factores de confusión, proponemos aplicar el método de Ecuaciones de Estimación Generalizadas (GEE) en el análisis de regresión de primera etapa. para estimar los efectos de los evaluadores [10, 11]. El modelo para las múltiples mediciones correlacionadas se puede escribir como:

donde \(\varvec{Y}_i=[Y_{i,1},Y_{i,2},\ldots ,Y_{i,t_i}]^T\), \(\text {Cov}(\varvec {Y}_i)=\Sigma _i\), siendo \(\Sigma _i\) la matriz de varianza-covarianza \(t_i\times t_i\) desconocida de las mediciones del i-ésimo participante del estudio, y \(\ varvec{Z}_{i,k}\) contiene información que es específica de la k-ésima medición del i-ésimo participante del estudio.

Los parámetros \(\varvec{\theta }=[\varvec{\gamma }^T, \varvec{\beta }^T, \varvec{\eta }^T]^T\), con \(\varvec{ \beta }=[\beta _1,\ldots ,\beta _M]^T\), se puede estimar resolviendo la siguiente ecuación de estimación [10, 11]:

donde \(\varvec{\mu }_i=E\left[ \varvec{Y}_i|\varvec{X}_{i}, \varvec{Z}_i, \text {T}_{i}^{ (1)},\ldots ,\text {T}_{i}^{(M)}\right]\), \(\varvec{D}_i=\frac{\partial }{\partial \varvec{ \theta }}\varvec{\mu }_i(\varvec{\theta })\), \(\varvec{V}_i(\varvec{\theta },\varvec{\alpha })\) es el sistema operativo matriz de varianza-covarianza, y \(\varvec{\alpha }\) contiene parámetros que caracterizan la estructura de correlación entre múltiples mediciones. Algunas estructuras de correlación de trabajo comunes para \(k_1\ne k_2\in \{1,\ldots ,t_i\}\) son independientes y se definen como \(\text {Corr}(Y_{i,k_1}, Y_{i, k_2})=0\); intercambiable, definido como \(\text {Corr}(Y_{i,k_1}, Y_{i,k_2})=\alpha\), y no estructurado, definido como \(\text {Corr}(Y_{i,k_1) }, Y_{i,k_2})=\alpha _{k_1,k_2}\). La varianza de \(\widehat{\varvec{\theta }}\), \(\text {Var}(\widehat{\varvec{\theta }})\), se puede estimar basándose en el estimador de varianza sándwich [ 10, 11].

Los coeficientes \(\beta _1,\ldots ,\beta _M\) reflejan los efectos de los evaluadores en las mediciones. Un evaluador 'atípico' tendrá un coeficiente diferente al resto de los 'normales'. Por lo tanto, en la segunda etapa, realizamos pruebas de hipótesis para detectar evaluadores 'atípicos' basados ​​en \(\widehat{\varvec{\beta }}\) y \(\widehat{\text {Var}}(\widehat{ \varvec{\beta }})\).

En la segunda etapa, detectamos evaluadores "atípicos" que dan mediciones diferentes a las de sus contrapartes después de ajustar los verdaderos predictores y factores de confusión del resultado. Ahora definimos formalmente a los evaluadores "atípicos" como aquellos evaluadores cuyos efectos en las mediciones son diferentes del efecto promedio entre todos los evaluadores del estudio. Recuerde que \(\beta _j, j=1,\ldots ,M\) representa el efecto del j-ésimo evaluador en las mediciones después de controlar las características de los participantes del estudio. Los evaluadores 'atípicos' se pueden detectar probando si los efectos del evaluador en las mediciones son estadísticamente diferentes del efecto medio promediado entre todos los evaluadores. Por tanto, para un evaluador j dado, la hipótesis se puede formular como:

que se puede escribir como \(H_{0, j}: \varvec{L}^T_j\varvec{\beta }=0\,\,\, \text { vs } \,\,\, H_{1, j}: \varvec{L}^T_j\varvec{\beta }\ne 0\), con

Tenga en cuenta que \(\beta _j-\frac{1}{M}\sum _{q=1}^{M}\beta _q\) se puede interpretar como la diferencia entre la medición media del j-ésimo evaluador y las mediciones medias promedio de todos los evaluadores ajustando las características de los participantes del estudio evaluados. El estadístico de prueba de la prueba de Wald \(\chi ^2\) bajo la hipótesis nula \(H_{0, j}\) es [12]:

donde \(\widehat{\Sigma }\) es la matriz de varianza-covarianza estimada de \(\text {Var}(\widehat{\varvec{\beta }})\).

Un enfoque más sólido es calcular una media truncada de los coeficientes donde se pueda evitar que los posibles "valores atípicos" contaminen el efecto promedio. Sean \(\beta _{(1)}, \beta _{(2)},\ldots ,\beta _{(M)}\) los valores ordenados de los coeficientes de regresión. Una media truncada \(\delta \times 100 \%\) se puede calcular de la siguiente manera [13]:

donde [x] denota la parte entera de x.

La hipótesis nula de que el j-ésimo evaluador no es un 'valor atípico' es ahora comparar el coeficiente de regresión del j-ésimo evaluador con la media truncada \(\delta \times 100\%\):

Remitimos a los lectores a la Sección 1 del Material complementario para obtener detalles técnicos sobre la construcción de la matriz de diseño \(\varvec{L}^T_{\delta \times 100\%, j}\) para realizar la prueba de hipótesis en (8).

Dado que nuestro objetivo es detectar tantos evaluadores potenciales "atípicos" como sea posible, nos gustaría lograr suficiente poder cuando los evaluadores sean verdaderos "valores atípicos". Por lo tanto, para completar el procedimiento de prueba de hipótesis, a diferencia del enfoque tradicional donde se pone énfasis en controlar el error tipo I \(\alpha\) a un nivel aceptable, también damos importancia a garantizar un nivel apropiado de error tipo II. .

Idealmente, cuando se realizan pruebas de hipótesis para detectar evaluadores potenciales 'atípicos', hay poder suficiente para rechazar las hipótesis nulas \(H_{0,j}\) cuando una hipótesis alternativa preespecificada \(H_{1,j}\) es verdad. Denote la hipótesis alternativa preespecificada como \(H_{1,j}: \left| \varvec{L}^T_j\varvec{\beta }\right| = c\), donde c se puede determinar en función del tema conocimiento. Por ejemplo, en CHEARS AAA, el 'umbral de audición' para cada oído individual se mide mediante la intensidad de sonido más baja de una señal de tono puro presentada individualmente a cada oído, a la cual el oyente responde de manera confiable, y la señal de tono puro fue medido en pasos de 5 dB [9]. Como resultado, la pérdida auditiva se definió como un aumento superior a 5 dB HL en los promedios de tonos puros de las frecuencias de prueba en baja frecuencia (0,5, 1, 2 kHz), media frecuencia (3, 4 kHz) y alta frecuencia (6, 8 kHz) [9]. Por lo tanto, es importante identificar a los audiólogos que consistentemente dieron resultados de pruebas de audición 5 dB mayores o menores que sus homólogos después de controlar las características de los participantes del estudio. Por lo tanto, un valor razonable para la hipótesis alternativa para la cual esperamos tener suficiente poder de detección es \(c=5\) para CHEARS AAA. Para simplificar la presentación, no distinguimos entre \(\varvec{L}_j\) y \(\varvec{L}_{\delta \times 100\%, j}\) en esta sección, y usamos \( \varvec{L}_j\) para denotar la matriz de contraste de ambas pruebas.

En general, la fórmula de potencia para la prueba de hipótesis: \(H_{0, j}: \varvec{L}^T_j\varvec{\beta }=0 \text { vs } H_{1, j}:\left| \varvec{L}^T_j\varvec{\beta } \right| = c\) es:

donde \(\alpha\) es una tasa de error de tipo I bilateral y \(\phi\) es la potencia de la prueba.

Bajo hipótesis alternativa, prueba la estadística \(\left( \varvec{L}^T_j\widehat{\varvec{\beta }}\right) ^T\left[ \varvec{L}^T_j\widehat{\Sigma }\ varvec{L}_j \right] ^{-1}\left( \varvec{L}_j^T\widehat{\varvec{\beta }}\right)\) sigue un \(\chi ^2\) no central distribución con un grado de libertad y parámetro no central \(\lambda _j = \frac{c^2}{\varvec{L}_j^T\widehat{\Sigma }\varvec{L}_j}\) [14]; denotamos esta distribución como \(\chi _1^2(\lambda _j)\). Sea \(F_{\chi _1^2(\lambda _j)}\) la función de distribución acumulativa de \(\chi _1^2(\lambda _j)\). De ello se deduce que la potencia de la prueba bajo el nivel de significancia \(\alpha\) y la hipótesis alternativa \(H_{1,j}:\left| \varvec{L}^T_j\varvec{\beta }\right| = c\) es

Para garantizar suficiente poder para cada evaluador en una hipótesis alternativa preespecificada, primero podemos fijar el poder \(\phi\) de las pruebas y resolver la ecuación. (10) para obtener los niveles de significancia correspondientes \(\alpha _j(\phi )\) para rechazar la hipótesis nula \(H_{0,j}:\varvec{L}^T_j\varvec{\beta }=0\ ). Bajo el mismo poder e hipótesis alternativa, cada evaluador tiene un nivel de significancia específico del evaluador en lugar de uno unificado debido a las diferencias en las varianzas estimadas de las estimaciones de los coeficientes.

Las hipótesis nulas que estamos probando son \(H_{0,1}, H_{0,2},\ldots ,H_{0,M}\). Debido a las múltiples pruebas, el uso de un nivel de significancia tradicional como 0,05 en cada prueba puede conducir a una alta tasa de encontrar evaluadores "atípicos" incluso si son "normales" (es decir, hacer descubrimientos falsos) [15, 16]. En nuestro entorno, dado que los niveles de significancia específicos del evaluador se determinan asegurando un poder preespecificado de las pruebas, es más probable que hagamos descubrimientos falsos que las pruebas de hipótesis tradicionales de nivel \(\alpha\) cuando las pruebas preespecificadas El poder es grande. Para protegernos de clasificar falsamente a demasiados evaluadores "normales" como "valores atípicos", proponemos adoptar el concepto de tasa de descubrimiento falso (FDR) [15] para controlar la tasa de toma de decisiones falsamente positivas.

Proporcionamos una aproximación de FDR mediante:

donde \(\varvec{Q}\) se define como la proporción de hipótesis nulas verdaderas que se rechazan rápidamente entre el total de hipótesis nulas rechazadas y remitimos a los lectores a la Sección 2 de Material complementario para obtener detalles técnicos.

Tenga en cuenta que, en nuestro enfoque, en lugar de utilizar un nivel de significancia unificado para todas las pruebas, como \(\alpha =0,05\), cada hipótesis nula tiene su propio nivel de significancia específico del evaluador, de modo que se puede obtener un poder preespecificado para detectar una Se logra una hipótesis alternativa preespecificada para todas las pruebas de hipótesis. El FDR estimado, \(\widehat{\text {E}}(\varvec{Q}; \phi )\), por otro lado, puede informarnos del número de descubrimientos falsos que pueden realizarse. Por lo tanto, al elegir un conjunto apropiado de niveles de significancia, además de garantizar suficiente potencia para las pruebas, el FDR estimado puede usarse como otro criterio que refleja nuestra tolerancia a realizar descubrimientos falsos.

Como se describió en secciones anteriores, para una potencia dada, podríamos resolver la ecuación. (10) para obtener los niveles de significancia específicos del evaluador correspondientes para rechazar las hipótesis nulas \(H_{0,j}, j=1,\ldots , M\), y con base en estos niveles de significancia, se puede estimar el FDR correspondiente usando la ecuación. (11). Por lo tanto, la relación entre potencia y FDR se puede reflejar mediante una gráfica de decisión donde la potencia (\(\phi\)) está en el eje x, y la FDR estimada correspondiente (\(\widehat{\text {E}} (\varvec{Q},\phi )\)) está en el eje y. Con base en el gráfico de decisión, podemos determinar los niveles de significancia en los que se logra un equilibrio aceptable entre el poder y el FDR.

También podríamos seleccionar primero un FDR relativamente bajo y encontrar el poder correspondiente junto con los niveles de significancia específicos del evaluador del gráfico de decisión; Entonces podemos rechazar las hipótesis nulas con valores p de las pruebas menores que los umbrales. Alternativamente, si estamos menos preocupados por hacer descubrimientos falsos pero nos gustaría poder detectar tantos evaluadores potenciales 'atípicos' como sea posible, entonces podríamos primero especificar una potencia relativamente grande y rechazar las hipótesis nulas comparando los valores p. con los correspondientes niveles de significancia específicos del evaluador; el FDR estimado a partir del gráfico de decisión puede informarnos sobre la cantidad de descubrimientos falsos que podríamos haber hecho.

Podemos ajustar aún más el conjunto de hipótesis nulas rechazadas en función del FDR estimado, especialmente cuando \(\widehat{\text {E}}(\varvec{Q};\widetilde{\phi })\) es grande bajo el modelo elegido. potencia \(\widetilde{\phi }\).

Sea \(\mathcal {R}\) el conjunto de las hipótesis nulas rechazadas, y k el número de hipótesis en \(\mathcal {R}\). Denota las hipótesis rechazadas como \({H}_{0,(1)}, {H}_{0,(2)}, \ldots , {H}_{0,(k)}\), donde están ordenados por sus valores p en orden ascendente. Dado que \(\widehat{\text {E}}(\varvec{Q};\widetilde{\phi })\times k\) se aproxima al número esperado de hipótesis nulas verdaderas que se rechazan falsamente entre \({H}_ {0,(1)}, {H}_{0,(2)}, \ldots , {H}_{0,(k)}\), un enfoque ad hoc para ajustar aún más las hipótesis nulas rechazadas en función de el FDR estimado es mover la última \(\lceil \widehat{\text {E}}(\varvec{Q};\widetilde{\beta }^p)\times k\rceil\) hipótesis nulas \(H_{ 0,(k-\lceil \widehat{\text {E}}(\varvec{Q};\widetilde{\beta }^p)\times k\rceil +1)},\ldots , H_{0,( k)}\) fuera del conjunto \(\mathcal {R}\), donde \(\lceil x\rceil\) redondea x al entero más cercano. Finalmente solo rechazaríamos \(H_{0,(1)}, H_{0,(2)},\ldots , H_{0,(k-\lceil \widehat{\text {E}}(\varvec{ Q};\widetilde{\beta }^p)\times k\rceil )}\), y los 'valores atípicos' correspondientes son evaluadores \((1), (2),\ldots , \text { y } (k -\lceil \widehat{\text {E}}(\varvec{Q};\widetilde{\beta }^p)\times k\rceil )\). En la Sección 3 de Material complementario se proporciona una declaración algorítmica que resume el procedimiento completo de control de calidad.

Realizamos un estudio de simulación para evaluar el procedimiento de control de calidad propuesto para detectar evaluadores "atípicos". Como demostración, basamos nuestras simulaciones en las mediciones del umbral auditivo evaluadas audiométricamente a 8 kHz que se obtuvieron en CHEARS AAA en 2014, donde 3568 participantes tuvieron evaluaciones en ambos oídos que fueron medidas por 68 audiólogos autorizados diferentes. Tenga en cuenta que la AAA todavía estaba en la etapa de recopilación de datos en 2014, y detectar a los audiólogos "atípicos" ayudaría a los investigadores a realizar ajustes rápidos para obtener mediciones precisas para las pruebas realizadas posteriormente. Evaluamos el desempeño del estimador FDR propuesto en la ecuación. (11), así como los verdaderos positivos (detectar con éxito evaluadores verdaderos "atípicos") y falsos positivos (clasificar falsamente a los evaluadores "normales" como "atípicos") obtenidos por nuestro método de control de calidad en comparación con el uso de un nivel de significancia tradicional y unificado como \(\alpha =0.05\) para rechazar las hipótesis nulas.

Primero consideramos el escenario en el que los evaluadores miden un único resultado para cada participante del estudio. Generamos datos basados ​​en el siguiente modelo, imitando los datos del oído derecho obtenidos del CHEARS AAA:

donde la edad se genera a partir de una distribución normal con media 56,6 años y desviación estándar (DE) 4,4; Establecimos el estado de audición autoinformado "excelente" como grupo de referencia y las prevalencias de las otras dos categorías "muy bueno" y "un pequeño problema de audición" fueron 0,44 y 0,25, respectivamente. Estos valores son los mismos que los de CHEARS AAA. \(\text {Audio}_i^{(j)}, j=1,\ldots , M\), es 1 si el resultado de la prueba de audición del i-ésimo participante del estudio es medido por el j-ésimo audiólogo, y 0 en caso contrario.

Los coeficientes correspondientes a edad, edad\(^2\), I(muy bien) e I(un pequeño problema de audición) se establecen en \(\gamma _1=-2.7\), \(\gamma _2=0.03 \), \(\gamma _3=3.3\) y \(\gamma _4=10.3\), igual que las estimaciones puntuales del análisis de regresión de los datos de CHEARS. El número de audiólogos M se establece en 100 y cada uno mide los resultados auditivos de 40 participantes del estudio. Establecemos los coeficientes como \(\beta _1=\beta _2=\ldots =\beta _5=75\), \(\beta _6=\beta _7=\beta _8=70\) y \(\beta _9= \beta _{10}=\ldots =\beta _{100}=67\). Dado que el efecto audiólogo promedio es aproximadamente 67, los 92 audiólogos con efecto verdadero 67 se consideran audiólogos "normales", y los 3 audiólogos con efecto 70 y los 5 con efecto 75 se consideran valores atípicos verdaderos. Tenga en cuenta que, aquí, cinco audiólogos "atípicos" tienen efectos muy diferentes en los resultados de las pruebas de audición que los audiólogos "normales" y tres audiólogos "atípicos" son ligeramente diferentes de los audiólogos "normales". Los valores 75 y 67 están determinados por los promedios de los coeficientes de regresión estimados en el análisis de regresión de los datos CHEARS para los audiólogos en el percentil 10 superior y aquellos entre los percentiles 10 inferior y superior, respectivamente. Se supone que el residual \(\epsilon _i\) tiene una distribución normal con media 0 y desviación estándar (SD) \(\sigma = 8, 10, 12\), respectivamente.

La simulación se realiza para 300 réplicas. En la Fig. 1 se muestran los gráficos de decisión de FDR versus poder bajo diferentes desviaciones estándar (SD) de los residuos. Establecemos la hipótesis alternativa como \(H_{1,j}:\left| \varvec{L}^T_{10\%, j}\varvec{\beta }\right| =5\). La curva sólida es el FDR estimado con base en la ecuación. (11) promediado sobre las 300 réplicas de simulación bajo potencias (\(\phi\)) que van desde 0,1 a 0,95 con un tamaño de paso de 0,01; Se ajusta una curva loess con un intervalo de suavizado predeterminado de 0,75 para conectar los puntos. La curva discontinua es una versión empírica del FDR verdadero, que para cada \(\phi\), es la relación entre el número de audiólogos "normales" (Audiólogos 9 - 100) que se detectan falsamente como audiólogos "atípicos" y el total número de audiólogos "atípicos" detectados, promediado sobre las 300 réplicas de simulación. La línea horizontal de puntos y rayas es la versión empírica del verdadero FDR si usamos \(\alpha =0.05\) como nivel de significancia para rechazar las hipótesis nulas promediadas sobre las 300 réplicas de simulación.

Gráfico de decisión de FDR frente a potencia para simulación de medición única. La hipótesis alternativa es \(H_{1,j}: \left| \varvec{L}^T_{10\%, j}\varvec{\beta }\right| =5\). La curva sólida es el FDR estimado con base en la ecuación. (11) promedió más de 300 réplicas de simulación, y la curva discontinua es el FDR verdadero empírico calculado promediando las proporciones de descubrimientos falsos \(\frac{\varvec{V}(\phi )}{\varvec{R}(\phi )}\) más de 300 réplicas de simulación. La línea horizontal negra de puntos y rayas representa el FDR verdadero empírico calculado promediando las proporciones de descubrimientos falsos en más de 300 réplicas de simulación cuando se utiliza \(\alpha =0.05\) como nivel de significancia. Las curvas sólidas y discontinuas se superponen en el panel superior.

Como se muestra en el gráfico de decisión, el FDR estimado está muy cerca del FDR verdadero cuando \(\sigma =8 \text { and } 10\); mientras que sobreestima ligeramente el valor real cuando \(\sigma =12\). Además, a medida que aumenta la DE del residuo, también aumenta la FDR. Por ejemplo, cuando \(\sigma\) =8\), el FDR es menor que 0,165 bajo la potencia 0,95, mientras que si \(\sigma\) aumenta a 12, el FDR es mayor que 0,8 bajo la misma potencia. Defina la relación de ruido como \(\frac{\sigma ^2}{\text {Var}(Y)}\), que es la proporción de la varianza del residual entre la varianza total de la medición del resultado. Las relaciones de ruido correspondientes son aproximadamente 0,52, 0,64 y 0,72 para \(\sigma =8, 10 \text { y }12\). Cuando la proporción de ruido aumenta, es más probable que hagamos descubrimientos falsos. Por lo tanto, al realizar el control de calidad, es fundamental incluir todos los posibles predictores y factores de confusión en la regresión de la primera etapa; de esta manera, podemos minimizar el residual de la regresión de la primera etapa y, como resultado, minimizar el FDR.

En comparación con un enfoque que utiliza un nivel de significancia fijo \(\alpha =0.05\), nuestro método disfruta de más flexibilidad ya que podemos elegir los niveles de significancia específicos del evaluador considerando tanto el poder como el FDR. Cuando \(\sigma =8\), bajo cualquier potencia, nuestro enfoque tiene un FDR mucho más bajo que usar \(\alpha =0.05\) como umbral; y cuando \(\sigma =10 \text { y }12\), aunque el FDR aumenta, sigue siendo menor que el FDR si se usa \(\alpha =0.05\) como umbral, cuando se elige la potencia para ser inferior a 0,8 y 0,75, respectivamente.

Dado que el objetivo del método es detectar tantos evaluadores potenciales "atípicos" como sea posible y al mismo tiempo mantener la tasa de error tipo I por debajo de un nivel aceptable, definimos la proporción positiva verdadera para cada audiólogo verdadero "atípico" (es decir, audiólogos 1 a 8) como la proporción de réplicas de simulación que detectan correctamente al audiólogo como un "valor atípico" entre las 300 réplicas de simulación, y la proporción de falsos positivos para cada audiólogo "normal" verdadero (es decir, audiólogos de 9 a 100) como proporción de réplicas de simulación que identifican falsamente al audiólogo como un "valor atípico" en las 300 réplicas de simulación. Las figuras 2a y b muestran las proporciones positivas verdaderas para los audiólogos 1 a 8, y las proporciones positivas falsas para los audiólogos "normales" (a modo de ilustración, seleccionamos los audiólogos 9 a 16), donde \(\sigma =8\) al generar el datos, y la hipótesis alternativa se establece como \(H_{1,j}:\left| \varvec{L}_{10\%, j}^T\varvec{\beta }\right| =5\). Los puntos negros son las proporciones basadas en nuestro procedimiento de control de calidad bajo diferentes potencias de las pruebas; mientras que las líneas de puntos horizontales son las proporciones calculadas usando \(\alpha =0.05\) como umbral para rechazar las hipótesis nulas. Consideramos tanto el procedimiento no ajustado como el procedimiento ajustado basado en FDR.

Esta figura muestra las proporciones positivas verdaderas para los audiólogos "atípicos" verdaderos y las proporciones positivas falsas para los audiólogos "normales" verdaderos para una simulación de medición única con \(\sigma =8\). El panel superior de cada subfigura es el resultado de realizar el ajuste basado en FDR, mientras que el panel inferior de cada subfigura es el resultado sin ajuste basado en FDR. La línea horizontal de puntos y rayas representa la proporción correspondiente de verdaderos o falsos positivos para cada audiólogo si usamos \(\alpha =0.05\) como nivel de significancia para rechazar las hipótesis nulas.

Para el procedimiento no ajustado, a medida que aumenta la potencia, las verdaderas proporciones positivas para los audiólogos 1 a 5 llegan a 1 rápidamente, lo que se esperaba ya que la diferencia entre sus coeficientes y los de los audiólogos "normales" se establece en 8, mayor que el diferencia utilizada en la hipótesis alternativa \(H_{1,j}: \left| \varvec{L}_{10\%, j}^T\varvec{\beta }\right| =5\). Sin embargo, para los audiólogos 6 a 8, dado que sus coeficientes son sólo 3 mayores que los de los audiólogos "normales", las verdaderas proporciones positivas son mucho menores que 1 incluso cuando la potencia es grande. En comparación con el enfoque que utiliza \(\alpha =0.05\) como umbral, nuestro procedimiento de control de calidad tiene proporciones positivas verdaderas más pequeñas cuando la potencia de la prueba es menor que 0.3, 0.6, 0.7 para \(\sigma =8, 10, 12\), pero gradualmente aumentarán hasta alcanzar aproximadamente el mismo nivel o incluso un nivel superior. Para los audiólogos "normales" (Audiólogos 9 a 16), las proporciones de falsos positivos son aproximadamente 0,05 si se utiliza \(\alpha =0,05\) como umbral. Nuestro procedimiento de control de calidad tiene proporciones de falsos positivos aún menores cuando \(\sigma =8 \text { y } 10\) bajo casi todas las potencias consideradas. Cuando \(\sigma =12\), las proporciones de falsos positivos son aún más pequeñas que las que se obtienen al usar \(\alpha =0.05\) como umbral, si la potencia no es mayor que 0.9.

En comparación con el procedimiento no ajustado, las proporciones positivas verdaderas ajustadas basadas en FDR para los audiólogos "atípicos" verdaderos y las proporciones positivas falsas para los audiólogos "normales" no cambian mucho en el caso de \(\sigma =8\), ya que el FDR es pequeño y el ajuste es menor. A medida que \(\sigma\) aumenta, por ejemplo, cuando \(\sigma =10\), el FDR es lo suficientemente grande como para producir un número suficiente de ajustes para una potencia mayor que 0,75. Además de una disminución en las proporciones de falsos positivos para los verdaderos audiólogos "normales" (Audiólogos 9 a 16), también observamos una disminución en las proporciones de verdaderos positivos para los verdaderos audiólogos "atípicos" (Audiólogos 1 a 8). Por lo tanto, el ajuste ad hoc basado en FDR ayuda a reducir las posibilidades de hacer descubrimientos falsos, con el precio de una reducción en la probabilidad de tomar decisiones verdaderamente positivas.

Además, también realizamos un estudio de simulación para los escenarios en los que los resultados están correlacionados. El proceso de generación de datos y los resultados de la simulación se presentan en la Sección 1 de Material complementario. Los resultados de la simulación son similares con los escenarios de medición únicos; Nuestro procedimiento de detección de valores atípicos normalmente tiene proporciones de falsos positivos más bajas para los verdaderos audiólogos "normales" y proporciones de verdaderos positivos más altas para los verdaderos audiólogos "atípicos" en comparación con el enfoque que fija el nivel de significancia en \(\alpha =0,05\).

Para ilustrar nuestro método, lo aplicamos para detectar audiólogos "atípicos" para las mediciones del umbral de audición evaluadas audiométricamente en el CHEARS AAA recopiladas en 2014, cuando se completaron las pruebas de referencia en 3749 participantes. Nos centramos en los resultados de las pruebas a 8 kHz. Usamos el enfoque GEE en el análisis de regresión de la primera etapa e incluimos \(\text {edad}, \text {edad}^2\), el estado auditivo autoinformado ('excelente', 'muy bueno' y 'un poco problemas auditivos"), y variables ficticias para los 68 audiólogos en el modelo de regresión. Esta regresión se ajusta utilizando SAS proc genmod, suponiendo una estructura de varianza-covarianza de trabajo intercambiable.

Mostramos los diagramas de dispersión de \(\widehat{\beta }_i-\frac{1}{M}\sum _{q=1}^{M}\widehat{\beta }_{q}\) y \ (\widehat{\beta }_i-\frac{1}{M-2[M\cdot \delta ]}\sum _{q=[M\cdot \delta ]+1}^{M-[M\cdot \delta ]}\widehat{\beta }_{(q)}\), con \(M=68, \delta =0.1\), en la Fig. 3. Independientemente de si estamos comparando con la media no truncada o con la Media truncada del 10%, las gráficas son similares. Como se muestra en las figuras 3a y b, el audiólogo 13 tiene un coeficiente estimado mucho mayor (\(>10 \text { dB}\)) que sus contrapartes, y el audiólogo 4 tiene un coeficiente mucho más pequeño (\(<10 \text { dB }\)) estimación del coeficiente que el resto de audiólogos. Además, los audiólogos 14, 15, 22, 47, 48, 54, 55 y 59 tienen estimaciones de coeficientes ligeramente diferentes (5-10\(\text { dB}\)) del efecto promedio.

a Restar la estimación de los coeficientes de cada audiólogo por la media no truncada de las estimaciones de los coeficientes de todos los audiólogos; b Restando la estimación de los coeficientes de cada audiólogo por la media truncada del 10 % de las estimaciones de los coeficientes de todos los audiólogos

Las Figuras 4a a d muestran los gráficos de decisión de FDR versus poder, donde se realizan las pruebas de hipótesis para comparar el coeficiente de regresión de cada audiólogo tanto con la media no truncada como con la media truncada del 10%. Arreglamos la hipótesis alternativa como \(H_{1,j}:\left| \varvec{L}^T_{j}\varvec{\beta }\right| =5 \text { and } 10\), y \ (H_{1,j}: \left| \varvec{L}^T_{10\%, j}\varvec{\beta }\right| =5 \text { y } 10\), respectivamente, para \( j=1,\ldots , 68\). Con base en los gráficos de decisión, se pueden detectar audiólogos "atípicos" eligiendo un conjunto apropiado de niveles de significancia que correspondan a una potencia y FDR razonables. Los resultados son similares entre el enfoque de media no truncada y el de media truncada. La Tabla 1 resume los resultados al establecer la potencia en 0,8 o el FDR estimado en 0,5. Como se muestra en la tabla, los audiólogos 4 y 13 son detectados como "valores atípicos" por todos los enfoques independientemente de la potencia, FDR o la hipótesis alternativa considerada, y el audiólogo 48 es detectado por todos los enfoques bajo la hipótesis alternativa \(H_ {1,j}: \left| \varvec{L}_{10\%,j}^T\varvec{\beta }\right| =5\) y \(H_{1,j}: \left| \varvec{L}_{j}^T\varvec{\beta }\right| =5\). Por lo tanto, es probable que los audiólogos 4, 13 y 48 sean audiólogos "atípicos", lo que sugiere que puede merecer un escrutinio minucioso. Sin embargo, el enfoque de usar \(\alpha =0.05\) para rechazar las hipótesis nulas como se muestra en las dos últimas filas de las tablas, además de no ser flexible en comparación con nuestro método, también adolece del problema de que la El poder de las pruebas para diferentes audiólogos varía significativamente con un mínimo de 0,55 y un máximo de 1,00.

Gráfica de decisión de FDR versus poder para detectar audiólogos 'atípicos', donde a: \(H_{1,j}: \left| \varvec{L}^T_{10\%, j}\varvec{\beta }\right |=5\); b: \(H_{1,j}: \left| \varvec{L}^T_{10\%, j}\varvec{\beta }\right| =10\); c: \(H_{1,j}: \left| \varvec{L}^T_j\varvec{\beta }\right| =5\); y d: \(H_{1,j}: \left| \varvec{L}^T_j\varvec{\beta }\right| =10\). Las líneas de puntos y rayas y las líneas discontinuas se producen fijando la potencia en 0,8 o el FDR en 0,5, respectivamente.

En este artículo, proponemos un método novedoso para abordar un problema común en grandes estudios epidemiológicos que dependen de múltiples evaluadores para obtener mediciones de exposición o resultados para optimizar la calidad de los datos durante la etapa de recopilación de datos. Específicamente, desarrollamos un algoritmo de dos etapas para detectar evaluadores "atípicos", que pueden tender a tener mediciones más altas o más bajas que las de sus contrapartes. En la primera etapa, ajustamos un modelo de regresión para las mediciones contra las características de los evaluadores y de los participantes del estudio que podrían predecir las mediciones. En la segunda etapa, con base en los coeficientes de regresión de la primera etapa, realizamos pruebas de hipótesis para comparar la medición media de cada evaluador con las mediciones medias promedio de todos los evaluadores ajustando por las características de los individuos evaluados. A diferencia del procedimiento tradicional de prueba de hipótesis, donde el objetivo principal es controlar el error de tipo I, también damos la misma importancia a garantizar un nivel apropiado de error de tipo II, ya que nuestro objetivo es detectar tantos evaluadores potenciales "atípicos" como sea posible para la calidad. propósito de control. Derivamos los niveles de significancia específicos del evaluador para rechazar las hipótesis nulas bajo potencias seleccionadas de las pruebas. Estos niveles de significancia no son necesariamente 0,05 y son diferentes entre audiólogos debido a las diferencias en las varianzas de las estimaciones de los coeficientes. Para tener en cuenta el problema de las comparaciones múltiples, también derivamos un estimador FDR. Se puede crear un gráfico de decisión de FDR versus Power y, basándose en este gráfico, se pueden determinar los niveles de significancia específicos del evaluador para rechazar las hipótesis nulas de modo que tanto FDR como Power sean aceptables.

Al realizar pruebas de hipótesis para detectar evaluadores "atípicos", propusimos comparar las estimaciones de los coeficientes con la media truncada para evitar que esos evaluadores "atípicos" contaminen el efecto normal estimado. Alternativamente, podemos considerar un intervalo nulo, es decir \(H_0: |\beta _i - \frac{1}{M}\sum _{j=1}^{M} \beta _j| \le a\) para algunas constantes \(a>0\). Un desafío de este método podría ser cómo seleccionar un. Consideraremos este método en nuestra investigación futura y lo compararemos con el método actual. Además, al calcular el nivel de significancia específico del evaluador, se necesita el conocimiento de la hipótesis alternativa. Sin embargo, si no se dispone del conocimiento previo, recomendamos realizar un análisis de sensibilidad para una serie de valores razonables de la hipótesis alternativa. Además, la aproximación de FDR en la ecuación. (2) se cumple cuando el número de hipótesis (M) que se llevan a cabo es grande. Sin embargo, cuando M es pequeño, alternativamente, podemos utilizar el procedimiento de Benjamini-Hochberg (BH) para controlar el FDR [15]. El procedimiento BH procede especificando primero un nivel FDR \(\alpha\) y ordenando la hipótesis nula basada en valores p en orden ascendente (\(P_{(1)}, P_{(2)},\ldots, PM)}\)). Entonces se obtiene el k más grande tal que \(P_{(k)}\le \frac{k}{M}\alpha\), y las primeras k hipótesis nulas serán rechazadas. El procedimiento BH puede garantizar que el FDR esté controlado en el nivel \(\alpha\). Sin embargo, a diferencia de nuestro enfoque, el procedimiento BH no considera el poder de las pruebas y, para ser conservador, podríamos usar un nivel \(\alpha\) relativamente mayor, como 0,1, al realizar el procedimiento BH.

Hay varios puntos importantes a considerar en base a nuestro trabajo. Primero, un aumento en la relación de ruido \(\frac{\sigma ^2}{\text {Var}(Y)}\) aumentará el FDR, especialmente cuando la potencia de la prueba es grande. Por lo tanto, en la regresión de la primera etapa, es crucial incluir todos los predictores potenciales de las mediciones como regresores. En segundo lugar, el método propuesto supone que el efecto del evaluador en las mediciones no se ve modificado por las características de los participantes. En el caso de que se viole este supuesto, podemos estimar el efecto del evaluador en cada categoría del modificador del efecto potencial incluyendo las interacciones indicador-modificador del efecto del evaluador en el modelo de regresión de la primera etapa, y luego podemos considerar al mismo evaluador para el estudio de prueba. participantes en diferentes categorías del modificador del efecto como si fueran diferentes evaluadores. De esta manera, un evaluador podría ser detectado como un "valor atípico" sólo cuando evalúa a los participantes del estudio en una categoría específica del modificador del efecto. En tercer lugar, para dar cabida a situaciones en las que las mediciones no son continuas, se puede utilizar una función de enlace en la regresión de la primera etapa, como el enlace logit para mediciones binarias y el enlace log para mediciones de conteo.

Nuestro procedimiento de control de calidad se utiliza para detectar posibles evaluadores "atípicos" y, una vez detectados, se debe realizar un control de calidad de esos evaluadores para garantizar que las mediciones futuras se puedan medir con precisión. Sin embargo, la corrección de errores de medición en mediciones existentes obtenidas por evaluadores "atípicos" está fuera del alcance de este artículo. Desarrollaremos métodos de corrección de errores de medición en futuras investigaciones; Una idea podría ser calibrar las mediciones de los evaluadores "atípicos" con mediciones "normales" utilizando información de los modelos de regresión de la primera etapa, teniendo en cuenta las características de los participantes.

Es posible que la regresión regular y el enfoque GEE no conduzcan a un estimador \(\beta\) confiable si el número de participantes del estudio evaluados por algunos evaluadores es pequeño. En este caso, un método alternativo es tratar las mediciones del mismo evaluador como un grupo y utilizar el modelo de efectos mixtos en el análisis de regresión de primera etapa. En el escenario donde cada participante tiene una única medición, este modelo de efectos mixtos puede incluir una intersección aleatoria específica del evaluador además de las características de los participantes de efectos fijos; el valor estimado de la j-ésima intersección específica del evaluador es \(\hat{\beta }_j\). De manera similar, en el escenario donde los participantes tienen múltiples mediciones, el modelo de efectos mixtos puede incluir tanto a los evaluadores como a los participantes (anidados dentro del evaluador) como efectos aleatorios. Una vez que el modelo de efectos mixtos obtiene \(\widehat{\varvec{\beta }}\) y \(\widehat{Var}(\widehat{\varvec{\beta }})\), el resto de los métodos son los mismos que los establecidos en la Subsección 'Prueba de hipótesis' a la Subsección 'Ajuste basado en FDR' de este documento.

Además de la contribución al control de calidad durante la etapa de recopilación de datos de los estudios epidemiológicos, nuestro método de detección de valores atípicos también puede ser valioso en entornos clínicos para la detección de evaluadores "atípicos" (por ejemplo, proveedores o técnicos de salud); por ejemplo, los diagnósticos clínicos a menudo dependen de mediciones de evaluadores, y mediciones inexactas pueden conducir a diagnósticos erróneos. Además, nuestro método se puede utilizar en procedimientos de análisis estadístico. Por ejemplo, para estudios basados ​​en mediciones de laboratorio de biomarcadores como metabolitos en plasma u orina que se miden en diferentes lotes, nuestro método puede ayudar a identificar posibles lotes "atípicos" y se puede realizar un análisis de sensibilidad excluyendo esos lotes "atípicos". y reestimar los parámetros de intereses.

El código R para implementar el método propuesto está disponible en https://github.com/molinwang/Analytical-Methods-for-Hearing-Studies/branches.

Nuestro algoritmo de dos etapas es un método útil para detectar evaluadores "atípicos" que tienden a dar mediciones más altas o más bajas que sus contrapartes después de ajustar las características de los participantes del estudio. En comparación con las pruebas de hipótesis tradicionales que se centran en el error de tipo I, también le damos importancia al error de tipo II para que se puedan identificar tantos "valores atípicos" potenciales, y se utiliza un FDR estimado para controlar la tasa de falsos positivos. Recomendamos aplicar nuestro método para la detección de "valores atípicos" durante la etapa de recopilación de datos para mejorar la calidad de los datos.

Los datos que respaldan los hallazgos de este estudio están disponibles en Nurses' Health Study (NHS) II, pero se aplican restricciones a la disponibilidad de estos datos, que se utilizaron bajo licencia para el estudio actual y, por lo tanto, no están disponibles públicamente. Sin embargo, los datos están disponibles a través de los autores previa solicitud razonable y con el permiso del Nurses' Health Study (NHS) II.

Tasa de falso descubrimiento

Estudio de conservación de la audición

Brazo de evaluación de audiología

Estudio de salud de las enfermeras

Ecuaciones de estimación generalizadas

Cruickshanks KJ, Wiley TL, Tweed TS, Klein BE, Klein R, Mares-Perlman JA, et al. Prevalencia de la pérdida auditiva en adultos mayores en Beaver Dam, Wisconsin: estudio de epidemiología de la pérdida auditiva. Soy J Epidemiol. 1998;148(9):879–86.

Artículo CAS PubMed Google Scholar

Shargorodsky J, Curhan SG, Curhan GC, Eavey R. Cambio en la prevalencia de la pérdida auditiva en adolescentes estadounidenses. JAMA. 2010;304(7):772–8.

Artículo CAS PubMed Google Scholar

Gopinath B, McMahon CM, Rochtchina E, Karpa MJ, Mitchell P. Incidencia, persistencia y progresión de los síntomas del tinnitus en adultos mayores: el estudio de audición de las Montañas Azules. Oído Escuchar. 2010;31(3):407–12.

Artículo PubMed Google Scholar

Zhang X, Bullard KM, Cotch MF, Wilson MR, Rovner BW, McGwin G, et al. Asociación entre la depresión y la pérdida funcional de la visión en personas de 20 años o más en los Estados Unidos, NHANES 2005–2008. JAMA Oftalmol. 2013;131(5):573–81.

Artículo PubMed PubMed Central Google Scholar

Klein R, Lee KE, Gangnon RE, Klein BE. Relación entre fumar, beber y la actividad física con los cambios en la visión durante un período de 20 años: el estudio ocular de Beaver Dam. Oftalmología. 2014;121(6):1220–8.

Artículo PubMed Google Scholar

McCullough ML, Zoltick ES, Weinstein SJ, Fedirko V, Wang M, Cook NR, et al. Vitamina D circulante y riesgo de cáncer colorrectal: un proyecto conjunto internacional de 17 cohortes. JNCI: J Natl Cancer Inst. 2019;111(2):158–69.

Carroll RJ, Ruppert D, Stefanski LA, Crainiceanu CM. Error de medición en modelos no lineales: una perspectiva moderna. Chapman y Hall/CRC; 2006.

Curhan SG, Wang M, Eavey RD, Stampfer MJ, Curhan GC. La adherencia a patrones dietéticos saludables se asocia con un menor riesgo de pérdida auditiva en las mujeres. J Nutr. 2018;148(6):944–51.

Artículo PubMed PubMed Central Google Scholar

Curhan SG, Halpin C, Wang M, Eavey RD, Curhan GC. Estudio prospectivo de patrones dietéticos y elevación del umbral auditivo. Soy J Epidemiol. 2020;189(3):204–14.

Artículo PubMed Google Scholar

Liang KY, Zeger SL. Análisis de datos longitudinales mediante modelos lineales generalizados. Biometrika. 1986;73(1):13–22.

Artículo de Google Scholar

Zeger SL, Liang KY. Análisis de datos longitudinales para resultados discretos y continuos. Biometría. 1986;42:121–30.

Harrell Jr FE. Estrategias de modelado de regresión: con aplicaciones a modelos lineales, regresión logística y ordinal y análisis de supervivencia. Saltador; 2015.

Wilcox RR. Introducción a la estimación robusta y prueba de hipótesis. Prensa académica; 2011.

Lehmann EL, Romano JP. Prueba de hipótesis estadísticas. Medios de ciencia y negocios de Springer; 2006.

Benjamini Y, Hochberg Y. Controlar la tasa de descubrimientos falsos: un enfoque práctico y poderoso para pruebas múltiples. Método JR Stat Soc Ser B. 1995;57(1):289–300.

Google Académico

Benjamini Y, Drai D, Elmer G, Kafkafi N, Golani I. Control de la tasa de descubrimientos falsos en la investigación de genética del comportamiento. Comportamiento Res. Cerebral. 2001;125(1–2):279–84.

Artículo CAS PubMed Google Scholar

Descargar referencias

Estamos agradecidos a los participantes del estudio en CHEARS.

Este trabajo cuenta con el apoyo de la subvención R01DC017717 de los NIH.

Departamento de Bioestadística, Universidad de Harvard, Boston, EE.UU.

Yujie Wu, Bernard Rosner y Molin Wang

División Channing de Medicina en Red, Brigham and Women's Hospital, Boston, EE. UU.

Sharon Curhan, Bernard Rosner, Gary Curhan y Molin Wang

Escuela de Medicina de Harvard, Boston, EE.UU.

Sharon Curhan y Gary Curhan

Departamento de Epidemiología, Universidad de Harvard, Boston, EE.UU.

Gary Curhan y Molin Wang

División Renal, Departamento de Medicina, Brigham and Women's Hospital, Boston, EE. UU.

Gary Curhan

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

YW, BR y MW desarrollaron los métodos; YW diseñó y realizó el estudio de simulación y escribió el primer borrador del manuscrito. SC, BR, GC y MW revisaron críticamente el manuscrito. Todos los autores leyeron y aprobaron el manuscrito final.

Correspondencia a Molin Wang.

No aplica.

No aplica.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Archivo adicional 1.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado al autor(es) original(es) y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/. La exención de dedicación de dominio público de Creative Commons (http://creativecommons.org/publicdomain/zero/1.0/) se aplica a los datos disponibles en este artículo, a menos que se indique lo contrario en una línea de crédito a los datos.

Reimpresiones y permisos

Wu, Y., Curhan, S., Rosner, B. et al. Método analítico para detectar evaluadores atípicos. Método BMC Med Res 23, 177 (2023). https://doi.org/10.1186/s12874-023-01988-4

Descargar cita

Recibido: 30 de noviembre de 2021

Aceptado: 11 de julio de 2023

Publicado: 01 de agosto de 2023

DOI: https://doi.org/10.1186/s12874-023-01988-4

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt