Título completo:

Marcadores moleculares para la detección de cáncer de próstata significativo.

Autores: del Pino Sedeño T, Trujillo Martín MM, García Pérez L, Delgado Rodríguez J, Infante Ventura D, Hernández Yumar A, Abt Sacks A, Rodríguez Rodríguez L, de Armas Castellano A, Estaña D, González Hernández Y, León Salas B, Ayala Díaz N, Cipriano O, de Pascual Medina AM, Rueda Domínguez A, Fernández Gómez JM, Pablos Rodríguez P, Clavo Varas B, Expósito Afonso IJ, Nazco Deroy A, Serrano Aguilar P

Persona de contacto: Tasmania del Pino Sedeño (tasmania.delpino@sescs.es)

Resumen


Introducción

Se calcula que se diagnostican al año aproximadamente 1,1 millones de casos de CaP en el mundo, lo que lo convierte en el segundo tipo de cáncer más frecuente entre los hombres. El comportamiento del CaP es variable según la agresividad del mismo, pero, en general, se trata de un cáncer de evolución lenta pudiendo no acortar la vida del individuo, a pesar de no ser diagnosticado o tratado. La gran mayoría de casos se diagnostican en fase localizada y menos del 10% de los CaP debutan en fase metastásica. En este contexto, la estratificación de los pacientes mediante grupos de riesgo es un aspecto crucial para la toma de decisiones. Con el objetivo de identificar a los pacientes con riesgo de padecer un cáncer de próstata clínicamente significativo (CaPcs), evitar biopsias innecesarias, así como el sobrediagnóstico y sobretratamiento asociado a éstas, se han desarrollado y comercializado una variedad de pruebas de detección de biomarcadores moleculares.

Objetivo

El objetivo principal del presente informe de Evaluación de Tecnología Sanitaria es evaluar la efectividad, el coste-efectividad y los aspectos éticos, legales, organizativos, sociales y de pacientes, y ambientales de la incorporación de los test diagnósticos, basados en biomarcadores en muestras de sangre u orina en la identificación de los pacientes con mayor riesgo de sufrir CaPcs, posibilitando reducir procedimientos innecesarios (sobrediagnóstico y sobretratamiento).

Metodología

Efectividad

Se realizó una revisión sistemática (RS) de la literatura publicada hasta marzo de 2021 en las siguientes bases de datos: Medline y EMBASE. Se aplicó una estrategia de búsqueda exhaustiva que incluyó vocabulario controlado y términos en texto libre. La búsqueda se completó con el examen manual del listado bibliográfico de los artículos incluidos. Se seleccionaron estudios originales publicados en inglés o español que evaluaran la efectividad de los test diagnósticos basados en biomarcadores en muestras de sangre u orina para la identificación de los pacientes con mayor riesgo de sufrir CaPcs. Se seleccionaron ensayos clínicos aleatorizados (ECA). En su defecto, se planteó considerar estudios de cohortes y de casos y controles que realizaron una evaluación de la validez diagnóstica de los marcadores en hombres con sospecha de CaP y factores clínicos que sugerían un mayor riesgo de CaPcs.

Las medidas de resultado consideradas, fueron: sensibilidad, especificidad, valor predictivo positivo, valor predictivo negativo y área bajo la curva ROC (AUC).

El riesgo de sesgo de los estudios incluidos fue evaluado de acuerdo a la escala QUADAS-2.

Se realizó síntesis cuantitativa de los resultados mediante meta-análisis usando el programa estadístico STATA en su versión 14.

La evaluación de la calidad de la evidencia y la graduación de la fuerza de las recomendaciones se realizó siguiendo la metodología del grupo internacional de trabajo Grading of Recommendations Assessment, Development and Evaluation (GRADE).

Coste-efectividad

Se realizó una RS de estudios de coste-efectividad a partir de la búsqueda descrita anteriormente. Los criterios de selección incluían evaluaciones económicas desarrolladas en paralelo a estudios primarios y modelos económicos. Las medidas de resultado podían ser años de vida ajustados por calidad (AVAC) o cualquiera de las otras medidas seleccionadas en la revisión de efectividad. La selección, lectura crítica, y extracción de datos fue realizada por economistas. La calidad metodológica fue valorada con las Fichas de Lectura Crítica de OSTEBA. Se realizó una síntesis narrativa de los resultados.

Se desarrolló una evaluación económica de novo para España en la que se comparó la realización de una prueba de biomarcador, antes de biopsia, frente a solo biopsia, con el objetivo de detectar el CaP en hombres con sospecha en España. En la estrategia a evaluar, únicamente los hombres con biomarcador positivo o superior al punto de corte se realizarían la biopsia. Se diseñó un árbol de decisión, para modelizar el corto plazo (un año), y un modelo de Markov, con ciclos anuales, para el largo plazo (toda la vida del paciente), en los que se aplicó tanto la perspectiva del Sistema Nacional de Salud (SNS), incluyendo costes directos sanitarios, como la social, añadiendo, además, las pérdidas de productividad. Ambas perspectivas se presentaron por separado. Los resultados en salud se midieron en términos de años de vida ganados (AVG) y AVAC y, adicionalmente en el corto plazo, biopsias evitadas. También se estima la ratio coste-efectividad incremental (RCEI). Los costes se expresaron en euros de 2021. Se llevó a cabo un análisis de sensibilidad determinístico y un análisis de sensibilidad probabilístico para cuantificar la incertidumbre en torno a la decisión a tomar.

De forma complementaria, se realizó un análisis de impacto presupuestario para estimar el coste que supondría para el SNS la incorporación de las pruebas de biomarcadores, antes de la biopsia, en la población susceptible de recibir esta tecnología. Este análisis se ejecutó para un horizonte temporal de un año. Asimismo, se evaluaron varios escenarios, dibujados a partir de distintos costes unitarios del biomarcador y tamaños poblacionales, a través de un análisis de sensibilidad sobre el impacto presupuestario.

Aspectos éticos, legales, organizativos, sociales y de pacientes, y ambientales

El alcance de la evaluación de estos aspectos partió de la misma población, intervención y comparación descrita anteriormente para la evaluación de la efectividad y coste efectividad. Se realizaron búsquedas en las bases de datos electrónicas MEDLINE, EMBASE y WOS (fecha búsqueda: marzo de 2021). Se realizó una síntesis narrativa de los resultados teniendo en cuenta criterios de relevancia y coherencia de los resultados.

Resultados

Efectividad y seguridad

No se localizaron ECA que pudieran ser finalmente incluidos de acuerdo con los criterios de selección pre-establecidos. Por lo tanto, se consideraron estudios de rendimiento diagnóstico con un diseño observacional. Sesenta y cinco estudios fueron incluidos, con un total de 34.287 participantes, realizados en Alemania, Austria, China, Corea del Sur, Estados Unidos, España, Francia, Países Bajos, Irlanda, Italia, Japón, Lituania, Noruega, Reino Unido, Rusia, Singapur y Taiwán. Siete de los estudios se realizaron en múltiples países de manera simultánea. La calidad global de la evidencia fue considerada muy baja.

El tamaño de la muestra de los estudios varió entre 50 y 1.544 participantes. La edad media de los hombres incluidos en los estudios se situó en torno a los 64,45 años (DE: ±2,19).

Los test diagnósticos analizados en los estudios seleccionados fueron: PHI (37 estudios), densidad del PHI (5 estudios), Progensa® PCA3 (12 estudios), SelectMDx (5 estudios), Mi-Prostate Score (5 estudios), 4Kscore® test (4 estudios), TMPRSS2:ERG (2 estudios), Stockholm3 (2 estudios), ExoDx Prostate IntelliScore (1 estudio) y Proclarix® test (1 estudio). Todos los estudios incluyeron la biopsia como comparador.

Ninguno de los estudios considerados evaluó la incorporación de los test en sangre NADiA ProsVue y Prostate Core Mitomic Test, así como de los test basados en orina Post-DRE Urine Test y ProstarixTM.

Con respecto a los test en orina, Progensa® PCA3, para el punto de corte de 15, arrojó una sensibilidad que se encontró entre 93% y 99% y una especificidad del 37%. El punto de corte de 20, mostró una sensibilidad entre 89% y 99% y una especificidad del 51%. Por último, en el punto de corte de 35, la sensibilidad osciló entre 62% y 71%, mientras que la especificidad aumentó hasta 59-66%.

Para el test SelectMDx se obtuvo una sensibilidad y especificidad promedio de 84% (intervalo de confianza (IC) 95%: 71% a 92%; I²= 79,7%; k= 5; n= 1.957) y 49% (IC95%: 26% a 72%; I²= 93,9%; k= 5; n=1.957), respectivamente.

En cuanto a Mi-Prostate Score, este test mostró una sensibilidad entre 96,6% y 97,4% y una especificidad entre 28,6% y 34,6%.

No se identificaron datos relacionados con la sensibilidad y la especificidad del TMPRSS2:ERG (área bajo la curva, AUC: 0,64-0,75).

Con respecto a los test en sangre, para PHI, con un punto de corte entre 15 y 20, la sensibilidad y especificidad promedio fueron 99% (IC95%: 97% a 100%; I²= 76,26%; k= 4; n= 2.994) y 14% (IC95%: 9% a 19%; I²= 87,03%; k= 4; n= 2.994), respectivamente. Cuando el punto de corte subió al tramo 20-25, se obtuvo una sensibilidad y especificidad promedio de 96% (IC95%: 94% a 98%; I²= 73,26%; k= 7; n= 6.698) y 24% (IC95%: 18% a 30%; I²= 95,57%; k= 7; n= 6.698), respectivamente. Con un punto de corte de 25-30, el PHI mostró una sensibilidad para la detección del riesgo de sufrir CaPcs del 95% (IC95%: 89% a 98%; I²= 85,72%; k= 10; n= 6.321) y una especificidad del 33% (IC95%: 23% a 45%; I²= 98,27%; k= 10; n= 6.321). Para el punto de corte entre 30 y 35, la sensibilidad y especificidad promedio fueron 87% (IC95%: 81% a 91%; I²= 88,94%; k= 10; n= 5.964) y 49% (IC95%: 41% a 58%; I²= 95,53; k= 10; n= 5.964), respectivamente. Para el punto de corte entre 35 y 40, la sensibilidad y especificidad promedio fueron 79% (IC95%: 66% a 88%; I²= 83,13%; k= 5; n= 1.164) y 56% (IC95%: 48% a 64%; I²= 81,78; k= 5; n= 1.164). Finalmente, con un punto de corte de 55, la sensibilidad fue del 42% (IC95%: 32% a 53%; I²= 73,61%; k= 3; n= 2.028), mientras que la especificidad fue del 87% (IC95%: 72% a 95%; I²= 98,28%; k= 3; n= 2.028).

PHI muestra una sensibilidad y especificidad superior en pacientes de origen asiático, que en aquellos pacientes de origen europeo, para los tramos de 15-20 (S= 100%; IC95%: 99% a 100%; E= 13%; IC95%: 4% a 22% vs. S= 98%; IC95%: 96% a 100%; E= 13%; IC95%: 8% a 19%) y de 20-25 (S= 99%; IC95%: 97% a 100%; E= 30%; IC95%: 20% a 39% vs. S= 95%; IC95%: 93% a 97%; E= 21%; IC95%: 16% a 26%). Seguidamente, en los tramos de 30-35, la sensibilidad fue superior en pacientes de origen asiático (S= 91%; IC95%: 84% a 97%) y afroamericano (S= 91%; IC95%: 78% a 100%) que en aquellos pacientes de origen europeo (S= 85%; IC95%: 79% a 91%), y la especificidad fue superior en pacientes de origen asiático (E= 58%; IC95%: 46% a 70%) seguidos por aquellos pacientes de origen europeo (E= 49%; IC95%: 41% a 57%) y los pacientes de origen afroamericano (E= 26%; IC95%: 11% a 41%). En el tramo de 35-40, no se observaron diferencias entre los pacientes de origen asiático y aquellos pacientes de origen europeo.

No se pudo realizar ningún análisis de subgrupos por el tipo de definición de riesgo de CaP.

En relación al 4Kscore® test y, asumiendo un riesgo de sufrir CaPcs igual o superior a 7,5%, la sensibilidad fue de 95,5% y la especificidad del 32,1%; mientras que cuando se asumió un riesgo del 12%, la sensibilidad disminuyó hasta el 90,1% y la especificidad aumentó hasta el 53,5%.

Los estudios identificados sobre el Stockholm3 test no informaron datos de sensibilidad y especificidad del Stockholm3 test. El AUC osciló entre 0,77 y 0,86.

Proclarix® presentó una sensibilidad y especificidad del 91% y 22%, respectivamente.

Coste-efectividad

En la RS se incluyeron siete evaluaciones económicas, cinco de ellas con un horizonte de largo plazo y dos con un horizonte de corto plazo. Los biomarcadores evaluados fueron PHI, EPI, SelectMDx y 4Kscore. Una de las evaluaciones económica fue realizada para España (financiada por la industria) y consistió en un análisis coste-utilidad que comparaba SelectMDx antes de biopsia con biopsia para todos los sujetos desde la perspectiva del sistema sanitario. En general todos los estudios son de calidad metodológica media y concluyen que los biomarcadores son coste-efectivos e incluso dominantes, esto es, más efectivos y menos costosos que la estrategia habitual (biopsia).

Los resultados del caso base del modelo desarrollado para este informe, para el corto plazo y desde la perspectiva del SNS, sitúan en 1.112,77 € y 0,87 AVAC la alternativa que incluye el biomarcador, concretamente el SelectMDx, y en 862,20 € y 0,84 AVAC la estrategia habitual. Estos valores dan lugar a una RCEI de 6.640,21 €/AVAC, que se encuentra muy por debajo del umbral de coste-efectividad recomendado en nuestro país (20.000 – 25.000 €/AVAC). Además, este análisis permite concluir que la alternativa del biomarcador genera una reducción en el número de biopsias realizadas, con una media de 414 biopsias evitadas por 1.000 pacientes. Para el largo plazo, el biomarcador se convierte en una tecnología dominante frente a la estrategia habitual. El análisis de sensibilidad probabilístico refuerza estos resultados tanto en el corto como en el largo plazo. Al analizar la curva de aceptabilidad de la intervención a evaluar, se observa que, para una disponibilidad a pagar de 25.000 €/AVAC, el biomarcador sería coste-efectivo con una probabilidad del 81% desde la perspectiva del SNS. Respecto a la perspectiva social, el biomarcador es coste-efectivo para ambos horizontes temporales.

Las estimaciones obtenidas en el análisis de impacto presupuestario muestran que la incorporación de los biomarcadores en la detección precoz del CaPcs en el SNS supondría un aumento anual de, aproximadamente, 15 millones de euros, para una población de 60.000 hombres y un precio unitario del biomarcador de 375 €. Si el precio disminuyera hasta los 100 €, se produciría un ahorro de más de 1 millón de euros, con el mismo tamaño poblacional, y de más de 2 millones en el caso de una población de 100.000 hombres.

Aspectos éticos, legales, organizativos, sociales y de pacientes, y ambientales

Para la evaluación de estos aspectos se consideraron 20 artículos. Ninguno de ellos aborda aspectos ambientales relativos a la tecnología. Para el resto de aspectos, los hallazgos encontrados se pudieron agrupar en los siguientes temas: 1) desafíos éticos de los biomarcadores moleculares, 2) comunicación con los pacientes y herramientas de ayuda a la toma de decisiones, 3) sobrediagnóstico, falsos negativos y nuevos problemas derivados de los biomarcadores, 4) problemas para la implementación clínica de los biomarcadores moleculares.

Conclusiones

  • A partir de la RS sobre efectividad y coste-efectividad, la evaluación económica y el análisis de los aspetos éticos, legales, organizativos, sociales, relacionados con los pacientes y ambientales, realizados para el presente informe de ETS, se pueden establecer las siguientes conclusiones sobre la incorporación de los test diagnósticos basados en biomarcadores en muestras de sangre u orina para la identificación de los pacientes con mayor riesgo de sufrir CaPcs:
    • La mejor evidencia disponible para la efectividad, que proviene de 65 estudios con un total de 34.287 pacientes incluidos que evalúan la exactitud diagnóstica de un amplio número de diferentes test, permite establecer las siguientes conclusiones:

    Progensa® PCA3

    • Con un punto de corte de 15, la sensibilidad del test se encuentra entre 93%-99% y la especificidad se sitúa en 37%.
    • Con un punto de corte de 20, la sensibilidad del test se encuentra entre 89%-99% y la especificidad se sitúa en 51%.
    • Con un punto de corte de 35, la sensibilidad del test se encuentra entre 62%-71% y la especificidad entre 59%-66%.

    SelectMDx

    • La sensibilidad y especificidad del test para la identificación de los pacientes con mayor riesgo de sufrir CaPcs se encuentran entre 54,5%-100% y 35,3%-78,6%, respectivamente (calidad de la evidencia: muy baja ⊕⊖⊖⊖).

    Mi-Prostate Score

    • La evidencia disponible sobre Mi-Prostate Score es escasa (1 estudio). Con un punto de corte inferior o igual a 10, Mi-Prostate Score muesta una sensibilidad entre 96,6%-97,4% y una especificidad entre 28,6%-34,6%. Cuando el punto de corte superó 10, la sensibilidad oscila entre 95,5%-96,7%, mientras que la especificidad se mantiene entre 29%-33,3%.

    PHI

    • Con un punto de corte entre 15 y 20, la sensibilidad del test diagnóstico PHI es 99% y la especificidad 14%.
    • Con un punto de corte entre 20 y 25, la sensibilidad del test diagnóstico PHI es 96% y la especificidad 24% (calidad de la evidencia: baja ⊕⊕⊖⊖).
    • Con un punto de corte entre 25 y 30, la sensibilidad del test diagnóstico PHI es 95% y la especificidad 33%.
    • Con un punto de corte entre 30 y 35, la sensibilidad del test diagnóstico PHI es 87% y la especificidad 49%.
    • Con un punto de corte entre 35 y 40, la sensibilidad del test diagnóstico PHI es 79% y la especificidad 56%.
    • Con un punto de corte de 55, la sensibilidad del test diagnóstico PHI es 42% y la especificidad 87%.
    • La sensibilidad y especificidad de la densidad de PHI para la identificación de los pacientes con mayor riesgo de sufrir CaPcs se encuentran entre 71,6%-97,9% y 29,1%-66,5%, respectivamente. Para la identificación de pacientes con CaPcs definido como una puntuación Gleason ≥7, el rango para la sensibilidad es 90%-97% y la especificidad se sitúa entre 32%-39%.

    4Kscore® Test

    • Según la limitada evidencia disponible sobre 4Kscore® Test (1 estudio), la sensibilidad y la especificidad varía entre 90,1%-95,5% y 32,1%-53,5%, respectivamente.

    Stockholm3 test

    • No se identifican datos relacionados con la sensibilidad y la especificidad del Stockholm3 test. El AUC del Stockholm3 test varía de 0,77 a 0,86.

    Proclarix®

    • De acuerdo a la escasa evidencia disponible sobre Proclarix® (1 estudio), la sensibilidad y la especificidad del test son 91% y 22%, respectivamente.

    Otros test

    • La evidencia disponible sobre Proclarix®, TMPRSS2:ERG y ExoDx Prostate IntelliScore es aun muy escasa.

    Análisis de subgrupos

    • El análisis de subgrupos por origen étnico permite establecer que:

    Con un punto de corte entre 15 y 20, la sensibilidad del test diagóstico PHI es ligeramente superior en pacientes de origen asiático (100%) que en aquellos pacientes de origen europeo (98%).

    Con un punto de corte entre 20 y 25, tanto la sensibilidad como la especificidad es superior en pacientes de origen asiático (S= 99%; E= 30%) que en aquellos pacientes de origen europeo (S= 95%; E= 21%).

    Con un punto de corte entre 25 y 30, la sensibilidad del test diagnóstico PHI es superior en pacientes de origen asiático (S= 98%) que en aquellos pacientes de origen afroamericano (S= 94%) y europeo (S= 93%). La especificidad del PHI es superior en pacientes de origen asiático (E= 41%), seguidos por aquellos pacientes de origen europeo (E= 30%) y afroamericano (E= 15%).

    Con un punto de corte entre 30 y 35, la sensibilidad del test diagnóstico PHI es superior en pacientes de origen asiático (S= 91%) y afroamericano (S= 91%) que en pacientes de origen europeo (S= 85%). La especificidad es superior en pacientes de origen asiático (E= 58%) seguidos por pacientes de origen europeo (E= 49%) y afroamericano (E= 26%).

    Con un punto de corte entre 35 y 40, no se observan diferencias entre los pacientes de origen asiático y europeo.

    • No se identificaron estudios que cumplieran los criterios de selección preestablecidos sobre los test en sangre NADiA ProsVue y Prostate Core Mitomic Test, ni sobre los test basados en orina Post-DRE Urine Test y ProstarixTM.
    • Los estudios de coste-efectividad publicados concluyen que los biomarcadores, SelectMDx principalmente, son coste-efectivos en sus respectivos países en la mayoría de las circunstancias. Una evaluación económica del biomarcador SelectMDx antes de biopsia realizada en España y financiada por la industria concluye que es una estrategia dominante, es decir, más efectiva y menos costosa, en comparación con biopsia para todos los sujetos.
    • La evaluación económica independiente realizada para este informe concluye que la estrategia de detección del CaP que incluye realizar la prueba de biomarcador antes de la biopsia prostática, y realizar biopsia solo cuando el biomarcador indica probabilidad de cáncer clínicamente significativo, puede ser una estrategia coste-efectiva, dependiendo de su coste por determinación y de su sensibilidad/especificidad (o punto de corte elegido para la interpretación de resultados). Los análisis realizados indican que el biomarcador SelectMDx es coste-efectivo desde la perspectiva del SNS y desde la perspectiva social para un coste por determinación de 375 € (coste facilitado por la empresa). Para los otros biomarcadores solo se han podido realizar estimaciones tentativas ante la falta de información sobre sus costes unitarios en nuestro país.
    • La adopción de la estrategia consistente en realizar la prueba de biomarcador antes de biopsia en el conjunto del SNS supondría un impacto presupuestario neto que puede ser positivo o negativo (ahorro) en función del coste unitario por determinación. Para una población de 60.000 hombres y un precio unitario del biomarcador de 375 € el impacto neto sería de aproximadamente 15 millones de euros. Para un coste por determinación de 100 € el ahorro podría ser de entre 1 y 2 millones.
    • Es necesario llevar a cabo estudios sobre la comprensión de los biomarcadores por parte de los pacientes, sus expectativas, actitudes y valores, así como sus preocupaciones, para ayudar en la atención futura del paciente y la formulación de políticas.
    • La comunicación con los pacientes es muy importante y exige una proximidad en la relación médico/a-paciente. La decisión de ofrecer exámenes de detección del CaPcs debe ser individualizada y se debe apoyar en fuentes de información de solvencia contrastada.
    • En cuanto a la equidad, los hombres de edad avanzada no deben ser excluidos automáticamente del estudio con biomarcadores moleculares para CaP simplemente por su edad.
    • Un factor favorecedor de la implementación de los biomarcadores en la practica clínica puede ser la insatisfacción de los/as profesionales con el uso de PSA, por lo que una mejor prueba de diagnóstico con pautas claras es un poderoso incentivo para el cambio.

Recomendaciones

Debido a la incertidumbre asociada a las estimaciones relacionadas con la efectividad en el momento de la elaboración de este informe, con la evidencia disponible sobre coste-efectividad y la consideración de los aspectos éticos, legales, organizativos, sociales y de pacientes, y ambientales, no es posible hacer una recomendación a favor de la inclusión en la cartera de servicios comunes del SNS del test en orina SelectMDx para la identificación del CaPcs con el objetivo de orientar la toma de decisión sobre la realización de una primera biopsia de próstata. Unicamente se debe considerar su uso en el contexto estricto de investigación (Recomendación: CONDICIONAL).

Debido a la incertidumbre asociada a las estimaciones relacionadas con la efectividad en el momento de la elaboración de este informe, con la evidencia disponible sobre coste-efectividad y la consideración de los aspectos éticos, legales, organizativos, sociales y de pacientes, y ambientales, no es posible hacer una recomendación a favor de la inclusión en la cartera de servicios comunes del SNS del test en sangre PHI para la identificación del CaPcs con el objetivo de orientar la toma de decisión sobre la realización de una primera biopsia de próstata. Unicamente se debe considerar su uso en el contexto estricto de investigación (Recomendación: CONDICIONAL).

La escasa evidencia disponible no permite emitir recomendaciones sobre los test en orina Progensa® PCA3, Mi-Prostate Score, TMPRSS2:ERG y ExoDx Prostate IntelliScore urine exosome assay y los test en sangre 4Kscore® test, Stockholm3 test y Proclarix® test.