Comparaison des méthodes de calcul de la taille d’échantillon

comme alternative à East et nQuery

25 février 2026

Introduction

Cadre et contexte

  • Stage de césure M1 → M2
  • 05 Janvier → 13 Mars
  • source sur -Oncostat

Motivations

Pourquoi utiliser pour le calcul de la taille d’échantillon ?

  • Calcul dans (pas d’outil externe)
  • Partage et reproductibilité via le code
  • Pas de problèmes d’export / interopérabilité
  • Logiciel libre et open-source (audit, collaboration, )

→ Nécessité de valider les packages pour atteindre la crédibilité de logiciels comme East ou nQuery.

Présentation des logiciels et packages

  • Logiciels :
    • East 6
    • Nquery 9.2
  • Packages
    • Rpact 4.2.0
    • gsDesign2 1.1.7
    • Rashnu 0.1.2, bbssr 1.0.2, OneArm2stage 1.1.2, SampleSizeSingleArmSurvival

Méthodologie

Présentation des résultats

N-Ratio = NMéthode / NRéférence

N-Ratio exemple table
Par rapport aux valeurs de East
Pertinence Min Q1 Moyenne Médiane Q3 Max
high
nquery 1.00 1.00 1.00 1.00 1.00 1.00
rpact 1.00 1.00 1.00 1.00 1.00 1.00
medium
nquery 0.75 0.78 0.79 0.80 0.82 0.83
rpact 0.95 0.99 1.02 1.03 1.05 1.07
low
nquery 0.85 0.86 0.87 0.87 0.88 0.89
rpact 0.97 0.97 0.98 0.98 0.99 1.00
Rouge : < 50% des ratios dans ±10%

Périmètre de la comparaison

Designs d’essai clinique parcourus

Essai

Binaire

2-bras

Fixe

Calcul exact

Test Z-pooled

Test Z-unpooled

Group-sequential

Test Z-pooled

1-bras

Calcul exact

Approximation normale

Survie

2-bras

Fixe

Group-sequential

1-bras

Périmètre de la comparaison

Méthodes évaluées selon le type d’essai

Endpoint Type d’essai Évaluation Logiciel Package
Binaire 2 bras, fixe Pooled East, nQuery Rpact
Binaire 2 bras, fixe Exacte East, nQuery bbssr
Binaire 2 bras, fixe Unpooled East, nQuery
Binaire 2 bras, group-sequential Pooled East Rpact
Binaire 1 bras, fixe Exacte East A’Hern (sans package)
Binaire 1 bras, fixe Approx.norm East, nQuery Rpact
Survie 2 bras, fixe East, nQuery Rpact, Rashnu, gsDesign2
Survie 2 bras, group-sequential East Rpact, gsDesign2
Survie 1 bras, fixe nQuery oa2s1, sssas2, Rashnu

Endpoint Binaire

Binaire

2-bras

Fixe

Calcul exact

Test Z-pooled

Test Z-unpooled

Group-sequential

Test Z-pooled

1-bras

Calcul exact

Approximation normale

Tests binaires

Pooled/Unpooled, Fisher exact

  • Z-test
    • Pooled variance : \[ Z = \frac{\hat{p}_1 - \hat{p}_2}{\sqrt{\hat{p}(1-\hat{p}) \left(\frac{1}{n_1} + \frac{1}{n_2}\right)}}, \quad \hat{p} = \frac{x_1 + x_2}{n_1 + n_2} \]
    • Unpooled variance : \[ Z = \frac{\hat{p}_1 - \hat{p}_2}{\sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{n_1} + \frac{\hat{p}_2(1-\hat{p}_2)}{n_2}}} \]
  • Fisher exact test

    • Probabilité exacte des tables 2×2 : \[ P = \frac{\binom{n_1}{x_1}\binom{n_2}{x_2}}{\binom{n_1+n_2}{x_1+x_2}} \]
    • Utile pour petits effectifs (pas d’approximation normale)
    • Pas de formule analytique

Essai à 2 bras; “fixe”

Méthodes comparées

Endpoint Type d’essai Évaluation Logiciel Package
Binaire 2 bras, fixe Pooled East, nQuery Rpact
Binaire 2 bras, fixe Exacte East, nQuery bbssr
Binaire 2 bras, fixe Unpooled East, nQuery
  • East: Difference of Proportions test [PN-2S-DI]
  • nQuery : PTT36 / Inequality Tests for Difference of Two Proportions
bbssr::BinarySampleSize()
rpact::getSampleSizeRates()

Essai à 2 bras; “fixe”

Résultats en pooled-variance

N-Ratio Binaire à 2-Bras fixe, pooled-variance
Par rapport aux valeurs de East
Pertinence Min Q1 Moyenne Médiane Q3 Max
high
nquery 0.99 1.00 1.00 1.00 1.00 1.01
rpact 1.00 1.00 1.00 1.00 1.00 1.00
medium
nquery 0.99 1.00 1.00 1.00 1.00 1.00
rpact 1.00 1.00 1.00 1.00 1.00 1.00
low
nquery 0.88 1.00 1.00 1.00 1.00 1.11
rpact 1.00 1.00 1.00 1.00 1.00 1.00

Essai à 2 bras; “fixe”

Résultats en exact

N-Ratio Binaire à 2-Bras fixe, exact
Par rapport aux valeurs de nQuery
Pertinence Min Q1 Moyenne Médiane Q3 Max
high
bbssr 0.81 0.97 0.98 0.99 1.00 1.05
east 0.64 0.86 0.90 0.91 0.95 1.00
medium
bbssr 0.80 0.97 0.98 0.99 1.00 1.03
east 0.60 0.87 0.92 0.94 0.99 1.07
low
bbssr 0.79 0.97 0.98 0.99 1.00 1.05
east 0.57 0.83 0.89 0.92 0.97 1.07
Rouge : < 50% des ratios dans ±10%

Essai à 2 bras; “fixed”

Résultats en exact II

Essai à 2 bras; GS-Design

Méthodes comparées

Endpoint Type d’essai Évaluation Logiciel Package
Binaire 2 bras, séquentiel en groupes Pooled East Rpact
  • East: Difference of Proportions test [PN-2S-DI]
rpact::getSampleSizeRates()

Essai à 2 bras; GS-Design

Résultats

N-Ratio Binaire à 2-Bras GS-Design, pooled-variance
Par rapport aux valeurs de East
Pertinence Min Q1 Moyenne Médiane Q3 Max
high
rpact 0.96 1.00 1.00 1.00 1.00 1.00
medium
rpact 0.95 1.00 1.00 1.00 1.00 1.02
low
rpact 0.94 1.00 1.00 1.00 1.00 1.06

Essai à 1 bras

Méthodes comparées

Endpoint Type d’essai Évaluation Logiciel Package
Binaire 1 bras, fixe Approchée East, nQuery Rpact
Binaire 1 bras, fixe Exacte East A’Hern (sans package)
  • East : Single Proportion test [PN-1S-SP]
  • nQuery : POT0 / Chi Square Test for One Proportion
rpact::getSampleSizeRates(group = 1)

Essai à 1 bras

Résultats sous approximation normale

N-Ratio Binaire à 1-Bras, approx.norm
Par rapport aux valeurs de East
Pertinence Min Q1 Moyenne Médiane Q3 Max
high
nquery 1.00 1.00 1.00 1.00 1.00 1.00
rpact 1.00 1.00 1.00 1.00 1.00 1.00
medium
nquery 1.00 1.00 1.00 1.00 1.00 1.00
rpact 1.00 1.00 1.00 1.00 1.00 1.00
low
nquery 1.00 1.00 1.00 1.00 1.00 1.00
rpact 1.00 1.00 1.00 1.00 1.00 1.00

Essai à 1 bras

Résultats en exacte

N-Ratio Binaire à 1-Bras, exact
Par rapport aux valeurs de East
Pertinence Min Q1 Moyenne Médiane Q3 Max
high
ahern 0.80 0.94 0.97 0.96 1.00 1.19
medium
ahern 0.62 0.91 0.96 0.95 1.00 1.33
low
ahern 0.33 0.83 0.89 0.92 1.00 1.67
Rouge : < 50% des ratios dans ±10%

Endpoint Survie

Survie

2-bras

Fixe

Group-sequential

1-bras

Formule de Schoenfeld

Schoenfeld (1983)

\[ e = \frac{4 (z_{1-\alpha/2} + z_{1-\beta})^2}{(\log(HR))^2} \]

  • \(HR\) → 1 ⇒ \(e\)

  • Puissance ↑ ⇒ \(e\)

  • \(\alpha\) ↓ ⇒ \(e\)

  • Autres formules : Freedman, Hsieh-Freedman

De \(e\) à \(n\) : calcul de la taille d’échantillon

Passage du nombre d’événements au nombre de patients

  • Pour obtenir la taille d’échantillon \(n\) :

\[ n = \frac{e}{\text{probabilité d’événement dans l’étude}} \]

  • La probabilité d’événement dépend de :
    • De la probabilité de survie
    • Durée de suivi
    • Durée d’inclusion (accrual)
    • Taux de pertes (dropout)

Paramètres du Grid Search

Paramètre Valeurs testées
Survie contrôle à 3 ans \(S_c(3)\) 0.1, 0.3, 0.6, 0.9
Hazard ratio \(HR\) 0.1, 0.5, 0.7, 0.9, 0.99
\(\alpha\) (2-sided) 0.01, 0.05, 0.1, 0.20, 0.49
Puissance (1-\(\beta\)) 0.51, 0.8, 0.9, 0.99

pertinent, peu pertinant, cas limite

  • Période de recrutement de 3 ans
  • Suivi de 3 ans après le dernier admis
  • Proportion égale entre bras contrôle/expérimental

Essai à 2-Bras; “fixe”

Methods compared

Endpoint Type d’essai Évaluation Logiciel Package
Survie 2 bras, fixe East, nQuery Rpact, Rashnu, gsDesign2
  • East: Log Rank Test Given Accrual Duration and Study Duration [SU-2S-LRSD]
  • nQuery : STT1 / Two Sample Log-Rank Test of Exponential Survival
rpact::getSampleSizeSurvival()
rashnu::lakatosSampleSize()
gsDesign2::fixed_design_ahr() # needs to define enroll_rate, fail_rate before

Lakatos (1988)

Essai à 2-Bras; “fixe”

Résultats

N-Ratio Survie à 2-Bras fixe
Par rapport aux valeurs de East
Pertinence Min Q1 Moyenne Médiane Q3 Max
high
gsdesign2 1.00 1.00 1.00 1.00 1.00 1.01
nquery 1.00 1.00 1.01 1.00 1.01 1.03
rashnu 1.00 1.00 1.00 1.00 1.00 1.02
rpact 1.00 1.00 1.00 1.00 1.00 1.00
medium
gsdesign2 0.98 1.00 1.01 1.00 1.01 1.05
nquery 1.00 1.00 1.03 1.02 1.04 1.11
rashnu 1.00 1.00 1.01 1.01 1.02 1.07
rpact 0.98 0.99 1.00 1.00 1.00 1.00
low
gsdesign2 0.85 1.00 1.21 1.00 1.07 5.44
nquery 0.98 1.00 1.26 1.01 1.13 2.84
rashnu 0.96 1.00 1.09 1.00 1.03 1.87
rpact 0.78 1.00 1.12 1.00 1.00 5.44
Rouge : < 50% des ratios dans ±10%

Essai à 2-Bras; GS-Design

Méthodes comparées

Endpoint Type d’essai Évaluation Logiciel Package
Survie 2 bras, séquentiel en groupes East Rpact, gsDesign2
  • East: Log Rank Test Given Accrual Duration and Study Duration [SU-2S-LRSD]
rpact::getSampleSizeSurvival()
gsDesign2::gs_design_ahr() # needs to define enroll_rate, fail_rate before

Essai à 2-Bras; GS-Design

Résultats I

N-Ratio Survie à 2-Bras GS-Design
Par rapport aux valeurs de East
Pertinence Min Q1 Moyenne Médiane Q3 Max
high
gsdesign2 0.93 0.94 0.97 0.96 0.99 1.02
rpact 1.02 1.02 1.05 1.04 1.08 1.10
medium
gsdesign2 0.89 0.93 0.95 0.95 0.97 1.02
rpact 0.97 0.99 1.03 1.03 1.05 1.11
low
gsdesign2 0.86 0.89 0.91 0.91 0.92 0.96
rpact 0.76 0.77 0.85 0.85 0.93 0.97
Rouge : < 50% des ratios dans ±10%

Essai à 2-Bras; GS-Design

Résultats II

Sample Size dans des cas pertinents
α = 0.05, β = 0.1 et HR = 0.6
Survie à 3 ans
Sample Size
Ratio
Rpact East gsDesign2 Rpact/East gsDesign2/East
0.2 211 203 199 1.040 0.980
0.5 318 321 306 0.991 0.953
0.8 752 776 739 0.969 0.952

Essai à 1-Bras

Méthodes comparées

Endpoint Type d’essai Évaluation Logiciel Package
Survie 1 bras, fixe nQuery oa2s1, sssas2, Rashnu
  • nQuery : SOT1 / One Sample Log-Rank Test with Accrual
OneArm2stage::phase2.TTE() # Version with accrual time
SampleSizeSingleArmSurvival::calcSampleSizeArcsine()
rashnu::oneSurvSampleSize()

Nagashima et al. (2020)

Essai à 1-Bras

Résultats

N-Ratio Survie à 1-Bras fixe
Par rapport aux valeurs de nQuery
Pertinence Min Q1 Moyenne Médiane Q3 Max
high
oa2s 0.67 0.74 0.78 0.79 0.82 0.92
rashnu 1.46 1.56 1.67 1.63 1.76 2.01
sssas 1.22 1.29 1.37 1.32 1.42 1.59
medium
oa2s 0.49 0.67 0.78 0.81 0.88 1.04
rashnu 1.30 1.45 1.61 1.59 1.74 2.17
sssas 1.10 1.22 1.31 1.29 1.40 1.59
low
oa2s 0.22 0.65 1.14 0.86 1.10 14.33
rashnu 0.67 1.57 2.12 1.86 2.18 16.67
sssas 0.55 1.33 1.72 1.49 1.70 13.67
Rouge : < 50% des ratios dans ±10%

Conclusion

comme alternative à East et nQuery ?

Synthèse des résultats

Endpoint Type d’essai Évaluation Correspondance /Logiciel
Binaire 2 bras, fixe Exacte 🟡 Modérée
Binaire 2 bras, fixe Pooled 🟢 Élevée
Binaire 2 bras, group-sequential Pooled 🟢 Élevée
Binaire 1 bras, fixe Exacte 🟡 Modérée
Binaire 1 bras, fixe Approx.norm 🟢 Élevée
Survie 2 bras, fixe 🟢 Élevée
Survie 2 bras, group-sequential 🟡 Modérée
Survie 1 bras, fixe 🔵 Faible
  • est une alternative vérifiée dans la majorité des cas

Limitations

  • Vérification partielle
  • Choix arbitaires : design, pertinence
  • 2381 Designs + extraction → source d’erreurs
  • Necessiterait de comparer à chaque MAJ/version
  • Absence de consensus = Absence de conclusion

References

A’Hern, R. P. 2001. « Sample size tables for exact single‐stage phase II designs ». Statistics in Medicine 20 (6): 859‑66. https://doi.org/10.1002/sim.721.
Anderson, Keaven, Yujie Zhao, Yilong Zhang, John Blischak, Yihui Xie, Nan Xiao, et Jianxiao Yang. 2026. gsDesign2: Group Sequential Design with Non-Constant Effect. https://merck.github.io/gsDesign2/.
Choi, Sungho. 2025. rashnu: Balanced Sample Size and Power Calculation Tools. https://zarathucorp.github.io/rashnu/.
Collett, D. 2023. Modelling survival data in medical research. Chapman & Hall/CRC.
Cox, David R. 1992. « Regression models and life-tables ». Springer Series in Statistics, 527‑41. https://doi.org/10.1007/978-1-4612-4380-9_37.
Homma, Gosuke. 2025. bbssr: Blinded Sample Size Re-Estimation for Binary Endpoints. https://github.com/gosukehommaEX/bbssr.
Johnson, Logan, et Chi-Rong Li. s. d. « R vs EAST vs SAS: Group sequential design ». R vs east VS SAS: Group Sequential Design. https://psiaims.github.io/CAMIS/Comp/r-east_gsd_tte.html.
Kamal, Mohamed. s. d. « SampleSizeSingleArmSurvival ».
Kim, Kyungmann, et Anastasios A. Tsiatis. 1990. « Study duration for clinical trials with survival response and early stopping rule ». Biometrics 46 (1): 81. https://doi.org/10.2307/2531632.
Lakatos, Edward. 1988. « Sample sizes based on the log-rank statistic in complex clinical trials ». Biometrics 44 (1): 229. https://doi.org/10.2307/2531910.
Lakatos, Edward, et K. K. Lan. 1992. « A comparison of sample size methods for the logrank statistic ». Statistics in Medicine 11 (2): 179‑91. https://doi.org/10.1002/sim.4780110205.
Lan, K. K., et David L. DeMets. 1983. « Discrete sequential boundaries for clinical trials ». Biometrika 70 (3): 659. https://doi.org/10.2307/2336502.
Nagashima, Kengo, Hisashi Noma, Yasunori Sato, et Masahiko Gosho. 2020. « Sample Size Calculations for single‐arm survival studies using transformations of the kaplan–meier estimator ». Pharmaceutical Statistics 20 (3): 499‑511. https://doi.org/10.1002/pst.2090.
Oba, Koji, et Aya Kuchiba. 2020. « Section II.7 ». In Textbook of clinical trials in oncology: A statistical perspective, 113‑32. CRC PRESS.
Schoenfeld, David A. 1983. « Sample-size formula for the proportional-hazards regression model ». Biometrics 39 (2): 499. https://doi.org/10.2307/2531021.
Textbook of clinical trials in oncology: A statistical perspective. 2020. CRC PRESS.
Wassmer, Gernot, et Friedrich Pahlke. 2025. rpact: Confirmatory Adaptive Clinical Trial Design and Analysis. https://doi.org/10.32614/CRAN.package.rpact.
Yuan, Xiaomeng, Haitao Pan, et Jianrong Wu. 2023. « OneArm2stage — Phase II Single-Arm Two-Stage Designs with Time-to-Event Outcomes ». https://github.com/cran/OneArm2stage.

Merci pour votre attention

Annexe

Lakatos et Lan (1992)

Comparaison avec l'article de Lakatos & Lan
Durée de l'étude = 10 ans, α = 0.05, β = 0.1
Sc(10) - HR - Accrual n_rpact n_rashnu n_gsdesign2 n_east n_nquery n_L n_F n_RGS
0.8 - 0.667 - 1 1588 1620 1610 1593 1640 1617 1628 1640
0.8 - 0.667 - 5 1979 2022 2007 1984 2046 2017 2024 2046
0.8 - 0.667 - 9 2671 2728 2710 2679 2764 2724 2709 2764
0.8 - 0.5 - 1 601 638 625 604 664 638 649 664
0.8 - 0.5 - 5 749 798 781 753 832 798 807 831
0.8 - 0.5 - 9 1011 1078 1055 1017 1124 1079 1081 1124
0.8 - 0.25 - 1 181 230 214 182 270 230 241 269
0.8 - 0.25 - 5 225 290 267 227 340 289 299 338
0.8 - 0.25 - 9 304 392 362 306 460 392 401 459
0.2 - 0.667 - 1 361 362 362 362 364 360 370 363
0.2 - 0.667 - 5 414 416 416 415 420 414 419 418
0.2 - 0.667 - 9 527 530 530 528 534 528 509 534
0.2 - 0.5 - 1 133 134 135 134 138 134 144 138
0.2 - 0.5 - 5 154 156 157 155 162 156 164 161
0.2 - 0.5 - 9 196 200 201 197 208 200 200 207
0.2 - 0.25 - 1 40 44 44 40 50 43 53 48
0.2 - 0.25 - 5 46 52 51 47 58 51 61 58
0.2 - 0.25 - 9 59 68 66 60 78 66 74 76