Comparaison des méthodes de calcul de la taille d’échantillon

comme alternative à East et nQuery

Arocena Thomas

arocena.thomas@gmail.com

Oncostat

Dan Chaltiel

dan.chaltiel@gustaveroussy.fr

Anne Lourdessamy

anne.lourdessamy@gustaveroussy.fr

25 février 2026

Introduction

Cadre et contexte

Stage de césure M1 → M2
05 Janvier → 13 Mars
source sur -Oncostat

Motivations

Pourquoi utiliser pour le calcul de la taille d’échantillon ?

Calcul dans (pas d’outil externe)
Partage et reproductibilité via le code
Pas de problèmes d’export / interopérabilité
Logiciel libre et open-source (audit, collaboration, )

→ Nécessité de valider les packages pour atteindre la crédibilité de logiciels comme East ou nQuery.

Présentation des logiciels et packages

Logiciels :
- East 6
- Nquery 9.2

Packages
- Rpact 4.2.0
- gsDesign2 1.1.7
- Rashnu 0.1.2, bbssr 1.0.2, OneArm2stage 1.1.2, SampleSizeSingleArmSurvival

Méthodologie

Grid Search

Pour chaque design :

Fixer plusieurs valeurs par paramètres
Générer toutes les combinaisons
Calculer/Extraire la taille d’échantillon N finale

α	Puissance	Pertinence	N East	N Rpact	N nQuery
0.5	0.9	high	10	12	8
0.5	0.7	medium	15	16	12
0.1	0.9	low	20	19	15
0.1	0.7	low	30	31	25

Présentation des résultats

N-Ratio = N_Méthode / N_Référence

Pertinence	Min	Q1	Moyenne	Médiane	Q3	Max
N-Ratio exemple table
Par rapport aux valeurs de East
high
nquery	1.00	1.00	1.00	1.00	1.00	1.00
rpact	1.00	1.00	1.00	1.00	1.00	1.00
medium
nquery	0.75	0.78	0.79	0.80	0.82	0.83
rpact	0.95	0.99	1.02	1.03	1.05	1.07
low
nquery	0.85	0.86	0.87	0.87	0.88	0.89
rpact	0.97	0.97	0.98	0.98	0.99	1.00
Rouge : < 50% des ratios dans ±10%

Périmètre de la comparaison

Designs d’essai clinique parcourus

Périmètre de la comparaison

Méthodes évaluées selon le type d’essai

Endpoint	Type d’essai	Évaluation	Logiciel	Package
Binaire	2 bras, fixe	Pooled	East, nQuery	Rpact
Binaire	2 bras, fixe	Exacte	East, nQuery	bbssr
Binaire	2 bras, fixe	Unpooled	East, nQuery	—
Binaire	2 bras, group-sequential	Pooled	East	Rpact
Binaire	1 bras, fixe	Exacte	East	A’Hern (sans package)
Binaire	1 bras, fixe	Approx.norm	East, nQuery	Rpact
Survie	2 bras, fixe	—	East, nQuery	Rpact, Rashnu, gsDesign2
Survie	2 bras, group-sequential	—	East	Rpact, gsDesign2
Survie	1 bras, fixe	—	nQuery	oa2s¹, sssas², Rashnu

Endpoint Binaire

Tests binaires

Pooled/Unpooled, Fisher exact

Z-test
- Pooled variance : \[ Z = \frac{\hat{p}_1 - \hat{p}_2}{\sqrt{\hat{p}(1-\hat{p}) \left(\frac{1}{n_1} + \frac{1}{n_2}\right)}}, \quad \hat{p} = \frac{x_1 + x_2}{n_1 + n_2} \]
- Unpooled variance : \[ Z = \frac{\hat{p}_1 - \hat{p}_2}{\sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{n_1} + \frac{\hat{p}_2(1-\hat{p}_2)}{n_2}}} \]

Fisher exact test
- Probabilité exacte des tables 2×2 : \[ P = \frac{\binom{n_1}{x_1}\binom{n_2}{x_2}}{\binom{n_1+n_2}{x_1+x_2}} \]
- Utile pour petits effectifs (pas d’approximation normale)
- Pas de formule analytique

Paramètres du Grid Search

Paramètre	Valeurs testées
Proportion contrôle \(\pi_c\)	0.1, 0.3, 0.5, 0.8, 0.9
Delta de proportion \(\pi_e - \pi_c\)	0.05, 0.15, 0.25, 0.49
\(\alpha\) (2-sided)	0.01, 0.05, 0.1, 0.20, 0.49
Puissance (1-\(\beta\))	0.51, 0.8, 0.9, 0.99

pertinent, peu pertinant, cas limite

Essai à 2 bras; “fixe”

Méthodes comparées

Endpoint	Type d’essai	Évaluation	Logiciel	Package
Binaire	2 bras, fixe	Pooled	East, nQuery	Rpact
Binaire	2 bras, fixe	Exacte	East, nQuery	bbssr
Binaire	2 bras, fixe	Unpooled	East, nQuery	—

East: Difference of Proportions test [PN-2S-DI]
nQuery : PTT36 / Inequality Tests for Difference of Two Proportions

bbssr::BinarySampleSize()
rpact::getSampleSizeRates()

Essai à 2 bras; “fixe”

Résultats en pooled-variance

Pertinence	Min	Q1	Moyenne	Médiane	Q3	Max
N-Ratio Binaire à 2-Bras fixe, pooled-variance
Par rapport aux valeurs de East
high
nquery	0.99	1.00	1.00	1.00	1.00	1.01
rpact	1.00	1.00	1.00	1.00	1.00	1.00
medium
nquery	0.99	1.00	1.00	1.00	1.00	1.00
rpact	1.00	1.00	1.00	1.00	1.00	1.00
low
nquery	0.88	1.00	1.00	1.00	1.00	1.11
rpact	1.00	1.00	1.00	1.00	1.00	1.00

Essai à 2 bras; “fixe”

Résultats en exact

Pertinence	Min	Q1	Moyenne	Médiane	Q3	Max
N-Ratio Binaire à 2-Bras fixe, exact
Par rapport aux valeurs de nQuery
high
bbssr	0.81	0.97	0.98	0.99	1.00	1.05
east	0.64	0.86	0.90	0.91	0.95	1.00
medium
bbssr	0.80	0.97	0.98	0.99	1.00	1.03
east	0.60	0.87	0.92	0.94	0.99	1.07
low
bbssr	0.79	0.97	0.98	0.99	1.00	1.05
east	0.57	0.83	0.89	0.92	0.97	1.07
Rouge : < 50% des ratios dans ±10%

Essai à 2 bras; “fixed”

Résultats en exact II

Essai à 2 bras; GS-Design

Méthodes comparées

Endpoint	Type d’essai	Évaluation	Logiciel	Package
Binaire	2 bras, séquentiel en groupes	Pooled	East	Rpact

East: Difference of Proportions test [PN-2S-DI]

rpact::getSampleSizeRates()

Essai à 2 bras; GS-Design

Résultats

Pertinence	Min	Q1	Moyenne	Médiane	Q3	Max
N-Ratio Binaire à 2-Bras GS-Design, pooled-variance
Par rapport aux valeurs de East
high
rpact	0.96	1.00	1.00	1.00	1.00	1.00
medium
rpact	0.95	1.00	1.00	1.00	1.00	1.02
low
rpact	0.94	1.00	1.00	1.00	1.00	1.06

Essai à 1 bras

Méthodes comparées

Endpoint	Type d’essai	Évaluation	Logiciel	Package
Binaire	1 bras, fixe	Approchée	East, nQuery	Rpact
Binaire	1 bras, fixe	Exacte	East	A’Hern (sans package)

East : Single Proportion test [PN-1S-SP]
nQuery : POT0 / Chi Square Test for One Proportion

rpact::getSampleSizeRates(group = 1)

Essai à 1 bras

Résultats sous approximation normale

Pertinence	Min	Q1	Moyenne	Médiane	Q3	Max
N-Ratio Binaire à 1-Bras, approx.norm
Par rapport aux valeurs de East
high
nquery	1.00	1.00	1.00	1.00	1.00	1.00
rpact	1.00	1.00	1.00	1.00	1.00	1.00
medium
nquery	1.00	1.00	1.00	1.00	1.00	1.00
rpact	1.00	1.00	1.00	1.00	1.00	1.00
low
nquery	1.00	1.00	1.00	1.00	1.00	1.00
rpact	1.00	1.00	1.00	1.00	1.00	1.00

Essai à 1 bras

Résultats en exacte

Pertinence	Min	Q1	Moyenne	Médiane	Q3	Max
N-Ratio Binaire à 1-Bras, exact
Par rapport aux valeurs de East
high
ahern	0.80	0.94	0.97	0.96	1.00	1.19
medium
ahern	0.62	0.91	0.96	0.95	1.00	1.33
low
ahern	0.33	0.83	0.89	0.92	1.00	1.67
Rouge : < 50% des ratios dans ±10%

Endpoint Survie

Formule de Schoenfeld

Schoenfeld (1983)

\[ e = \frac{4 (z_{1-\alpha/2} + z_{1-\beta})^2}{(\log(HR))^2} \]

\(HR\) → 1 ⇒ \(e\) ↑
Puissance ↑ ⇒ \(e\) ↑
\(\alpha\) ↓ ⇒ \(e\) ↑
Autres formules : Freedman, Hsieh-Freedman

De \(e\) à \(n\) : calcul de la taille d’échantillon

Passage du nombre d’événements au nombre de patients

Pour obtenir la taille d’échantillon \(n\) :

\[ n = \frac{e}{\text{probabilité d’événement dans l’étude}} \]

La probabilité d’événement dépend de :
- De la probabilité de survie
- Durée de suivi
- Durée d’inclusion (accrual)
- Taux de pertes (dropout)

Paramètres du Grid Search

Paramètre	Valeurs testées
Survie contrôle à 3 ans \(S_c(3)\)	0.1, 0.3, 0.6, 0.9
Hazard ratio \(HR\)	0.1, 0.5, 0.7, 0.9, 0.99
\(\alpha\) (2-sided)	0.01, 0.05, 0.1, 0.20, 0.49
Puissance (1-\(\beta\))	0.51, 0.8, 0.9, 0.99

pertinent, peu pertinant, cas limite

Période de recrutement de 3 ans
Suivi de 3 ans après le dernier admis
Proportion égale entre bras contrôle/expérimental

Essai à 2-Bras; “fixe”

Methods compared

Endpoint	Type d’essai	Évaluation	Logiciel	Package
Survie	2 bras, fixe	—	East, nQuery	Rpact, Rashnu, gsDesign2

East: Log Rank Test Given Accrual Duration and Study Duration [SU-2S-LRSD]
nQuery : STT1 / Two Sample Log-Rank Test of Exponential Survival

rpact::getSampleSizeSurvival()
rashnu::lakatosSampleSize()
gsDesign2::fixed_design_ahr() # needs to define enroll_rate, fail_rate before

Lakatos (1988)

Essai à 2-Bras; “fixe”

Résultats

Pertinence	Min	Q1	Moyenne	Médiane	Q3	Max
N-Ratio Survie à 2-Bras fixe
Par rapport aux valeurs de East
high
gsdesign2	1.00	1.00	1.00	1.00	1.00	1.01
nquery	1.00	1.00	1.01	1.00	1.01	1.03
rashnu	1.00	1.00	1.00	1.00	1.00	1.02
rpact	1.00	1.00	1.00	1.00	1.00	1.00
medium
gsdesign2	0.98	1.00	1.01	1.00	1.01	1.05
nquery	1.00	1.00	1.03	1.02	1.04	1.11
rashnu	1.00	1.00	1.01	1.01	1.02	1.07
rpact	0.98	0.99	1.00	1.00	1.00	1.00
low
gsdesign2	0.85	1.00	1.21	1.00	1.07	5.44
nquery	0.98	1.00	1.26	1.01	1.13	2.84
rashnu	0.96	1.00	1.09	1.00	1.03	1.87
rpact	0.78	1.00	1.12	1.00	1.00	5.44
Rouge : < 50% des ratios dans ±10%

Essai à 2-Bras; GS-Design

Méthodes comparées

Endpoint	Type d’essai	Évaluation	Logiciel	Package
Survie	2 bras, séquentiel en groupes	—	East	Rpact, gsDesign2

East: Log Rank Test Given Accrual Duration and Study Duration [SU-2S-LRSD]

rpact::getSampleSizeSurvival()
gsDesign2::gs_design_ahr() # needs to define enroll_rate, fail_rate before

Essai à 2-Bras; GS-Design

Résultats I

Pertinence	Min	Q1	Moyenne	Médiane	Q3	Max
N-Ratio Survie à 2-Bras GS-Design
Par rapport aux valeurs de East
high
gsdesign2	0.93	0.94	0.97	0.96	0.99	1.02
rpact	1.02	1.02	1.05	1.04	1.08	1.10
medium
gsdesign2	0.89	0.93	0.95	0.95	0.97	1.02
rpact	0.97	0.99	1.03	1.03	1.05	1.11
low
gsdesign2	0.86	0.89	0.91	0.91	0.92	0.96
rpact	0.76	0.77	0.85	0.85	0.93	0.97
Rouge : < 50% des ratios dans ±10%

Essai à 2-Bras; GS-Design

Résultats II

Survie à 3 ans	Sample Size			Ratio
Sample Size dans des cas pertinents
α = 0.05, β = 0.1 et HR = 0.6
Survie à 3 ans	Rpact	East	gsDesign2	Rpact/East	gsDesign2/East
0.2	211	203	199	1.040	0.980
0.5	318	321	306	0.991	0.953
0.8	752	776	739	0.969	0.952

Essai à 1-Bras

Méthodes comparées

Endpoint	Type d’essai	Évaluation	Logiciel	Package
Survie	1 bras, fixe	—	nQuery	oa2s¹, sssas², Rashnu

nQuery : SOT1 / One Sample Log-Rank Test with Accrual

OneArm2stage::phase2.TTE() # Version with accrual time
SampleSizeSingleArmSurvival::calcSampleSizeArcsine()
rashnu::oneSurvSampleSize()

Nagashima et al. (2020)

Essai à 1-Bras

Résultats

Pertinence	Min	Q1	Moyenne	Médiane	Q3	Max
N-Ratio Survie à 1-Bras fixe
Par rapport aux valeurs de nQuery
high
oa2s	0.67	0.74	0.78	0.79	0.82	0.92
rashnu	1.46	1.56	1.67	1.63	1.76	2.01
sssas	1.22	1.29	1.37	1.32	1.42	1.59
medium
oa2s	0.49	0.67	0.78	0.81	0.88	1.04
rashnu	1.30	1.45	1.61	1.59	1.74	2.17
sssas	1.10	1.22	1.31	1.29	1.40	1.59
low
oa2s	0.22	0.65	1.14	0.86	1.10	14.33
rashnu	0.67	1.57	2.12	1.86	2.18	16.67
sssas	0.55	1.33	1.72	1.49	1.70	13.67
Rouge : < 50% des ratios dans ±10%

Conclusion

comme alternative à East et nQuery ?

Synthèse des résultats

Endpoint	Type d’essai	Évaluation	Correspondance /Logiciel
Binaire	2 bras, fixe	Exacte	🟡 Modérée
Binaire	2 bras, fixe	Pooled	🟢 Élevée
Binaire	2 bras, group-sequential	Pooled	🟢 Élevée
Binaire	1 bras, fixe	Exacte	🟡 Modérée
Binaire	1 bras, fixe	Approx.norm	🟢 Élevée
Survie	2 bras, fixe	—	🟢 Élevée
Survie	2 bras, group-sequential	—	🟡 Modérée
Survie	1 bras, fixe	—	🔵 Faible

est une alternative vérifiée dans la majorité des cas

Limitations

Vérification partielle
Choix arbitaires : design, pertinence
2381 Designs + extraction → source d’erreurs
Necessiterait de comparer à chaque MAJ/version
Absence de consensus = Absence de conclusion

References

A’Hern, R. P. 2001. « Sample size tables for exact single‐stage phase II designs ». Statistics in Medicine 20 (6): 859‑66. https://doi.org/10.1002/sim.721.

Anderson, Keaven, Yujie Zhao, Yilong Zhang, John Blischak, Yihui Xie, Nan Xiao, et Jianxiao Yang. 2026. gsDesign2: Group Sequential Design with Non-Constant Effect. https://merck.github.io/gsDesign2/.

Choi, Sungho. 2025. rashnu: Balanced Sample Size and Power Calculation Tools. https://zarathucorp.github.io/rashnu/.

Collett, D. 2023. Modelling survival data in medical research. Chapman & Hall/CRC.

Cox, David R. 1992. « Regression models and life-tables ». Springer Series in Statistics, 527‑41. https://doi.org/10.1007/978-1-4612-4380-9_37.

Homma, Gosuke. 2025. bbssr: Blinded Sample Size Re-Estimation for Binary Endpoints. https://github.com/gosukehommaEX/bbssr.

Johnson, Logan, et Chi-Rong Li. s. d. « R vs EAST vs SAS: Group sequential design ». R vs east VS SAS: Group Sequential Design. https://psiaims.github.io/CAMIS/Comp/r-east_gsd_tte.html.

Kamal, Mohamed. s. d. « SampleSizeSingleArmSurvival ».

Kim, Kyungmann, et Anastasios A. Tsiatis. 1990. « Study duration for clinical trials with survival response and early stopping rule ». Biometrics 46 (1): 81. https://doi.org/10.2307/2531632.

Lakatos, Edward. 1988. « Sample sizes based on the log-rank statistic in complex clinical trials ». Biometrics 44 (1): 229. https://doi.org/10.2307/2531910.

Lakatos, Edward, et K. K. Lan. 1992. « A comparison of sample size methods for the logrank statistic ». Statistics in Medicine 11 (2): 179‑91. https://doi.org/10.1002/sim.4780110205.

Lan, K. K., et David L. DeMets. 1983. « Discrete sequential boundaries for clinical trials ». Biometrika 70 (3): 659. https://doi.org/10.2307/2336502.

Nagashima, Kengo, Hisashi Noma, Yasunori Sato, et Masahiko Gosho. 2020. « Sample Size Calculations for single‐arm survival studies using transformations of the kaplan–meier estimator ». Pharmaceutical Statistics 20 (3): 499‑511. https://doi.org/10.1002/pst.2090.

Oba, Koji, et Aya Kuchiba. 2020. « Section II.7 ». In Textbook of clinical trials in oncology: A statistical perspective, 113‑32. CRC PRESS.

Schoenfeld, David A. 1983. « Sample-size formula for the proportional-hazards regression model ». Biometrics 39 (2): 499. https://doi.org/10.2307/2531021.

Textbook of clinical trials in oncology: A statistical perspective. 2020. CRC PRESS.

Wassmer, Gernot, et Friedrich Pahlke. 2025. rpact: Confirmatory Adaptive Clinical Trial Design and Analysis. https://doi.org/10.32614/CRAN.package.rpact.

Yuan, Xiaomeng, Haitao Pan, et Jianrong Wu. 2023. « OneArm2stage — Phase II Single-Arm Two-Stage Designs with Time-to-Event Outcomes ». https://github.com/cran/OneArm2stage.

Merci pour votre attention

Annexe

Lakatos et Lan (1992)

Sc(10) - HR - Accrual	n_rpact	n_rashnu	n_gsdesign2	n_east	n_nquery	n_L	n_F	n_RGS
Comparaison avec l'article de Lakatos & Lan
Durée de l'étude = 10 ans, α = 0.05, β = 0.1
0.8 - 0.667 - 1	1588	1620	1610	1593	1640	1617	1628	1640
0.8 - 0.667 - 5	1979	2022	2007	1984	2046	2017	2024	2046
0.8 - 0.667 - 9	2671	2728	2710	2679	2764	2724	2709	2764
0.8 - 0.5 - 1	601	638	625	604	664	638	649	664
0.8 - 0.5 - 5	749	798	781	753	832	798	807	831
0.8 - 0.5 - 9	1011	1078	1055	1017	1124	1079	1081	1124
0.8 - 0.25 - 1	181	230	214	182	270	230	241	269
0.8 - 0.25 - 5	225	290	267	227	340	289	299	338
0.8 - 0.25 - 9	304	392	362	306	460	392	401	459
0.2 - 0.667 - 1	361	362	362	362	364	360	370	363
0.2 - 0.667 - 5	414	416	416	415	420	414	419	418
0.2 - 0.667 - 9	527	530	530	528	534	528	509	534
0.2 - 0.5 - 1	133	134	135	134	138	134	144	138
0.2 - 0.5 - 5	154	156	157	155	162	156	164	161
0.2 - 0.5 - 9	196	200	201	197	208	200	200	207
0.2 - 0.25 - 1	40	44	44	40	50	43	53	48
0.2 - 0.25 - 5	46	52	51	47	58	51	61	58
0.2 - 0.25 - 9	59	68	66	60	78	66	74	76

Binaire-2-Bras-Fixed-Pooled
Binaire-2-Bras-Fixed-Exact
Binaire-2-Bras-GS
Binaire-1-Bras-approx
Binaire-1-Bras-exact
Survie-2-Bras-Fixed
Survie-2-Bras-GS
Survie-1-Bras