Moeten we afhankelijk zijn van referentie-intervallen uit de bijsluiters van de fabrikant?

ineke · Bericht door **ineke** » 26 feb 2024, 13:34

Open access De Gruyter publishing group - clinical laboratory

Moeten we afhankelijk zijn van referentie-intervallen uit de bijsluiters van de fabrikant?
Vergelijking van TSH- en FT4-referentie-intervallen van vier fabrikanten met resultaten van moderne indirecte methoden en de directe methode

Corresponding author:
Annemieke C. Heijboer, Endocrine Laboratory, Department of Laboratory Medicine, Amsterdam UMC Location University of Amsterdam, Meibergdreef 9, 1105 AZ Amsterdam, The Netherlands;
Amsterdam Gastroenterology, Endocrinology & Metabolism, Amsterdam, The Netherlands;
Department of Laboratory Medicine, Amsterdam UMC Location Vrije Universiteit Amsterdam, Boelelaan 1117, Amsterdam, The Netherlands;
and Amsterdam Reproduction & Development Research Institute, Amsterdam, The Netherlands, E-mail: a.heijboer@amsterdamumc.nl

In de pdf aanvullend materiaal/onderzoekgegevens (tabellen etc.)

Invoering
Euthyreoïdie wordt gedefinieerd als een normale schildklierfunctie waarbij de concentraties schildklierstimulerend hormoon (TSH) en vrij thyroxine (FT4) binnen het referentie-interval (RI) vallen.
Andere combinaties van TSH en FT4 kunnen leiden tot diagnoses zoals primaire hypothyreoïdie (verhoogde TSH en verlaagde FT4) of hyperthyreoïdie (verlaagde TSH en verhoogde FT4).
Het is duidelijk dat een juiste diagnose sterk afhankelijk is van de juiste definitie van RI's die door het laboratorium wordt verstrekt.

Idealiter stellen laboratoria hun eigen onder- en bovenreferentielimieten (LRL's en URL's) vast om een RI te definiëren, afgestemd op hun specifieke methode en patiëntenpopulatie.
Het Clinical Laboratory Standards Institute (CLSI) geeft richtlijnen (CLSI C28-A3c) voor het bepalen van RI’s [ 1 ].
Het bepalen van RI’s volgens deze richtlijn met minimaal 120 geschikte referentiepersonen is echter tijdrovend en kostbaar.
In plaats daarvan vertrouwen laboratoria vaak op RI's uit de bijsluiters van de fabrikant of uit een ander laboratorium.
Daarna, bij de overstap naar een nieuwe methodologie, worden bestaande RI’s vaak aangepast na een methodevergelijkingsonderzoek.
De bovengenoemde richtlijn biedt ook richtlijnen voor het verifiëren van RI's die zijn opgesteld door de fabrikant of een ander laboratorium.
Helaas zijn extern opgerichte RI’s niet noodzakelijkerwijs overdraagbaar, omdat pre-analytische, analytische en biologische variabelen kunnen verschillen [ 2 ], [ 3 ], [ 4 ].
Om de geschiktheid van RI’s te garanderen, moeten het extern gebruikte platform en de referentiepopulatie op één lijn worden gebracht met het huidige platform en de huidige patiëntenpopulatie.
De vergelijkbaarheid van het platform kan worden beoordeeld door middel van een methodevergelijkingsonderzoek volgens CLSI EP09 [ 5 ].

De vergelijkbaarheid van de proefpersonenpopulatie is subjectiever en kan alleen objectief worden beoordeeld door validatie van de extern vastgestelde RI in de proefpersonenpopulatie.
CLSI C28-A3c beveelt aan om de nieuwe RI te verifiëren met een referentiepopulatie van ten minste 20 monsters, waarbij de extern vastgestelde RI wordt geaccepteerd wanneer niet meer dan 2 van de 20 waarden buiten de voorgestelde RI vallen.

Let op: als alle twintig referentiewaarden binnen de voorgestelde RI vallen, kan deze te breed zijn voor de populatie proefpersonen. Het risico van het accepteren van een te brede RI wordt daarmee niet geminimaliseerd.

Een alternatieve en steeds robuustere aanpak waarbij gebruik wordt gemaakt van moderne methodologie is het vaststellen of valideren van een RI met behulp van bestaande historische laboratoriumgegevens [ 3 ].
Het gebruik van indirecte methoden op basis van historische gegevens levert geschatte RI's op die het analytische systeem van het laboratorium en de proefpersonenpopulatie weerspiegelen.
Bovendien maakt het een uitgebreidere indeling mogelijk (bijvoorbeeld op basis van geslacht en leeftijd), wat vaak te duur is voor laboratoria bij een aanpak met behulp van de directe methode, op voorwaarde dat er voldoende historische gegevens beschikbaar zijn.

De afgelopen jaren zijn er meerdere moderne indirecte methoden ontwikkeld die de beperkingen van de bekende Bhattacharya- en Hoffmann-methoden hebben overwonnen [ 6 ].
In een recente studie hebben Ammer et al. vergeleek de Hofmann-methode met vier moderne indirecte methoden, Truncated-Maximum-Likelihood (TML), kosmic, Truncated-Minimum-Chi-Square (TMC) en fineR, naast de niet-parametrische directe methode met behulp van 120 referentiemonsters [ 7 ].
TMC presteerde het beste voor TSH, dat een sterk scheve verdeling vertoont, terwijl fineR de beste resultaten liet zien voor FT4, met een ongeveer normale verdeling.
Met een fractie niet-normale resultaten (pathologische fractie) van 10% of minder voor TSH en FT4 presteerden TMC en fineR zelfs beter dan de directe methode (met 120 referentiepersonen).

Zodra RI's zijn vastgesteld, moeten laboratoria deze periodiek opnieuw evalueren om te voldoen aan ISO-norm 15189.
De frequentie van herbeoordeling blijft willekeurig en komt vaak alleen voor bij de overgang naar een nieuwe methode.
Daarom hebben we de afgelopen 15 jaar de robuustheid van TSH- en FT4-RI’s onderzocht om te bepalen of een frequentere periodieke herevaluatie van RI’s noodzakelijk is.
We gebruikten twee indirecte methoden voor het schatten van RI's, TMC (voor TSH) en verfijning (voor FT4) op historische gegevens (2008-2022). Daarnaast hebben we de geschiktheid beoordeeld van TSH- en FT4-RI's geschat met deze indirecte methoden en door de fabrikant geleverde RI's door ze te vergelijken met geschatte RI's met behulp van de directe methode.
materialen en methodes

Monster- en gegevensverzameling
Directe RI's
TSH en FT4 werden gemeten in serummonsters verkregen van 125 referentiepersonen (gezonde medewerkers van Amsterdam UMC, waaronder 54 mannen en 71 vrouwen, in de leeftijd van 19-68 jaar).
Deze referentiemonsters werden verzameld tussen september 2022 en februari 2023.
Van 69 van de 125 referentiepersonen waren ook aliquots van gehepariniseerd plasma beschikbaar. Van elke deelnemer werd schriftelijke toestemming verkregen. Serum- en gehepariniseerde plasmamonsters werden verzameld, gedurende 10 minuten bij 3.000 x g bij 18 ° C rondgedraaid, in porties verdeeld en bij -80 ° C bewaard. De bewaartijd was niet langer dan 10 maanden.

Indirecte RI's
Alle dertien deelnemende laboratoria zijn gevestigd in Nederland, dat wordt beschouwd als een gebied waar jodium voldoende is.
Deze laboratoria ondersteunen in totaal 28 ziekenhuizen in heel Nederland en bieden aanvullende laboratoriumdiensten voor eerstelijnszorg, waaronder aderlatingen, op meer dan 500 verschillende locaties in het hele land.
Voor IRI's werden de TSH- en FT4-resultaten van 2008 tot 2022 door de deelnemende laboratoria uit het laboratoriuminformatiesysteem (LIS) gehaald en overgebracht naar Excel-tabellen, samen met een anonieme en unieke patiëntidentificatie, een unieke monsteridentificatie, analysedatum, geslacht en leeftijd.
Niet-numerieke resultaten en resultaten van patiënten jonger dan 18 jaar of ouder dan 100 jaar werden uitgesloten.
Om het percentage pathologische resultaten in de datasets te verlagen, werden alle resultaten van een patiënt uitgesloten van de analyses wanneer binnen hetzelfde jaar meerdere resultaten voor die patiënt werden verkregen (herhaalde metingen).
In het geval dat laboratoria factoren toepasten op hun TSH- of FT4-resultaten, werden deze factoren omgekeerd voordat de analyses werden uitgevoerd.

Tabel 1 geeft een overzicht van de analysesystemen, het geschatte percentage eerstelijnsresultaten, het aantal TSH- en FT4-tests en de leeftijds- en geslachtsverdeling van de resultaten in 2022 voor elk van de deelnemende laboratoria.
Merk op dat sommige laboratoria van fabrikant zijn gewisseld en mogelijk ook zijn opgenomen in analyses voor een andere fabrikant dan die vermeld in Tabel 1 .

Tabel 1:
Kenmerken in 2022 van deelnemende laboratoria.
Laboratorium Analytisch systeem Aantal TSH/FT4-tests voor volwassenen Percentage eerstelijnsresultaten Mediane leeftijd (IQR) voor resultaten voor volwassenen Gemiddeld percentage vrouwelijke volwassen resultaten
1 Abbott Architect >200.000/>100.000 ∼50 % 59.8 (42.3–75.1) 67.9 %
2 Abbott Architect >50.000/>20.000 ∼35 % 59.9 (43.2–74.2) 67.0 %
3 Roche Cobas >20.000/>20.000 ∼10 % 58.9 (42.1–72.4) 65.4 %
4 Roche Cobas >200.000/>50.000 ∼45 % 60.7 (44.4–73.8) 68.2 %
5 Roche Cobas >50.000/>20.000 ∼35 % 61.1 (45.6–73.5) 64.8 %
6 Siemens Atellica >50.000/>50.000 ∼50 % 61.8 (45.8–74.9) 65.8 %
7 Beckman Unicel DxI >200.000/>50.000 100 % 54.5 (37.6–70.0) 69.3 %
8 Beckman Unicel DxI >20.000/>5.000 ∼20 % 59.1 (44.0–72.4) 66.0 %
9 Abbott Architect >20.000/>20.000 ∼55 % 63.0 (49.0–75.0) 73.0 %
10 Siemens Atellica >50.000/>20.000 ∼40 % 59.3 (42.9–73.1) 64.4 %
11 Roche Cobas >50.000/>20.000 ∼30 % 63.1 (48.5–75.3) 62.4 %
12 Siemens Atellica >20.000/>10.000 ∼30 % 58.6 (40.3–72.7) 67.8 %
13 Siemens Atellica >100.000/>50.000 100 % 58.2 (41.0–71.9)

Analytische procedures
Alle deelnemende laboratoria waren geaccrediteerd volgens ISO 15189 (in het verleden CCKL (Landelijke Coördinatiecommissie Kwaliteitszorg voor Gezondheidszorglaboratoria in Nederland)) en voerden interne en externe kwaliteitsbeoordelingen uit.
De TSH- en FT4-concentraties werden bepaald op hun testplatform met behulp van de juiste reagentia en kalibrators volgens de instructies van de fabrikant (zie Tabel 1 voor details over de testplatforms).
Bloedmonsters werden afgenomen via venapunctie volgens lokale richtlijnen. Alle laboratoria gebruikten gehepariniseerde plasmabuizen voor TSH en FT4.
De aanvullende materialen en methoden bieden nauwkeurige informatie over de TSH- en FT4-tests die door elke fabrikant worden gebruikt.

Directe referentie-intervallen
TSH- en FT4-concentraties werden geanalyseerd met behulp van Roche Cobas e601, Abbott Alinity I en Siemens Atellica IM 1300 in het Endocriene Laboratorium van Amsterdam UMC.
Nij Smellinghe Ziekenhuis analyseerde TSH- en FT4-concentraties met behulp van de Beckman Unicel DxI.
DRI's waren gebaseerd op 125 monsters. DRI's werden parametrisch of niet-parametrisch berekend, afhankelijk van de verdeling van de resultaten.
Het 2,5e en 97,5e percentiel en hun 90% betrouwbaarheidsintervallen werden gedefinieerd volgens CLSI 28-A3c met behulp van MedCalc Statistical Software versie 18.5 [ 1 ].

Aangezien TSH en FT4 internationaal doorgaans in serum worden gemeten, terwijl alle deelnemende Nederlandse laboratoria aan dit onderzoek gehepariniseerde plasmamonsters gebruikten, zijn methodevergelijkingen (Passing-Bablok-regressie met behulp van Analyse-it voor Microsoft Excel (versie 2.30)) tussen 69 gepaarde serums en gehepariniseerde serummonsters gebruikt. plasmamonsters werden uitgevoerd om potentiële significante verschillen tussen de twee matrices te bepalen.

Indirecte referentie-intervallen
Methodologie
De indirecte methoden TMC en verfijning zijn gebaseerd op de veronderstelling dat het merendeel van de opgenomen gegevens niet-pathologisch is [ 8 , 9 ].
Beide algoritmen veronderstellen de aanwezigheid van een reeks testresultaten waarbij de bijdrage van pathologische resultaten verwaarloosbaar is, en de verdeling van de niet-pathologische fractie kan effectief worden gemodelleerd met behulp van een Box-Cox-getransformeerde normale verdeling. De modellen worden gedefinieerd door een vermogensparameter λ, gemiddelde µ en standaardafwijking σ.
Voor TMC werd de RI-schatting uitgevoerd zoals beschreven in de TMC Software Manual (versie 13, herziening 15-11-2022). Voor RefineR werd R-pakket RefineR versie 1.6.0 gebruikt.
Voor zowel TMC als RefineR werd een combinatie van Excel en R Statistical Software v. 4.2.1 (Foundation for Statistical Computing, Wenen, Oostenrijk) gebruikt om de uitsluitingsstappen en de analyses uit te voeren.
Er werden tweehonderd bootstraps gebruikt om RI's voor FT4 te schatten met behulp van fineR.
De resulterende histogrammen met voorgestelde referentielimieten (RL's) van TMC en RefineR werden visueel onderzocht en gecontroleerd op foutief gemodelleerde verdelingen. Jaren met foutief gemodelleerde verdelingen werden uitgesloten van daaropvolgende analyses.

Gegevensstabiliteit
De stabiliteit van de testresultaten in de loop van de tijd werd beoordeeld. Details vindt u in de aanvullende materialen en methoden .
Stratificatie
Omdat de populaties voor het schatten van directe (18-79 jaar) en IRI's (18-100 jaar) verschillend waren, hebben we beoordeeld of stratificatie op basis van leeftijd nodig was om direct en indirect geschatte RI's voor TSH of FT4 te vergelijken. Details vindt u in de aanvullende materialen en methoden .

Vooringenomenheid bij reflextesten
Een aantal laboratoria gebruiken reflextesten voor het beoordelen van de schildklierfunctie.
Dit betekent dat de meting van FT4 automatisch wordt geactiveerd wanneer het TSH-resultaat buiten de RI valt.
Het aanvragen van alleen een TSH, een FT4 of de combinatie ongeacht de TSH-uitslag bleef mogelijk.
Om te evalueren of de FT4-dataset van welk laboratorium dan ook vertekend was naar niet-euthyroïde toestanden als gevolg van een hoger percentage hypothyreoïdie en hyperthyreoïdie, hebben we in 2022 laboratorium-IRI’s voor FT4 berekend op basis van een subset van gegevens die alleen FT4-resultaten bevatten van patiënten met normale schildklieraandoeningen. TSH (gebaseerd op de TSH IRI’s in 2022).

Robuustheid van referentie-intervallen op lange termijn
Equivalentielimieten (EL's), zoals beschreven door Haeckel et al ., werden gebruikt om IRI's te vergelijken [ 10 ]. Kortom, EL's worden bepaald door de toelaatbare onzekerheid bij de twee referentiegrenzen van de RI.
Het is gebaseerd op de toelaatbare analytische standaardafwijking afgeleid van de empirische biologische variatie (berekend op basis van de RI). Jaren met RL's die de EL's overtroffen die overeenkomen met de totale mediane RL's werden als niet-robuust beschouwd en werden uitgesloten van daaropvolgende analyses. In dat geval werd een nieuwe mediaan bepaald zonder de niet-robuuste RL’s. Deze procedure werd herhaald totdat geen RL's EL's overtroffen.

Vergelijking van de indirecte en door de fabrikant verstrekte referentie-intervallen met de directe referentie-intervallen
IRI's per fabrikant (mediaan van alle laboratoria) uit 2022 en door de fabrikant geleverde RI's werden vergeleken met DRI's met behulp van bias ratio's (BR's) zoals beschreven door Ozarda et al . [ 11 ].
Kortom, BR's zijn gebaseerd op de toegestane bias op het minimumniveau en mogen niet groter zijn dan 0,375 (minimal bias ratio). Wenselijke (<0,250) en optimale (<0,125) BR's zijn ook gedefinieerd.

Expertbijeenkomstgroep
Er werd een expertmeetinggroep opgericht, bestaande uit klinisch chemici met expertise op het gebied van endocrinologie en datawetenschap van elk van de deelnemende laboratoria.
Deze groep kwam meerdere malen bijeen om de methodologie, resultaten en consequenties van onze bevindingen te bespreken.

Resultaten
Directe referentie-intervallen
TSH gemeten met de Roche Cobas liet een zeer klein relatief verschil zien tussen serum- en gehepariniseerde monsters (4%), wat als klinisch niet significant werd beschouwd. Vergelijkingsgrafieken worden weergegeven in aanvullende figuur 1 .
Resultaten van de directe schatting van RI's zijn opgenomen in Tabel 2 .

Zoals verwacht waren de TSH-verdelingen scheef en werd de niet-parametrische methode gebruikt om de TSH DRI's te definiëren. Roche, Abbott en Beckman lieten normale verdelingen zien voor FT4 (D'Agostino-Pearson-test) en daarom werd de parametrische methode gebruikt om FT4 DRI's te definiëren.
FT4-resultaten verkregen met de Siemens Atellica waren niet normaal verdeeld, waardoor het gebruik van de niet-parametrische methode noodzakelijk was.

Tabel 2:
Vergelijking van de indirecte en directe TSH RI's met de door de fabrikant voorgestelde TSH RI's.
Directe methode (2023) Indirecte methode (2022) Door de fabrikant aanbevolen
19–68 jaar 18–100 jaar 18–60 jaar
LRL (90% BI) URL (90% BI) Mediane LRL (bereik) Mediane URL (bereik) BR LRL BR-URL Mediane LRL (bereik) Mediane URL (bereik) BR LRL BR-URL LRL ULR BR LRL BR-URL
Roche Cobas (n=4) 0.79 (0.60–0.95) 4.79 (4.41–6.46) 0.66 (0.65–0.67) 5.02 (4.86–5.32) 0.127 0.225 0.65 (0.63–0.71) 4.73 (4.64–5.04) 0.137 0.059 0.27 4.20 0.510 0.578
Abbott Alinity (n=3) 0.67 (0.43–0.77) 3.97 (3.82–5.71) 0.55 (0.47–0.56) 4.39 (4.34–5.10) 0.151 0.528 0.56 (0.49–0.57) 4.06 (3.94–4.32) 0.138 0.113 0,35 uur 4,94 een 0.402 1.219
Siemens Atellica (n=4) 0.76 (0.60–0.89) 4.76 (4.40–6.94) 0.66 (0.65–0.67) 5.09 (5.06–5.58) 0.098 0.323 0.66 (0.62–0.67) 4.71 (4.62–5.05) 0.098 0.049 0.55 4.78 0.206 0.020
Beckman DxI (n=2) 0.71 (0.60–0.83) 4.67 (4.27–6.71) 0.64 (0.61–0.66) 5.33 (5.16–5.49) 0.069 0.653 0.64 (0.61–0.67) 4.84 (4.61–5.06) 0.069 0.168 0.38 5.33 0.327 0.653
1. a Abbott geeft een TSH RI op basis van het centrale 99%-interval, in plaats van het reguliere centrale 95%-interval. De Abbott TSH RI op basis van het centrale 95%-interval zou 0,47–3,67 µIE/ml zijn. Bias ratio's voor deze RL's zijn 0,251 (LRL) en 0,377 (URL). BRLRL=LRL−LRL0SDRIBRLRL=LRL− LRL0SDRI , BRURL=URL−URL0SDRIBRURL=URL− URL0SDRI , SDRI=URL0−LRL03.92SDRI=URL0− LRL03.92 , minimale BR<0,375, wenselijke BR<0,250, optimale BR<0,125. LRL, onderste referentielimiet; URL, bovenste referentielimiet; BR, bias-ratio.

Indirecte referentie-intervallen
Gegevensstabiliteit
Bewegende maandelijkse mediane TSH-grafieken ( aanvullende figuur 2 ) gaven de stabiliteit aan van TSH-resultaten over de bestudeerde tijdsperioden in bijna alle laboratoria.
Bewegende maandelijkse mediaangrafieken voor FT4 ( aanvullende figuur 3 ) laten zien dat de FT4-resultaten over het algemeen minder stabiel waren.
Verdere details worden gegeven in de aanvullende materialen en methoden .

Stratificatie
Uit gedetailleerd onderzoek van TSH- en FT4-IRI's voor elk leeftijdsinterval van 10 jaar bleek dat er behoefte is aan stratificatie van de TSH- en FT4-IRI's met een hogere leeftijd.
Vanaf 60 jaar overtroffen de TSH IRI's Els ( aanvullende figuur 4 ).
Voor FT4 overtroffen IRI's de EL's van 70 jaar en ouder ( aanvullende figuur 5 ).
Ter vergelijking werden de leeftijdsgroepen 18–60 en 18–100 gebruikt voor TSH en 18–70 en 18–100 voor FT4.
Meer details vindt u in de aanvullende materialen en methoden .

Robuustheid van referentie-intervallen op lange termijn
Tussen 2008 en 2022 werden ruim zeven miljoen resultaten voor TSH bij volwassenen uit de LIS’s gehaald, waarvan ongeveer 55% afkomstig was van patiënten tussen 18 en 60 jaar oud.
Er werden meer dan 2 miljoen FT4-resultaten voor volwassenen verzameld, waarvan ongeveer 70% afkomstig was van patiënten tussen 18 en 70 jaar oud.
Figuren 1 en 2 tonen de IRI’s in de leeftijdsgroep 18–60 (TSH) of 18–70 (FT4) geclusterd per testplatform (Roche, Abbott, Beckman of Siemens).
Afzonderlijke, niet-robuuste jaren die van de analyses waren uitgesloten, vertoonden vaak overtredingen van de grenswaarden in hetzelfde jaar in de voortschrijdende maandelijkse mediaangrafieken.
Alle mediane TSH IRI's en Roche, Beckman en Siemens FT4 IRI's vertoonden robuustheid op lange termijn tijdens de bestudeerde periode. FT4 IRI's van Abbott vertoonden geen aanhoudende robuustheid. In plaats daarvan vertoonde het een daling gedurende de periode 2013-2015, zoals verwacht op basis van de gegevensstabiliteitsresultaten.

Figuur 1:
Indirecte TSH-referentie-intervallen (RI's) voor de vier fabrikanten gedurende de periodes 2008–2022 (Roche, Abbott en Beckman) of 2014–2022 (Siemens). Individuele laboratorium-indirecte RL's worden weergegeven als enkele punten.
Indirecte RI's worden gedefinieerd door de gemiddelde jaarlijkse LRL's en URL's van de individuele laboratoria (grijs gebied).
Door de fabrikant gekozen RL's worden weergegeven als stippellijnen. RI's geschat door de directe methode worden weergegeven als stippellijnen.

Figuur 2:
Indirecte FT4-referentie-intervallen (RI's) voor de vier fabrikanten (Roche, Abbott, Beckman & Siemens) gedurende de periode 2008-2022.
Individuele laboratorium-indirecte RL's worden weergegeven als enkele punten. Indirecte RI's worden gedefinieerd door de gemiddelde jaarlijkse LRL's en URL's van de individuele laboratoria (grijs gebied).
Door de fabrikant gekozen RL's worden weergegeven als stippellijnen. RI's geschat door de directe methode worden weergegeven als stippellijnen.

Vergelijking van de indirecte en directe referentie-intervallen met de door de fabrikant voorgestelde referentie-intervallen
Tabel 2 (TSH) en Tabel 3 (FT4) tonen de resultaten van de vergelijking van de DRI's, IRI's en de door de fabrikant voorgestelde RI's.
Voor visuele vergelijking suggereerde de fabrikant en werden DRI's opgenomen als horizontale lijnen in figuren 1 en 2 .
TSH IRI-schatting in de leeftijdsgroep 18-60 jaar leverde zeer vergelijkbare resultaten op in vergelijking met de DRI's, met optimale of zelfs wenselijke BR's.
De behoefte aan RI-partitionering wordt weerspiegeld door de verbeterde BR's verkregen met de indirecte methode in de leeftijdsgroep 18-60 jaar vergeleken met die verkregen met de leeftijdsgroep 18-100 jaar.
De door Siemens voorgestelde TSH RI vertoonde goede overeenstemming met DRI's, waarbij BR's onder het wenselijke niveau lagen. Integendeel, de TSH IRI's, zoals voorgesteld door Roche, Abbott en Beckman, overtroffen de minimale BR's niet in vergelijking met de DRI's. FT4 IRI's in de leeftijdsgroep 18-70 en 18-100 jaar behaalden bredere resultaten vergeleken met de DRI's. Het gebruik van de leeftijdsgroep 18-70 jaar verbeterde de vergelijking slechts licht.
Geen van de via de indirecte methode verkregen FT4 RL's overtrof de minimale BR's, behalve de indirecte Siemens FT4 LRL, die een optimale BR liet zien.
FT4-URL's, zoals voorgesteld door Roche, Abbott en Siemens, waren te hoog vergeleken met de directe methode. LRL's en de Beckman-URL lagen dichter bij die verkregen door de directe methode, maar overtroffen niet altijd een minimale BR (Abbott en Beckman).

Tabel 3:
Vergelijking van de indirecte en directe FT4 RI's met de door de fabrikant voorgestelde FT4 RI's.
Directe methode (2023) Indirecte methode (2022) Door de fabrikant aanbevolen
19–68 jaar 18–100 jaar 18–70 jaar 18–70 jaar TSH binnen RI
LRL (90% BI) URL (90% BI) Mediane LRL (bereik) Mediane URL (bereik) BR LRL BR-URL Mediane LRL (bereik) Mediane URL (bereik) BR LRL BR-URL Mediane LRL (bereik) Mediane URL (bereik) BR LRL BR-URL LRL ULR BR LRL BR-URL
Roche Cobas (n=4) 12.6 (12.1–13.1) 19.8 (19.3–20.2) 11.6 (11.3–12.0) 20.8 (20.5–21.2) 0.544 0.544 11.5 (11.4–11.9) 20.6 (20.4–21.0) 0.599 0.436 11.6 (11.4–12.0) 20.2 (19.7–20.9) 0.544 0.218 12 22 0.327 1.198
Abbott Alinity (n=3) 9.6 (9.4–9.9) 13.6 (13.3–13.8) 10.1 (10.1–10.5) 16.5 (15.9–16.7) 0.490 2.842 10,2a ( 9,9-10,4 ) 16.2a ( 15,9-16,6) 0.588 2.548 10,5a ( 10,3-10,6 ) 16.2a ( 15,9-16,5) 0.882 2.548 9.01 b 19,5 b 0.578 5.782
Siemens Atellica (n=4) 12.1 (11.4–12.9) 19.5 (17.9–21.1) 12,0 c (11,7-12,3) 20,9 c (20,2-22,2) 0.053 0.742 12,0 c (11,6-12,3) 20,7 c (20,3-20,7) 0.053 0.636 12.2 (11.8–12.5) 20.7 (20.0–21.4) 0.053 0.636 11.5 22.7 0.318 1.695
Beckman DxI (n=2) 8.6 (8.3–9.0) 13.9 (13.6–14.3) 7.9 (7.8–8.1) 15.3 (15.1–15.4) 0.518 1.035 7.9 (7.8–8.0) 15.0 (14.9–15.0) 0.518 0.814 8.1 (7.9–8.3) 14.5 (14.3–14.7) 0.370 0.444 7.86 14.41 0.547 0.377
1. a n=2, gegevens uit 2022 van laboratorium 9 werden uitgesloten na visuele controle van het fineR-model. b Abbott biedt een FT4 RI gebaseerd op het centrale 99%-interval, in plaats van het reguliere centrale 95%-interval. De Abbott FT4 RI op basis van het centrale 95%-interval zou 10,3–17,8 pmol/l zijn. Bias-ratio's voor deze RL's zijn 0,686 (LRL) en 4,077 (URL). c n=3, gegevens uit 2022 van laboratorium 12 werden uitgesloten na visuele controle van het fineR-model. BRLRL=LRL−LRL0SDRIBRLRL=LRL− LRL0SDRI , BRURL=URL−URL0SDRIBRURL=URL− URL0SDRI , SDRI=URL0−LRL03.92SDRI=URL0− LRL03.92 , minimale BR<0,375, wenselijke BR<0,250, optimale BR<0,125. LRL, onderste referentielimiet; URL, bovenste referentielimiet; BR, bias-ratio.

Discussie
Dit artikel beschrijft onze bevindingen over de robuustheid van TSH- en FT4-RI's, de onnauwkeurigheid van TSH- en FT4-RI's uit de bijsluiters van fabrikanten en de toepasbaarheid van moderne indirecte methoden om TSH- en FT4-RI's te schatten.
We hebben de robuustheid van Roche, Abbott, Beckman en Siemens TSH IRI's gedemonstreerd.
Onze resultaten onthulden ook de robuustheid van de FT4 IRI's van Roche, Beckman en Siemens, terwijl de gegevens van Abbott een daling van de FT4-URL lieten zien in de periode 2013-2015.
Eerder hebben Algeciras-Schimnich et al. hebben gesuggereerd dat lot-tot-lot validatiestudies mogelijk niet voldoende zijn om de robuustheid van TSH- en FT4-resultaten te beoordelen [ 12 , 13 ], wat mogelijk verklaart waarom de daling van de Abbott-resultaten mogelijk over het hoofd is gezien.

Bovendien hebben we onnauwkeurigheden in de TSH- en FT4 RI's uit de bijsluiters van de fabrikant vastgesteld en ontmoedigen we de overdracht van deze RI's naar onze laboratoria vanwege te smal (Roche TSH), te breed (Abbott TSH, Beckman TSH, Roche FT4 en Abbott FT4), te laag (Beckman FT4) of te hoge (Siemens) RI's.
Zoals verwacht leken de LRL en URL van Abbott op basis van het centrale 95%-interval (in plaats van het centrale 99%-interval) meer op de DRI, maar waren ze nog steeds te laag (TSH) of te hoog (FT4).

De TSH IRI's afgeleid van de leeftijdsgroep 18-60 vertoonden uitstekende overeenstemming met de resultaten van de directe methode.
De FT4 IRI’s afgeleid van de leeftijdsgroep van 18-70 jaar zijn breder dan de resultaten uit het directe onderzoek.
De redenen voor deze minder dan optimale FT4 IRI’s zijn mogelijk veelzijdig en omvatten analytische, inter- en intra-individuele variaties, seizoensfluctuaties en dagelijkse variabiliteit en de verdeling van de resultaten, die allemaal verschillen voor TSH en FT4.
Bovendien hebben Ammer et al. toonde aan dat indirecte methoden mogelijk beter presteren dan de directe methode [ 7 ]. Over het geheel genomen vertegenwoordigen IRI's een aanzienlijke verbetering ten opzichte van de door de fabrikant voorgestelde FT4 RI's.
Alarmerend genoeg suggereerde de fabrikant dat de FT4-URL van Abbott bijna 6 pmol/L verschilde van de resultaten verkregen met de directe methode in 2023.
Wanneer de centrale 95% RI van Abbott werd genomen in plaats van de centrale 99% BI aangegeven in de testinformatie van de fabrikant, bleek de de resultaten verschilden nog steeds meer dan 4 pmol/L.
Interessant genoeg overschatte de indirecte methode ook de FT4-URL met 3 pmol/L.

Omdat een ander recent onderzoek ook een daadwerkelijke Abbott FT4 ULN van ongeveer 16 pmol/L aantoonde, veronderstelden we dat dit verschil zou worden veroorzaakt door een tweede snelle daling in de resultaten van de test nabij de URL tussen metingen van de laatste FT4-resultaten voor de IRI's. (2022) en het verzamelen en meten van de monsters voor de DRI’s (2023) [ 14 ].

Vervolgens hebben we 95 monsters opnieuw gemeten die waren verzameld en gemeten in laboratorium 1 in juni 2022 (loten 35506UD00 en 40045UD00), die waren ingevroren bij -80 °C, met nieuwer Abbott-reagens in laboratorium 1 in augustus 2023 (lot 50481UD00). Er werd een proportionele vertekening van 12% gevonden ( aanvullende figuur 6 ).

Om deze resultaten te bevestigen, hebben we in augustus 2023 de monsters in het Endocrien Laboratorium van Amsterdam UMC bovendien gemeten met het meest recente Abbott FT4-reagens.
Hierbij vonden we een significant proportioneel verschil van 16% tussen de twee reagentia, wat betekent dat een aanvankelijke negatieve trend zich voortzette. het waargenomen verschil tussen de indirecte en directe URL's.

De hoeveelheid filterende historische LIS-gegevens die nodig is voordat deze geschikt is voor gebruik in een indirecte methode blijft onderwerp van discussie. Ma et al. hebben twee benaderingen geëvalueerd voor het gebruik van de indirecte methode om IRI's voor TSH en FT4 vast te stellen [ 14 ].
Ze vergeleken een grotendeels ongefilterde dataset met patiëntgegevens die rechtstreeks uit het LIS waren gedownload en een dataset met patiëntgegevens die aan strikte uitsluitingscriteria voldeden.
Beide methoden resulteerden in vergelijkbare resultaten, wat bewijst dat het mogelijk is om IRI's voor TSH en FT4 vast te stellen zonder uitgebreide filtering met behulp van aanvullende uitsluitingscriteria.
We hebben besloten om alle resultaten van herhaalde metingen uit te sluiten, zoals Arzideh et al. toonde aan dat het gebruik van alle gegevens zonder een filterstap resulteert in een aanzienlijke vertekening van de referentielimieten [ 15 ].

Onze bevindingen bevestigen de toepasbaarheid van indirecte methoden met gebruik van minimale filtering om TSH- en FT4-RI's vast te stellen of te valideren.
Een conclusie die al door verschillende onderzoeken werd getrokken, maar geen van deze onderzoeken kwam overeen met de volledigheid van ons onderzoek met gegevens van alle vier de grote fabrikanten, noch beoordeelden ze de robuustheid van TSH- en FT4-IRI's met behulp van historische gegevens.
We hebben een samenvatting gegeven van alle inspanningen om directe of indirecte TSH- en FT4-RI's van 2008 tot 2023 te schatten in aanvullende tabel 1 .

Bohn et al. hebben een zeer vergelijkbare aanpak gebruikt bij hun streven naar RI-harmonisatie voor 16 analyten, waaronder TSH en FT4 [ 10 ].
Voor de TSH-methode werd in Canada een onafhankelijke geharmoniseerde RI plausibel geacht, terwijl de methodespecifieke FT4-resultaten aanzienlijk verschilden.
Onze bevindingen bevestigen deze observaties met betrekking tot FT4-verschillen, maar vonden ook substantiële verschillen tussen de URL van Abbott (4.06) en de URL's van Roche, Beckman en Siemens (respectievelijk 4.73, 4.71 en 4.84).
Dit betekent dat we nog steeds ver verwijderd zijn van geharmoniseerde methode-onafhankelijke RI’s voor TSH en FT4 op basis van onze resultaten en wachten tot de IFCC Working Group for Standardization of Thyroid Function Tests (WG-STFT) de harmonisatie zal bewerkstelligen [ 16 ], [ 17 ]. [ 18 ], [ 19 ].

TSH en, in mindere mate, FT4 vertonen een leeftijdsafhankelijkheid, waarbij de RI zich verbreedt naarmate de leeftijd toeneemt.
Of deze stijging in TSH en FT4 fysiologisch is, een weergave is van schildklierdisfunctie, of de aanwezigheid van comorbiditeiten weerspiegelt, is een vraag waarover voortdurend wordt gedebatteerd [ 20 ].
Niettemin betekent dit dat correcte stratificatie noodzakelijk is om direct en indirect geschatte RI's adequaat te kunnen vergelijken [ 4 ].
We hebben in een ander artikel nagedacht over de implicaties van leeftijdsspecifieke TSH- en FT4-RI's in het laboratorium (Jansen et al., in voorbereiding).

De reden waarom geschikte RI’s essentieel zijn bij de beoordeling van de schildklierfunctie werd aangetoond door Coene et al. [ 21 ]. Ze concludeerden dat TSH- en FT4-RI's toegepast door een individueel laboratorium van invloed zijn op de beoordeling van de schildklierfunctie door de diagnose van subklinische schildklierziekte in Nederland aan te tonen.
Ze toonden aan dat dit een laboratoriumgeïnduceerde aandoening zou kunnen zijn als gevolg van de grote variatie in TSH-concentraties en toegepaste RI's.

We keken naar de diagnoses van openlijke hypo- en hyperthyreoïdie (gebaseerd op de eerste meting per patiënt) en berekenden het aantal nieuwe patiënten bij wie een duidelijke schildklieraandoening werd vastgesteld met de door de fabrikant van Abbott voorgestelde RI’s (TSH: 0,35–4,94 µIU/ml, FT4 : 9,01–19,5 pmol/l) vergeleken met de Abbott IRI's (TSH: 0,57–4,06 µIU/ml, FT4: 10,5–16,2 pmol/l) in de laboratoria die Abbott-assays gebruiken.
Het percentage openlijke diagnoses van hypothyreoïdie steeg van 0,8 naar 3,3%, terwijl het percentage openlijke diagnoses van hyperthyreoïdie toenam van 1,2 naar 3,9%.

Ons onderzoek kent een aantal opmerkelijke beperkingen.
Ten eerste konden we in de datasets geen onderscheid maken tussen niet-zwangere en zwangere vrouwen, ondanks de bekende invloed van zwangerschap op TSH- en FT4-RI’s [ 22 ].
Hoewel we hebben geprobeerd patiënten uit te sluiten die schildkliermedicatie kregen door resultaten van herhaalde metingen uit te sluiten, waren we bovendien niet in staat het succespercentage van deze uitsluiting te kwantificeren.
Nederlandse richtlijnen maken jaarlijkse monitoring van TSH bij stabiele patiënten met schildklieraandoeningen mogelijk, wat betekent dat deze patiënten nog steeds deel kunnen uitmaken van onze datasets.
Met name Jansen et al. heeft aangetoond dat patiënten die levothyroxine gebruiken hogere FT4-concentraties vertonen zonder volledige TSH-suppressie en het is onduidelijk of RefineR deze resultaten classificeert als pathologisch of niet-pathologisch [ 23 ].

Conclusies
Onze bevindingen onderstrepen het belang van voorzichtigheid bij het overwegen van de implementatie van door de fabrikant voorgestelde RI's voor TSH en FT4 in het laboratorium.
We hebben waargenomen dat indirecte schattingen van TSH en FT4 een betere vergelijkbaarheid met DRI's bieden.
Laboratoria moeten hun eigen RI's opstellen die zijn afgestemd op hun specifieke methoden en kenmerken van hun patiëntenpopulatie, of RI's overnemen van een betrouwbaardere bron dan de bijsluiters van de fabrikant.
We raden aan om de RI regelmatig te verifiëren om mogelijke afwijkingen in de resultaten te identificeren en zo onder- of overschatting van schildklieraandoeningen te voorkomen.

1. Onderzoeksethiek: Dit onderzoek werd uitgevoerd in overeenstemming met de Verklaring van Helsinki (zoals herzien in 2013).
2. Geïnformeerde toestemming: Geïnformeerde toestemming werd verkregen van alle personen die aan dit onderzoek deelnamen.
3. Bijdragen van de auteur: De auteurs hebben de verantwoordelijkheid voor de gehele inhoud van dit manuscript aanvaard en de indiening ervan goedgekeurd.
4. Concurrerende belangen: De auteurs verklaren geen belangenverstrengeling.
5. Onderzoeksfinanciering: Geen verklaard.
6. Beschikbaarheid van gegevens: Niet van toepassing.

PDF met aanvullend materiaal (tabellen, figuren:
https://www.degruyter.com/document/doi/ ... pen-access

.