Sekvenční analýza - Sequential analysis

V statistik , sekvenční analýza nebo sekvenční testování hypotéz je statistická analýza , kde se velikost vzorku je stanovena předem. Namísto toho jsou data vyhodnocována, jak jsou shromažďována, a další vzorkování je zastaveno v souladu s předem definovaným pravidlem zastavení , jakmile jsou pozorovány významné výsledky. Proto lze někdy dospět k závěru v mnohem dřívější fázi, než by bylo možné u klasičtějšího testování hypotéz nebo odhadů , a následně s nižšími finančními a/nebo lidskými náklady.

Dějiny

Metoda sekvenční analýzy je nejprve přičítána Abrahamovi Waldovi s Jacobem Wolfowitzem , W. Allenem Wallisem a Miltonem Friedmanem ve skupině pro statistický výzkum Kolumbijské univerzity jako nástroj pro efektivnější kontrolu průmyslové kvality během druhé světové války . Jeho hodnota pro válečné úsilí byla okamžitě uznána a vedla k získání „omezené“ klasifikace . Ve stejné době vedl George Barnard skupinu, která pracovala na optimálním zastavení ve Velké Británii. Další raný příspěvek k metodě provedli KJ Arrow s D. Blackwellem a MA Girshickem.

Podobný přístup byl nezávisle vyvinut z prvních principů přibližně ve stejnou dobu Alan Turing , jako součást techniky Banburismu používané v Bletchley Parku , k testování hypotéz o tom, zda by měly být propojeny a analyzovány různé zprávy kódované německými stroji Enigma . Tato práce zůstala utajena až do začátku 80. let minulého století.

Peter Armitage představil využití sekvenční analýzy v lékařském výzkumu, zejména v oblasti klinických studií. Sekvenční metody se staly v medicíně stále populárnější po práci Stuarta Pococka, která poskytla jasná doporučení, jak kontrolovat chybovost typu 1 v sekvenčních návrzích.

Alfa výdajové funkce

Když výzkumníci opakovaně analyzují data a přidávají se další pozorování, zvyšuje se pravděpodobnost chyby typu 1 . Proto je důležité při každé průběžné analýze upravit hladinu alfa, aby celková míra chyb typu 1 zůstala na požadované úrovni. To je koncepčně podobné použití Bonferroniho korekce , ale protože opakované pohledy na data jsou závislé, lze použít efektivnější korekce pro hladinu alfa. Mezi nejranější návrhy patří Pocockova hranice . Existují alternativní způsoby kontroly míry chyb typu 1, jako jsou hranice Haybittle-Peto , a další práce na určování hranic pro průběžné analýzy provedly společnosti O'Brien & Fleming a Wang & Tsiatis.

Omezení oprav, jako je Pocockova hranice, spočívá v tom, že počet pohledů na data musí být určen před shromažďováním dat a že pohledy na data by měly být rovnoměrně rozmístěny (např. Po 50, 100, 150 a 200 pacientů). Přístup funkce alfa výdajů vyvinutý společností Demets & Lan tato omezení nemá a v závislosti na parametrech zvolených pro funkci utrácení může být velmi podobný hranicím Pococka nebo opravám navrženým O'Brienem a Flemingem.

Aplikace sekvenční analýzy

Klinické testy

V randomizované studii se dvěma léčebnými skupinami může být skupinové sekvenční testování provedeno například následujícím způsobem: Poté, co je v každé skupině k dispozici n subjektů, je provedena průběžná analýza. Statistický test se provede za účelem srovnání obou skupin a pokud je nulová hypotéza zamítnuta, pokus je ukončen; v opačném případě pokus pokračuje, najme se dalších n subjektů na skupinu a znovu se provede statistický test, včetně všech subjektů. Pokud je hodnota null zamítnuta, zkouška je ukončena a v opačném případě pokračuje v pravidelných hodnoceních, dokud nebude proveden maximální počet průběžných analýz. V tomto okamžiku se provede poslední statistický test a pokus se přeruší.

Další aplikace

Sekvenční analýza má také souvislost s problémem zkázy hazardních hráčů, který mimo jiné studoval Huygens v roce 1657.

Kroková detekce je proces hledání náhlých změn střední úrovně časové řady nebo signálu. Obvykle je považován za speciální druh statistické metody známé jako detekce bodu změny . Krok je často malý a časové řady jsou poškozeny nějakým druhem šumu, což činí problém náročným, protože krok může být hlukem skryt. Proto jsou často vyžadovány statistické a/nebo algoritmy pro zpracování signálu. Když jsou algoritmy spuštěny online, když přicházejí data, zejména s cílem vytvořit výstrahu, jedná se o aplikaci sekvenční analýzy.

Zaujatost

Zkoušky, které jsou ukončeny předčasně, protože odmítají nulovou hypotézu, obvykle nadhodnocují skutečnou velikost efektu. Důvodem je, že v malých vzorcích pouze velké odhady velikosti účinku povedou k významnému účinku a následnému ukončení zkoušky. Byly navrženy metody pro opravu odhadů velikosti účinku v jednotlivých studiích. Všimněte si, že tato předpojatost je hlavně problematická při interpretaci jednotlivých studií. V metaanalýzách jsou nadhodnocené velikosti účinku v důsledku předčasného zastavení vyváženy podhodnocením ve studiích, které se zastaví pozdě, což vedlo společnost Schou & Marschner k závěru, že „předčasné ukončení klinických studií není podstatným zdrojem zaujatosti v metaanalýzách“.

Význam hodnot p v sekvenčních analýzách se také mění, protože při použití sekvenčních analýz se provádí více než jedna analýza a je třeba předefinovat typickou definici hodnoty p jako dat „alespoň tak extrémních“, jak jsou pozorovány . Jedním z řešení je objednat p-hodnoty řady sekvenčních testů na základě času zastavení a toho, jak vysoká byla statistika testu při daném pohledu, což je známé jako postupné řazení, nejprve navržené Armitage .

Viz také

Poznámky

Reference

externí odkazy

Komerční