07.10.2021

Intervaly spoľahlivosti. Pravdepodobnosť spoľahlivosti a interval spoľahlivosti Interval spoľahlivosti predstavuje v štatistike


Pre veľkú väčšinu jednoduchých meraní je celkom dobre splnený takzvaný normálny zákon náhodných chýb ( Gaussov zákon), odvodené z nasledujúcich empirických ustanovení.

1) chyby merania môžu mať súvislý rad hodnôt;

2) pri veľkom počte meraní sa rovnako často vyskytujú chyby rovnakej veľkosti, ale iného znamienka,

3) čím väčšia náhodná chyba, tým nižšia je pravdepodobnosť jej výskytu.

Graf normálneho Gaussovho rozdelenia je na obr.1. Krivková rovnica má tvar

kde je distribučná funkcia náhodných chýb (chýb), ktorá charakterizuje pravdepodobnosť chyby, σ je stredná kvadratická chyba.

Hodnota σ nie je náhodná veličina a charakterizuje proces merania. Ak sa podmienky merania nezmenia, potom σ zostáva konštantné. Druhá mocnina tejto veličiny je tzv rozptyl meraní.Čím menší rozptyl, tým menší rozptyl jednotlivých hodnôt a tým vyššia presnosť merania.

Presná hodnota strednej kvadratúry chyby σ, ako aj skutočná hodnota meranej veličiny nie je známa. Existuje takzvaný štatistický odhad tohto parametra, podľa ktorého sa stredná štvorcová chyba rovná strednej štvorcovej chybe aritmetického priemeru. Hodnota ktorej je určená vzorcom

kde je vysledok i-tá dimenzia; - aritmetický priemer získaných hodnôt; n je počet meraní.

Čím väčší je počet meraní, tým menší a viac sa približuje k σ. Ak je skutočná hodnota meranej veličiny μ, jej aritmetický priemer získaný ako výsledok meraní a náhodná absolútna chyba, potom sa výsledok merania zapíše ako .

Volá sa interval hodnôt od do, do ktorého spadá skutočná hodnota meranej veličiny μ interval spoľahlivosti. Keďže ide o náhodnú premennú, skutočná hodnota spadá do intervalu spoľahlivosti s pravdepodobnosťou α, ktorá je tzv pravdepodobnosť spoľahlivosti, alebo spoľahlivosť merania. Táto hodnota sa číselne rovná ploche tieňovaného krivočiareho lichobežníka. (pozri obrázok.)

Toto všetko je dostatočne spravodlivé Vysoké číslo merania, keď je blízko σ. Nájsť interval spoľahlivosti a úroveň spoľahlivosti pre malý počet meraní, ktorým sa venujeme pri vykonávaní laboratórne práce, použitý Študentovo rozdelenie pravdepodobnosti. Ide o rozdelenie pravdepodobnosti náhodnej premennej tzv Študentský koeficient, udáva hodnotu intervalu spoľahlivosti v zlomkoch strednej kvadratickej chyby aritmetického priemeru.


Rozdelenie pravdepodobnosti tejto veličiny nezávisí od σ 2, ale v podstate závisí od počtu experimentov n. S nárastom počtu experimentov nŠtudentovo rozdelenie má tendenciu ku Gaussovmu rozdeleniu.

Distribučná funkcia je tabuľková (tabuľka 1). Hodnota Studentovho koeficientu je v priesečníku priamky zodpovedajúcej počtu meraní n a stĺpec zodpovedajúci hladine spoľahlivosti α

Odoberaním vzorky z populácie získame bodový odhad parametra, ktorý nás zaujíma, a vypočítame štandardnú chybu, aby sme naznačili presnosť odhadu.

Vo väčšine prípadov však štandardná chyba ako taká nie je prijateľná. Je oveľa užitočnejšie kombinovať túto mieru presnosti s intervalovým odhadom pre parameter populácie.

Dá sa to urobiť pomocou znalosti teoretickej pravdepodobnosti rozdelenia štatistických údajov vzorky (parametra) s cieľom vypočítať interval spoľahlivosti (CI - Interval spoľahlivosti, DI - Interval spoľahlivosti) pre parameter.

Vôbec, interval spoľahlivosti rozširuje odhady v oboch smeroch o určitý násobok štandardnej chyby (daného parametra); dve hodnoty (limity spoľahlivosti), ktoré definujú interval, sú zvyčajne oddelené čiarkou a uzavreté v zátvorkách.

V štatistike a interval spoľahlivosti(CI) je typ intervalového odhadu parametra populácie. Je to pozorovaný interval (t. j. vypočítaný z pozorovaní), v princípe odlišný od vzorky k vzorke, ktorý často zahŕňa hodnotu nepozorovateľného parametra záujmu, ak sa experiment opakuje. Ako často sledovaný interval obsahuje parameter je určené úrovňou spoľahlivosti alebo koeficientom spoľahlivosti. Presnejšie povedané, význam termínu „úroveň spoľahlivosti“ je taký, že ak je CI konštruovaná naprieč mnohými samostatnými analýzami údajov z replikovaných (a možno odlišných) experimentov, podiel takýchto intervalov, ktoré obsahujú skutočnú hodnotu parametra, sa bude zhodovať s daným úroveň sebavedomia. Zatiaľ čo obojstranné medze spoľahlivosti tvoria interval spoľahlivosti, ich jednostranné náprotivky sa označujú ako dolné/horné medze spoľahlivosti (alebo limity).


Interval spoľahlivosti ukazuje, v akom rozsahu sa budú nachádzať výsledky výberových pozorovaní (prieskumov). Ak vykonáme 100 identických prieskumov v identických vzorkách z jednej populácie (napríklad 100 vzoriek po 1 000 ľuďoch v meste s 5 miliónmi obyvateľov), potom na úrovni spoľahlivosti 95 % bude 95 zo 100 výsledkov spadať do interval spoľahlivosti (napríklad od 28 % do 32 % so skutočnou hodnotou 30 %). Napríklad skutočný počet obyvateľov mesta, ktorí fajčia, je 30 %. Ak vyberieme 1000 ľudí 100-krát za sebou a v týchto vzorkách položíme otázku „Fajčíš?“, v 95 z týchto 100 vzoriek s 2 % intervalom spoľahlivosti bude hodnota od 28 % do 32 %.

Vzorce na zostavenie intervalov spoľahlivosti s praktické príklady možno nájsť napríklad .

Interpretácia intervalov spoľahlivosti

Pri interpretácii intervalu spoľahlivosti nás zaujímajú nasledujúce otázky:

Aký široký je interval spoľahlivosti?

Široký interval spoľahlivosti naznačuje, že odhad je nepresný; úzky označuje dobrý odhad.
Šírka intervalu spoľahlivosti závisí od veľkosti štandardnej chyby, ktorá zase závisí od veľkosti vzorky a pri posudzovaní numerickej premennej z variability údajov poskytuje širšie intervaly spoľahlivosti ako štúdie veľkého súboru údajov. niekoľkých premenných.

Obsahuje KI nejaké hodnoty, ktoré sú mimoriadne zaujímavé?

Môžete skontrolovať, či pravdepodobná hodnota parametra populácie spadá do intervalu spoľahlivosti. Ak áno, potom výsledky zodpovedajú tejto pravdepodobnej hodnote. Ak nie, potom je nepravdepodobné (pre 95 % interval spoľahlivosti je šanca takmer 5 %), že parameter má túto hodnotu. ()

Interval spoľahlivosti k nám prišiel z oblasti štatistiky. Ide o definovaný rozsah, ktorý slúži na odhad neznámeho parametra s vysokou mierou spoľahlivosti. Najjednoduchšie sa to dá vysvetliť na príklade.

Predpokladajme, že potrebujete preskúmať nejakú náhodnú premennú, napríklad rýchlosť odpovede servera na požiadavku klienta. Zakaždým, keď používateľ zadá adresu konkrétnej lokality, server odpovie s iná rýchlosť. Skúmaný čas odozvy má teda náhodný charakter. Interval spoľahlivosti vám teda umožňuje určiť hranice tohto parametra a potom bude možné tvrdiť, že s pravdepodobnosťou 95% bude server v rozsahu, ktorý sme vypočítali.

Alebo potrebujete zistiť, koľko ľudí o tom vie ochranná známka firmy. Pri výpočte intervalu spoľahlivosti bude možné napríklad povedať, že s 95 % pravdepodobnosťou sa podiel spotrebiteľov, ktorí o tom vedia, pohybuje v rozmedzí od 27 % do 34 %.

S týmto pojmom úzko súvisí taká hodnota ako úroveň spoľahlivosti. Predstavuje pravdepodobnosť, že požadovaný parameter je zahrnutý v intervale spoľahlivosti. Táto hodnota určuje, aký veľký bude náš požadovaný rozsah. Čím je hodnota väčšia, tým je interval spoľahlivosti užší a naopak. Zvyčajne je nastavená na 90 %, 95 % alebo 99 %. Najpopulárnejšia je hodnota 95 %.

Tento ukazovateľ je tiež ovplyvnený rozptylom pozorovaní a jeho definícia je založená na predpoklade, že skúmaný prvok sa riadi.Toto tvrdenie je známe aj ako Gaussov zákon. Takéto rozdelenie všetkých pravdepodobností spojitej náhodnej veličiny, ktoré možno opísať hustotou pravdepodobnosti, sa podľa neho nazýva normálne. Ak je predpoklad o normálne rozdelenie sa ukázalo ako chybné, potom môže byť odhad nesprávny.

Po prvé, poďme zistiť, ako vypočítať interval spoľahlivosti pre Tu sú možné dva prípady. Disperzia (stupeň šírenia náhodnej premennej) môže, ale nemusí byť známa. Ak je známy, potom sa náš interval spoľahlivosti vypočíta pomocou nasledujúceho vzorca:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - znak,

t je parameter z Laplaceovej distribučnej tabuľky,

σ je druhá odmocnina disperzie.

Ak je rozptyl neznámy, možno ho vypočítať, ak poznáme všetky hodnoty požadovanej funkcie. Na tento účel sa používa nasledujúci vzorec:

σ2 = х2ср - (хр)2, kde

х2ср - priemerná hodnota druhých mocnín študovaného znaku,

(xsr)2 je druhá mocnina tejto funkcie.

Vzorec, podľa ktorého sa počíta interval spoľahlivosti, sa v tomto prípade mierne mení:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - vzorový priemer,

α - znak,

t je parameter, ktorý sa nachádza pomocou Študentovej distribučnej tabuľky t \u003d t (ɣ; n-1),

sqrt(n) je druhá odmocnina z celkovej veľkosti vzorky,

s je druhá odmocnina z rozptylu.

Zvážte tento príklad. Predpokladajme, že na základe výsledkov 7 meraní bol študovaný znak určený na 30 a rozptyl vzorky rovný 36. Je potrebné nájsť s pravdepodobnosťou 99% interval spoľahlivosti, ktorý obsahuje skutočnú hodnotu meraný parameter.

Najprv určme, čomu sa t rovná: t \u003d t (0,99; 7-1) \u003d 3,71. Pomocou vyššie uvedeného vzorca dostaneme:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 – 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Interval spoľahlivosti pre rozptyl sa vypočíta tak v prípade známeho priemeru, ako aj vtedy, keď neexistujú údaje o matematickom očakávaní a je známa iba hodnota nezaujatého bodového odhadu rozptylu. Nebudeme tu uvádzať vzorce na jeho výpočet, pretože sú dosť zložité a v prípade potreby sa dajú vždy nájsť na internete.

Upozorňujeme len, že je vhodné určiť interval spoľahlivosti pomocou programu Excel alebo sieťovej služby, ktorá sa tak nazýva.

V predchádzajúcich podkapitolách sme sa zaoberali otázkou odhadu neznámeho parametra A jedno číslo. Takéto hodnotenie sa nazýva „bod“. V mnohých úlohách je potrebné nielen nájsť parameter A vhodnú číselnú hodnotu, ale aj zhodnotiť jej presnosť a spoľahlivosť. Je potrebné vedieť, k akým chybám môže zámena parametrov viesť A jeho bodový odhad A a s akou mierou istoty môžeme očakávať, že tieto chyby nepresiahnu známe hranice?

Problémy tohto druhu sú relevantné najmä pre malý počet pozorovaní, keď bodový odhad a v je z veľkej časti náhodný a približné nahradenie a za a môže viesť k vážnym chybám.

Aby ste získali predstavu o presnosti a spoľahlivosti odhadu A,

v matematickej štatistike sa používajú takzvané intervaly spoľahlivosti a pravdepodobnosti spoľahlivosti.

Nech pre parameter A odvodené zo skúseností nestranný odhad A. V tomto prípade chceme odhadnúť možnú chybu. Priraďme nejakú dostatočne veľkú pravdepodobnosť p (napríklad p = 0,9, 0,95 alebo 0,99) takú, že udalosť s pravdepodobnosťou p možno považovať za prakticky istú a nájdime hodnotu s, pre ktorú

Potom rozsah prakticky možných hodnôt chyby, ktorá sa vyskytuje pri výmene A na A, bude ± s; veľké absolútne chyby sa objavia len s malou pravdepodobnosťou a = 1 - p. Prepíšme (14.3.1) ako:

Rovnosť (14.3.2) znamená, že s pravdepodobnosťou p je neznáma hodnota parametra A spadá do intervalu

V tomto prípade si treba uvedomiť jednu okolnosť. Predtým sme opakovane zvažovali pravdepodobnosť, že náhodná premenná spadne do daného nenáhodného intervalu. Tu je situácia iná: A nie náhodný, ale náhodný interval / r. Náhodne jeho poloha na osi x, určená jeho stredom A; vo všeobecnosti je dĺžka intervalu 2s tiež náhodná, pretože hodnota s sa vypočítava spravidla z experimentálnych údajov. Preto by v tomto prípade bolo lepšie interpretovať hodnotu p nie ako pravdepodobnosť „trafenia“ bodu A do intervalu / p, ale ako pravdepodobnosť, že náhodný interval / p pokryje bod A(obr. 14.3.1).

Ryža. 14.3.1

Pravdepodobnosť p sa nazýva úroveň sebavedomia a interval / p - interval spoľahlivosti. Hranice intervalov ak. a x \u003d a- s a a 2 = a + a sú povolaní hranice dôvery.

Uveďme ešte jeden výklad pojmu interval spoľahlivosti: možno ho považovať za interval hodnôt parametrov A, kompatibilné s experimentálnymi údajmi a nie sú v rozpore s nimi. Ak totiž súhlasíme s tým, že udalosť s pravdepodobnosťou a = 1-p považujeme za prakticky nemožnú, potom tie hodnoty parametra a, pre ktoré a - a> s musia byť uznané ako odporujúce experimentálnym údajom a tým, pre ktoré |a - A a t na 2.

Nech pre parameter A existuje nestranný odhad A. Keby sme poznali zákon rozdelenia množstva A, problém nájdenia intervalu spoľahlivosti by bol celkom jednoduchý: stačilo by nájsť hodnotu s, pre ktorú

Problém spočíva v tom, že distribučný zákon odhadu A závisí od zákona rozdelenia množstva X a následne na jeho neznáme parametre (najmä na samotný parameter A).

Na obídenie tohto problému je možné použiť nasledujúci približne približný trik: nahraďte neznáme parametre vo výraze pre s ich bodovými odhadmi. S pomerne veľkým počtom experimentov P(asi 20 ... 30) táto technika zvyčajne poskytuje uspokojivé výsledky z hľadiska presnosti.

Ako príklad uvažujme problém intervalu spoľahlivosti pre matematické očakávania.

Nechajte vyrobiť P X, ktorých charakteristikou je matematické očakávanie T a rozptyl D- neznámy. Pre tieto parametre sa získali tieto odhady:

Je potrebné vytvoriť interval spoľahlivosti / р, zodpovedajúci pravdepodobnosti spoľahlivosti р, pre matematické očakávanie T množstvá X.

Pri riešení tohto problému využívame fakt, že množstvo T je suma P nezávislé identicky rozdelené náhodné premenné X h a podľa centrálnej limitnej vety pre dostatočne veľké P jeho distribučný zákon je blízky normálu. V praxi aj pri relatívne malom počte členov (rádovo 10 ... 20) možno distribučný zákon súčtu považovať približne za normálny. Budeme predpokladať, že hodnota T distribuované podľa bežného zákona. Charakteristiky tohto zákona – matematické očakávanie a rozptyl – sú rovnaké, resp T A

(pozri kapitolu 13 pododdiel 13.3). Predpokladajme, že hodnota D je nám známy a nájdeme takú hodnotu Ep, pre ktorú

Použitím vzorca (6.3.5) z kapitoly 6 vyjadríme pravdepodobnosť na ľavej strane (14.3.5) z hľadiska funkcie normálneho rozdelenia

kde je štandardná odchýlka odhadu T.

Z rovnice

nájdite hodnotu Sp:

kde arg Ф* (x) je inverzná funkcia k Ф* (X), tie. taká hodnota argumentu, pre ktorú sa funkcia normálneho rozdelenia rovná X.

Disperzia D, prostredníctvom ktorého sa hodnota vyjadruje A 1P, nevieme presne; ako jeho približnú hodnotu môžete použiť odhad D(14.3.4) a uveďte približne:

Problém konštrukcie intervalu spoľahlivosti je teda približne vyriešený, čo sa rovná:

kde gp je definované vzorcom (14.3.7).

Aby sa predišlo spätnej interpolácii v tabuľkách funkcie Ф * (l) pri výpočte s p, je vhodné zostaviť špeciálnu tabuľku (tabuľka 14.3.1), v ktorej sú uvedené hodnoty množstva

v závislosti od r. Hodnota (p určuje pre normálny zákon počet smerodajných odchýlok, ktoré je potrebné vyčleniť napravo a naľavo od stredu disperzie, aby sa pravdepodobnosť pádu do výslednej oblasti rovnala p.

Prostredníctvom hodnoty 7 p je interval spoľahlivosti vyjadrený ako:

Tabuľka 14.3.1

Príklad 1. Na hodnote sa uskutočnilo 20 experimentov X; výsledky sú uvedené v tabuľke. 14.3.2.

Tabuľka 14.3.2

Je potrebné nájsť odhad pre matematické očakávanie množstva X a zostrojte interval spoľahlivosti zodpovedajúci úrovni spoľahlivosti p = 0,8.

Riešenie. Máme:

Voľbou počiatku n: = 10 podľa tretieho vzorca (14.2.14) nájdeme nezaujatý odhad D :

Podľa tabuľky 14.3.1 nájdeme

Hranice spoľahlivosti:

Interval spoľahlivosti:

Hodnoty parametrov T, ležiace v tomto intervale sú kompatibilné s experimentálnymi údajmi uvedenými v tabuľke. 14.3.2.

Podobným spôsobom možno skonštruovať interval spoľahlivosti pre rozptyl.

Nechajte vyrobiť P nezávislé experimenty na náhodnej premennej X s neznámymi parametrami od a A, a pre rozptyl D nestranný odhad sa získa:

Je potrebné približne vytvoriť interval spoľahlivosti pre rozptyl.

Zo vzorca (14.3.11) je zrejmé, že hodnota D predstavuje

čiastka P náhodné premenné formulára . Tieto hodnoty nie sú

nezávislé, pretože ktorýkoľvek z nich zahŕňa množstvo T, závislý na všetkých ostatných. Dá sa však ukázať, že ako P distribučný zákon ich súčtu je tiež blízky normálu. Takmer o P= 20...30 to už možno považovať za normálne.

Predpokladajme, že je to tak, a nájdime charakteristiky tohto zákona: matematické očakávanie a rozptyl. Od skóre D- teda nezaujatý M[D] = D.

Výpočet rozptylu D D je spojená s pomerne zložitými výpočtami, takže jej vyjadrenie uvádzame bez odvodenia:

kde c 4 - štvrtý centrálny moment veličiny X.

Ak chcete použiť tento výraz, musíte v ňom nahradiť hodnoty 4 a D(aspoň približné). Namiesto D môžete použiť hodnotenie D. V zásade môže byť štvrtý centrálny moment nahradený aj jeho odhadom, napríklad hodnotou tvaru:

ale takáto náhrada poskytne extrémne nízku presnosť, pretože vo všeobecnosti sa pri obmedzenom počte experimentov určujú momenty vysokého rádu s veľkými chybami. V praxi sa však často stáva, že tvar distribučného zákona množstva X vopred známy: neznáme sú len jeho parametre. Potom sa môžeme pokúsiť vyjadriť u4 v termínoch D.

Zoberme si najbežnejší prípad, keď hodnota X distribuované podľa bežného zákona. Potom sa jeho štvrtý centrálny moment vyjadrí pomocou rozptylu (pozri kapitolu 6 pododdiel 6.2);

a vzorec (14.3.12) dáva alebo

Nahradenie v (14.3.14) neznámeho D jeho hodnotenie D, dostávame: odkiaľ

Okamih u 4 možno vyjadriť v termínoch D aj v niektorých iných prípadoch, keď rozdelenie množstva X nie je normálne, ale jeho vzhľad je známy. Napríklad pre zákon rovnomernej hustoty (pozri kapitolu 5) máme:

kde (a, P) je interval, na ktorom je daný zákon.

teda

Podľa vzorca (14.3.12) dostaneme: odkiaľ nájdeme približne

V prípadoch, keď nie je známa forma zákona o rozdelení hodnoty 26, sa pri odhade hodnoty a/ stále odporúča použiť vzorec (14.3.16), ak neexistujú žiadne osobitné dôvody domnievať sa, že zákon je veľmi odlišný od bežného (má znateľný kladný alebo záporný hrot).

Ak sa približná hodnota a /) získa tak či onak, potom je možné zostrojiť interval spoľahlivosti pre rozptyl rovnakým spôsobom, ako sme ho vytvorili pre matematické očakávanie:

kde hodnota závislá od danej pravdepodobnosti p sa nachádza v tabuľke. 14.3.1.

Príklad 2. Nájdite približne 80% interval spoľahlivosti pre rozptyl náhodnej premennej X za podmienok príkladu 1, ak je známe, že hodnota X distribuované podľa zákona blízkeho normálu.

Riešenie. Hodnota zostáva rovnaká ako v tabuľke. 14.3.1:

Podľa vzorca (14.3.16)

Podľa vzorca (14.3.18) zistíme interval spoľahlivosti:

Zodpovedajúci rozsah hodnôt štandardnej odchýlky: (0,21; 0,29).

14.4. Presné metódy konštrukcie intervalov spoľahlivosti pre parametre náhodnej premennej rozloženej podľa normálneho zákona

V predchádzajúcej podkapitole sme uvažovali o zhruba približných metódach konštrukcie intervalov spoľahlivosti pre priemer a rozptyl. Tu uvádzame predstavu o presných metódach riešenia rovnakého problému. Zdôrazňujeme, že pre presné nájdenie intervalov spoľahlivosti je bezpodmienečne nutné vopred poznať formu zákona o rozdelení množstva X, keďže to nie je potrebné na aplikáciu približných metód.

Myšlienka presných metód na zostavenie intervalov spoľahlivosti je nasledovná. Akýkoľvek interval spoľahlivosti sa zistí z podmienky vyjadrujúcej pravdepodobnosť splnenia určitých nerovností, medzi ktoré patrí aj odhad, ktorý nás zaujíma A. Zákon o rozdelení stupňov A vo všeobecnom prípade závisí od neznámych parametrov veličiny X. Niekedy je však možné prejsť v nerovnostiach z náhodnej premennej A na nejakú inú funkciu pozorovaných hodnôt X p X 2, ..., X str. ktorého distribučný zákon nezávisí od neznámych parametrov, ale závisí len od počtu pokusov a od tvaru distribučného zákona množstva X. Náhodné premenné tohto druhu hrajú veľkú úlohu v matematickej štatistike; boli najpodrobnejšie študované pre prípad normálneho rozdelenia množstva X.

Napríklad bolo dokázané, že pri normálnom rozdelení množstva X náhodná hodnota

podliehať tzv Študentov distribučný zákon s P- 1 stupeň voľnosti; hustota tohto zákona má tvar

kde G(x) je známa funkcia gama:

Je tiež dokázané, že náhodná premenná

má "distribúciu % 2" s P- 1 stupeň voľnosti (pozri kapitolu 7), ktorého hustota je vyjadrená vzorcom

Bez toho, aby sme sa zaoberali deriváciami rozdelení (14.4.2) a (14.4.4), ukážeme, ako ich možno použiť pri konštrukcii intervalov spoľahlivosti pre parametre Ty D.

Nechajte vyrobiť P nezávislé experimenty na náhodnej premennej X, rozdelené podľa normálneho zákona s neznámymi parametrami TIO. Pre tieto parametre, odhady

Je potrebné zostrojiť intervaly spoľahlivosti pre oba parametre zodpovedajúce pravdepodobnosti spoľahlivosti p.

Najprv zostrojme interval spoľahlivosti pre matematické očakávanie. Je prirodzené brať tento interval symetrický vzhľadom na T; označme s p polovicu dĺžky intervalu. Hodnota sp musí byť zvolená tak, aby bola splnená podmienka

Skúsme prejsť na ľavú stranu rovnosti (14.4.5) z náhodnej premennej T na náhodnú premennú T, distribuované podľa študentského zákona. Aby sme to dosiahli, vynásobíme obe časti nerovnosti |m-w?|

na kladnú hodnotu: alebo pomocou zápisu (14.4.1),

Nájdite číslo / p také, že hodnotu / p možno nájsť z podmienky

Zo vzorca (14.4.2) je zrejmé, že (1) je párna funkcia, takže (14.4.8) dáva

Rovnosť (14.4.9) určuje hodnotu / p v závislosti od p. Ak máte k dispozícii tabuľku integrálnych hodnôt

potom hodnotu / p možno nájsť reverznou interpoláciou v tabuľke. Je však pohodlnejšie zostaviť tabuľku hodnôt / p vopred. Takáto tabuľka je uvedená v prílohe (tabuľka 5). Táto tabuľka zobrazuje hodnoty v závislosti od pravdepodobnosti spoľahlivosti p a počtu stupňov voľnosti P- 1. Po určení / p podľa tabuľky. 5 a za predpokladu

nájdeme polovičnú šírku intervalu spoľahlivosti / p a samotný interval

Príklad 1. Uskutočnilo sa 5 nezávislých experimentov s náhodnou premennou X, normálne distribuované s neznámymi parametrami T a o. Výsledky experimentov sú uvedené v tabuľke. 14.4.1.

Tabuľka 14.4.1

Nájdite odhad T pre matematické očakávanie a zostrojte preň 90 % interval spoľahlivosti / p (t. j. interval zodpovedajúci pravdepodobnosti spoľahlivosti p \u003d 0,9).

Riešenie. Máme:

Podľa tabuľky 5 žiadosti o P - 1 = 4 a p = 0,9 nájdeme kde

Interval spoľahlivosti bude

Príklad 2. Pre podmienky príkladu 1 pododdielu 14.3, za predpokladu hodnoty X normálne rozložené, nájdite presný interval spoľahlivosti.

Riešenie. Podľa tabuľky 5 prihlášky nájdeme na P - 1 = 19ir =

0,8 / p = 1,328; odtiaľ

Pri porovnaní s riešením z príkladu 1 pododdielu 14.3 (e p = 0,072) vidíme, že nezrovnalosť je veľmi malá. Ak dodržíme presnosť na dve desatinné miesta, potom sú intervaly spoľahlivosti zistené presnou a približnou metódou rovnaké:

Prejdime ku konštrukcii intervalu spoľahlivosti pre rozptyl. Zvážte nezaujatý odhad rozptylu

a vyjadriť náhodnú premennú D cez hodnotu V(14.4.3) s rozdelením x 2 (14.4.4):

Poznať distribučný zákon množstva V, je možné nájsť interval / (1 ), do ktorého spadá s danou pravdepodobnosťou p.

distribučný zákon k n _ x (v) hodnota I7 má tvar znázornený na obr. 14.4.1.

Ryža. 14.4.1

Vynára sa otázka: ako zvoliť interval / p? Ak zákon o rozdelení množstva V bol symetrický (ako normálny zákon alebo Studentovo rozdelenie), bolo by prirodzené brať interval /p symetrický vzhľadom na matematické očakávanie. V tomto prípade zákon k n _ x (v) asymetrické. Dohodneme sa, že interval /p zvolíme tak, aby boli pravdepodobnosti výstupu veličiny V mimo intervalu vpravo a vľavo (tieňované oblasti na obr. 14.4.1) boli rovnaké a rovnaké

Na vytvorenie intervalu / p s touto vlastnosťou použijeme tabuľku. 4 aplikácie: obsahuje čísla y) také že

pre množstvo V, s x 2 -distribúciou s r stupňami voľnosti. V našom prípade r = n- 1. Opraviť r = n- 1 a nájdite v príslušnom riadku tabuľky. 4 dve hodnoty x 2 - jedna zodpovedá pravdepodobnosti druhá - pravdepodobnosti Označme tieto

hodnoty o 2 A xl? Interval má y 2,ľavou stranou a y~ pravý koniec.

Teraz nájdeme požadovaný interval spoľahlivosti /| pre rozptyl s hranicami D, a D2, ktorý pokrýva pointu D s pravdepodobnosťou p:

Zostrojme taký interval / (, = (?> b A), ktorý pokrýva bod D vtedy a len vtedy, ak hodnota V spadá do intervalu / r. Ukážme, že interval

spĺňa túto podmienku. Pravdaže, nerovnosti sú ekvivalentné nerovnostiam

a tieto nerovnosti platia s pravdepodobnosťou p. Tak sa zistí interval spoľahlivosti pre disperziu a vyjadrí sa vzorcom (14.4.13).

Príklad 3. Nájdite interval spoľahlivosti pre rozptyl za podmienok príkladu 2 pododdielu 14.3, ak je známe, že hodnota X distribuované normálne.

Riešenie. Máme . Podľa tabuľky 4 prihlášky

nájdeme na r = n - 1 = 19

Podľa vzorca (14.4.13) nájdeme interval spoľahlivosti pre rozptyl

Zodpovedajúci interval pre štandardnú odchýlku: (0,21; 0,32). Tento interval len mierne presahuje interval (0,21; 0,29) získaný v príklade 2 pododdielu 14.3 približnou metódou.

  • Obrázok 14.3.1 uvažuje interval spoľahlivosti, ktorý je symetrický okolo a. Vo všeobecnosti, ako uvidíme neskôr, to nie je potrebné.
Aktualizované: 3. marca 2020
Príklad súboru

Zostavme si v MS EXCEL interval spoľahlivosti pre odhad strednej hodnoty rozdelenia v prípade známej hodnoty rozptylu.

Samozrejme výber úroveň dôveryúplne závisí od aktuálnej úlohy. Miera dôvery cestujúceho v leteckej doprave v spoľahlivosť lietadla by teda samozrejme mala byť vyššia ako miera dôvery kupujúceho v spoľahlivosť žiarovky.

Formulácia úlohy

Predpokladajme, že od populácia s prijatím vzorka veľkosť n. Predpokladá sa, že smerodajná odchýlka táto distribúcia je známa. Nevyhnutné na základe toho vzorky hodnotiť neznáme distribučný priemer(μ, ) a zostrojte zodpovedajúce bilaterálneinterval spoľahlivosti .

Bodový odhad

Ako je známe z štatistiky(nazvime to X porov) je nestranný odhad priemeru toto populácia a má rozdelenie N(μ;σ 2 /n).

Poznámka : Čo ak potrebujete stavať interval spoľahlivosti v prípade distribúcie, ktorá nie jenormálne? V tomto prípade prichádza na pomoc, ktorá hovorí, že s dostatočne veľkou veľkosťou vzorky n z distribúcie nienormálne , výberové rozdelenie štatistiky Х priem bude približne korešpondovať normálne rozdelenie s parametrami N(μ;σ 2 /n).

takže, bodový odhadstrednádistribučné hodnoty máme je vzorový priemer, t.j. X porov. Teraz sa poďme zamestnať interval spoľahlivosti.

Budovanie intervalu spoľahlivosti

Zvyčajne, keď poznáme rozdelenie a jeho parametre, vieme vypočítať pravdepodobnosť, že náhodná premenná nadobudne hodnotu z daného intervalu. Teraz urobme opak: nájdime interval, do ktorého náhodná premenná s danou pravdepodobnosťou spadá. Napríklad z nehnuteľností normálne rozdelenie je známe, že s pravdepodobnosťou 95% sa náhodná premenná rozloží normálny zákon, bude spadať do intervalu približne +/- 2 od stredná hodnota(pozri článok o). Tento interval bude slúžiť ako náš prototyp interval spoľahlivosti .

Teraz sa pozrime, či poznáme distribúciu , vypočítať tento interval? Aby sme odpovedali na otázku, musíme špecifikovať formu distribúcie a jej parametre.

Vieme, že forma distribúcie je normálne rozdelenie(pamätajte, že hovoríme o distribúcia vzoriekštatistikyX porov).

Parameter μ nám nie je známy (treba ho odhadnúť pomocou interval spoľahlivosti), ale máme jej odhad X cf, vypočítané na základe vzorka, ktoré možno použiť.

Druhým parametrom je priemerná štandardná odchýlka vzorkybude známy, rovná sa σ/√n.

Pretože nepoznáme μ, potom zostrojíme interval +/- 2 štandardné odchýlky nie z stredná hodnota, ale z jeho známeho odhadu X porov. Tie. pri výpočte interval spoľahlivosti nebudeme to predpokladať X porov bude spadať do intervalu +/- 2 štandardné odchýlky od μ s pravdepodobnosťou 95% a budeme predpokladať, že interval je +/- 2 štandardné odchýlky od X porov s pravdepodobnosťou 95 % pokryje μ - priemer bežnej populácie, z ktorých vzorka. Tieto dva výroky sú ekvivalentné, ale druhý výrok nám umožňuje konštruovať interval spoľahlivosti .

Okrem toho spresňujeme interval: náhodná premenná rozložená cez normálny zákon, s 95% pravdepodobnosťou spadá do intervalu +/- 1,960 štandardné odchýlky, nie +/- 2 štandardné odchýlky. Dá sa to vypočítať pomocou vzorca \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. vzorový súbor Sheet Spacing .

Teraz môžeme sformulovať pravdepodobnostné tvrdenie, ktoré nám poslúži na formovanie interval spoľahlivosti: „Pravdepodobnosť, že priemer populácie nachádza sa od vzorový priemer do 1,960" štandardné odchýlky priemeru vzorky", sa rovná 95 %.

Hodnota pravdepodobnosti uvedená vo vyhlásení má špeciálny názov , ktorý je spojený s hladina významnosti α (alfa) jednoduchým vyjadrením úroveň dôvery = 1 . V našom prípade úroveň významnosti α =1-0,95=0,05 .

Teraz na základe tohto pravdepodobnostného tvrdenia napíšeme výraz na výpočet interval spoľahlivosti :

kde Za/2 štandardnénormálne rozdelenie(taká hodnota náhodnej premennej z , Čo P (z >= Za/2 ) = a/2).

Poznámka : Horný α/2-kvantil definuje šírku interval spoľahlivosti V štandardné odchýlkyvzorový priemer. Horný α/2-kvantil štandardnénormálne rozdelenie je vždy väčšie ako 0, čo je veľmi výhodné.

V našom prípade pri α=0,05 horný α/2-kvantil rovná sa 1,960. Pre ostatné hladiny významnosti α (10 %; 1 %) horný α/2-kvantilZa/2 možno vypočítať pomocou vzorca \u003d NORM.ST.OBR (1-α / 2) alebo ak je známy úroveň dôvery , =NORM.ST.OBR((1+úroveň spoľahlivosti)/2) .

Zvyčajne pri stavbe intervaly spoľahlivosti pre odhad priemeru iba použiť horné α /2- kvantil a nepoužívajte nižšie α /2- kvantil. Je to možné, pretože štandardnénormálne rozdelenie symetrické okolo osi x ( hustota jeho distribúcie symetrický o priemer, t.j. 0) . Preto nie je potrebné počítať nižší α/2-kvantil(nazýva sa jednoducho α /2-kvantil), pretože je to rovné horné α /2- kvantil so znamienkom mínus.

Pripomeňme si, že bez ohľadu na tvar rozdelenia x, zodpovedajúca náhodná premenná X porov distribuované približneDobre N(μ;σ 2 /n) (pozri článok o). Preto vo všeobecnosti vyššie uvedený výraz pre interval spoľahlivosti je len približná. Ak je x rozdelené na normálny zákon N(μ;σ 2 /n), potom výraz pre interval spoľahlivosti je presný.

Výpočet intervalu spoľahlivosti v MS EXCEL

Poďme vyriešiť problém. Čas odozvy elektronického komponentu na vstupný signál je dôležitou charakteristikou zariadenia. Technik chce vykresliť interval spoľahlivosti pre priemerný čas odozvy na úrovni spoľahlivosti 95 %. Z predchádzajúcich skúseností inžinier vie, že štandardná odchýlka času odozvy je 8 ms. Je známe, že inžinier vykonal 25 meraní, aby odhadol čas odozvy, priemerná hodnota bola 78 ms.

Riešenie: Inžinier chce vedieť dobu odozvy elektronického zariadenia, no chápe, že doba odozvy nie je pevná, ale náhodná premenná, ktorá má svoje vlastné rozdelenie. Takže najlepšie, v čo môže dúfať, je určiť parametre a tvar tohto rozdelenia.

Bohužiaľ, zo stavu problému nepoznáme formu rozloženia doby odozvy (nemusí byť normálne). , táto distribúcia je tiež neznáma. Len on je známy smerodajná odchýlka a = 8. Preto zatiaľ nevieme vypočítať pravdepodobnosti a konštruovať interval spoľahlivosti .

Hoci však distribúciu nepoznáme čassamostatná odpoveď, vieme, že podľa CPT , distribúcia vzoriekpriemerný čas odozvy je približne normálne(predpokladáme, že podmienky CPT sa vykonávajú, pretože veľkosť vzorky dostatočne veľké (n=25)) .

navyše priemer toto rozdelenie sa rovná stredná hodnota distribúcie odozvy jednotiek, t.j. μ. A smerodajná odchýlka tohto rozdelenia (σ/√n) možno vypočítať pomocou vzorca =8/ROOT(25) .

Je tiež známe, že inžinier dostal bodový odhad parameter μ rovný 78 ms (X cf). Preto teraz môžeme vypočítať pravdepodobnosti, pretože poznáme formu distribúcie ( normálne) a jeho parametre (Х ср a σ/√n).

Inžinier chce vedieť očakávaná hodnotaμ distribúcie času odozvy. Ako je uvedené vyššie, toto μ sa rovná očakávanie distribúcie vzorky priemerného času odozvy. Ak použijeme normálne rozdelenie N(X cf; σ/√n), potom bude požadované μ v rozsahu +/-2*σ/√n s pravdepodobnosťou približne 95 %.

Úroveň významnosti sa rovná 1-0,95=0,05.

Nakoniec nájdite ľavý a pravý okraj interval spoľahlivosti. Ľavý okraj: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / ROOT (25) = 74,864 Pravý okraj: \u003d 78 + NORM. ST. OBR (1-0,05 / 2) * 8 / ROOT (25) \u003d 81,136

Ľavý okraj: =NORM.INV(0,05/2; 78; 8/SQRT(25)) Pravý okraj: =NORM.INV(1-0,05/2; 78, 8/SQRT(25))

Odpoveď : interval spoľahlivosti pri 95 % hladina spoľahlivosti a σ =8 ms rovná sa 78+/-3,136 ms

IN príklad súboru na hárku Sigma známy vytvoril formulár na výpočet a konštrukciu bilaterálneinterval spoľahlivosti za svojvoľné vzorky s daným σ a úroveň významnosti .

Funkcia CONFIDENCE.NORM().

Ak hodnoty vzorky sú v rozsahu B20:B79 , A úroveň významnosti rovná 0,05; potom vzorec MS EXCEL: =AVERAGE(B20:B79)-CONFIDENCE(0,05;σ; COUNT(B20:B79)) vráti ľavý okraj interval spoľahlivosti .

Rovnakú hranicu možno vypočítať pomocou vzorca: =AVERAGE(B20:B79)-NORM.ST.INV(1-0.05/2)*σ/SQRT(COUNT(B20:B79))

Poznámka: Funkcia TRUST.NORM() sa objavila v MS EXCEL 2010. Staršie verzie MS EXCEL používali funkciu TRUST().


2023
newmagazineroom.ru - Účtovné výkazy. UNVD. Plat a personál. Menové operácie. Platenie daní. DPH. Poistné