Normálne rozdelenie. Priebežné distribúcie v EXCEL

(skutočné, prísne pozitívne)

Normálne rozdelenie, tiež nazývaný Gaussovo rozdelenie alebo Gauss - Laplace- rozdelenie pravdepodobnosti, ktoré je v jednorozmernom prípade dané funkciou hustoty pravdepodobnosti, ktorá sa zhoduje s Gaussovou funkciou:

f (x) = 1 σ 2 π e − (x − μ) 2 2 σ 2 , (\displaystyle f(x)=(\frac (1)(\sigma (\sqrt (2\pi ))))\ ;e^(-(\frac ((x-\mu)^(2))(2\sigma ^(2)))),)

kde parameter μ je matematické očakávanie (stredná hodnota), medián a spôsob rozdelenia a parameter σ je štandardná odchýlka (σ  ² - rozptyl) rozdelenia.

Jednorozmerné normálne rozdelenie je teda dvojparametrová rodina rozdelení. Viacrozmerný prípad je opísaný v článku „Multivariačná normálna distribúcia“.

štandardné normálne rozdelenie sa nazýva normálne rozdelenie s očakávaním μ = 0 a smerodajná odchýlkaσ = 1.

Encyklopedický YouTube

  • 1 / 5

    Dôležitosť normálneho rozdelenia v mnohých oblastiach vedy (napríklad v matematickej štatistike a štatistickej fyzike) vyplýva z ústrednej limitnej vety teórie pravdepodobnosti. Ak je výsledkom pozorovania súčet mnohých náhodných, slabo vzájomne závislých premenných, z ktorých každá má malý príspevok v pomere k celkovému súčtu, potom ako sa počet členov zvyšuje, distribúcia centrovaného a normalizovaného výsledku má tendenciu k normálu. Tento zákon teórie pravdepodobnosti má za následok široké rozdelenie normálneho rozdelenia, čo bolo jedným z dôvodov jeho názvu.

    Vlastnosti

    Momenty

    Ak náhodné premenné X 1 (\displaystyle X_(1)) A X 2 (\displaystyle X_(2)) sú nezávislé a majú normálne rozdelenie s matematickými očakávaniami μ 1 (\displaystyle \mu _(1)) A μ 2 (\displaystyle \mu _(2)) a disperzie σ 1 2 (\displaystyle \sigma _(1)^(2)) A σ 2 2 (\displaystyle \sigma _(2)^(2)) respektíve potom X 1 + X 2 (\displaystyle X_(1)+X_(2)) má tiež normálne rozdelenie s očakávanou hodnotou μ 1 + μ 2 (\displaystyle \mu _(1)+\mu _(2)) a rozptyl σ 1 2 + σ 2 2 . (\displaystyle \sigma _(1)^(2)+\sigma _(2)^(2).) To znamená, že normálna náhodná premenná môže byť reprezentovaná ako súčet ľubovoľného počtu nezávislých normálnych náhodných premenných.

    Maximálna entropia

    Normálne rozdelenie má maximálnu diferenciálnu entropiu medzi všetkými spojitými rozdeleniami, ktorých rozptyl nepresahuje danú hodnotu.

    Modelovanie normálnych pseudonáhodných premenných

    Najjednoduchšie približné metódy modelovania sú založené na centrálnej limitnej vete. Totiž, ak spočítame niekoľko nezávislých identicky rozdelených veličín s konečným rozptylom , potom bude súčet rozdelený približne Dobre. Napríklad, ak pridáte 100 nezávislých štandardov rovnomerne distribuovaných náhodných premenných, potom bude rozdelenie súčtu približne normálne.

    Na softvérové ​​generovanie normálne distribuovaných pseudonáhodných premenných je vhodnejšie použiť Box - Mullerovu transformáciu. Umožňuje vám vygenerovať jednu normálne rozloženú hodnotu na základe jednej rovnomerne rozloženej hodnoty.

    Normálna distribúcia v prírode a aplikáciách

    Normálne rozdelenie sa často nachádza v prírode. Napríklad nasledujúce náhodné premenné sú dobre modelované normálnym rozdelením:

    • vychýlenie streľby.
    • chyby merania (chyby niektorých meracích prístrojov však majú nenormálne rozdelenie).
    • niektoré charakteristiky živých organizmov v populácii.

    Toto rozdelenie je také rozšírené, pretože ide o nekonečne deliteľné spojité rozdelenie s konečným rozptylom. Preto sa k nemu niektoré ďalšie približujú v limite, napríklad binomický a Poissonov. Mnoho nedeterministických fyzikálnych procesov je modelovaných týmto rozdelením.

    Vzťah s inými distribúciami

    • Normálne rozdelenie je Pearsonovo rozdelenie typu XI.
    • Pomer dvojice nezávislých štandardných normálne rozdelených náhodných premenných má  Cauchyho rozdelenie. Teda ak náhodná premenná X (\displaystyle X) predstavuje vzťah X = Y / Z (\displaystyle X=Y/Z)(Kde Y (\displaystyle Y) A Z (\displaystyle Z) sú nezávislé štandardné normálne náhodné premenné), potom bude mať Cauchyho rozdelenie.
    • Ak z 1 , … , z k (\displaystyle z_(1),\ldots ,z_(k)) sú spoločne nezávislé štandardné normálne náhodné premenné, t.j. z i ∼ N (0 , 1) (\displaystyle z_(i)\sim N\left(0,1\right)), potom náhodná premenná x = z 1 2 + … + z k 2 (\displaystyle x=z_(1)^(2)+\ldots +z_(k)^(2)) má chí-kvadrát rozdelenie s k stupňami voľnosti.
    • Ak náhodná premenná X (\displaystyle X) podlieha lognormálnemu rozdeleniu, potom má jeho prirodzený logaritmus normálne rozdelenie. Teda ak X ∼ L o g N (μ , σ 2) (\displaystyle X\sim \mathrm (LogN) \left(\mu ,\sigma ^(2)\right)), To Y = ln ⁡ (X) ∼ N (μ , σ 2) (\displaystyle Y=\ln \left(X\right)\sim \mathrm (N) \left(\mu ,\sigma ^(2)\right )). A naopak, ak Y ∼ N (μ , σ 2) (\displaystyle Y\sim \mathrm (N) \left(\mu ,\sigma ^(2)\right)), To X = exp ⁡ (Y) ∼ L o g N (μ , σ 2) (\displaystyle X=\exp \left(Y\right)\sim \mathrm (LogN) \left(\mu ,\sigma ^(2) \správny)).
    • Pomer druhých mocnín dvoch štandardných normálnych náhodných premenných má

    Normálne rozdelenie je najbežnejším typom rozdelenia. Stretáva sa s ním pri analýze chýb merania, pri riadení technologických procesov a režimov, ako aj pri analýze a predikcii rôznych javov v biológii, medicíne a iných oblastiach poznania.

    Termín "normálna distribúcia" sa používa v podmienečnom zmysle, ako je všeobecne akceptované v literatúre, aj keď nie celkom úspešné. Tvrdenie, že určitý atribút sa podriaďuje zákonu normálneho rozdelenia, teda vôbec neznamená existenciu akýchkoľvek neotrasiteľných noriem, ktoré sú údajne základom javu, ktorého odrazom je daný atribút, a podriadenie sa iným zákonom rozdeľovania neznamená nejaký druh abnormality tohto javu.

    Hlavnou črtou normálneho rozdelenia je, že je to limit, ku ktorému sa približujú ostatné rozdelenia. Normálne rozdelenie prvýkrát objavil Moivre v roku 1733. Iba spojité náhodné premenné sa riadia normálnym zákonom. Hustota zákona normálneho rozdelenia má tvar .

    Matematické očakávanie pre zákon normálneho rozdelenia je . Rozptyl je .

    Základné vlastnosti normálneho rozdelenia.

    1. Funkcia hustoty rozdelenia je definovaná na celej reálnej osi Oh , teda každá hodnota X zodpovedá presne definovanej hodnote funkcie.

    2. Pre všetky hodnoty X (pozitívne aj negatívne) funkcia hustoty nadobúda kladné hodnoty, to znamená, že normálna krivka je umiestnená nad osou Oh .

    3. Limita funkcie hustoty s neobmedzeným nárastom X je nula, .

    4. Funkcia hustoty normálneho rozdelenia v bode má maximum .

    5. Graf funkcie hustoty je symetrický podľa priamky.

    6. Distribučná krivka má dva inflexné body so súradnicami A .

    7. Modus a medián normálneho rozdelenia sa zhodujú s matematickým očakávaním A .

    8. Tvar normálnej krivky sa pri zmene parametra nemení A .

    9. Koeficienty šikmosti a špičatosti normálneho rozdelenia sú rovné nule.

    Dôležitosť výpočtu týchto koeficientov pre empirické distribučné rady je zrejmá, keďže charakterizujú šikmosť a strmosť daného radu oproti normálnemu.

    Pravdepodobnosť pádu do intervalu sa zistí pomocou vzorca , Kde nepárna tabuľková funkcia.

    Určte pravdepodobnosť, že sa normálne rozložená náhodná premenná odchyľuje od svojej matematické očakávanie o hodnotu menšiu ako , to znamená, že nájdeme pravdepodobnosť nerovnosti , alebo pravdepodobnosť dvojitej nerovnosti . Dosadením do vzorca dostaneme

    Vyjadrenie odchýlky náhodná premenná X v zlomkoch smerodajnej odchýlky, teda po vložení poslednej rovnosti, dostaneme .


    Potom pre , dostaneme

    keď dostaneme,

    keď dostaneme.

    Z poslednej nerovnosti vyplýva, že prakticky rozptyl normálne rozloženej náhodnej veličiny leží v sekcii . Pravdepodobnosť, že náhodná premenná nespadne do tejto oblasti, je veľmi malá, konkrétne sa rovná 0,0027, to znamená, že táto udalosť sa môže vyskytnúť iba v troch prípadoch z 1000. Takéto udalosti možno považovať za takmer nemožné. Na základe vyššie uvedenej úvahy, pravidlo troch sigma, ktorý je formulovaný takto: ak má náhodná premenná normálne rozdelenie, potom odchýlka tejto hodnoty od matematického očakávania v absolútnej hodnote nepresiahne trojnásobok štandardnej odchýlky.

    Príklad 28. Diel vyrobený automatickým strojom sa považuje za vhodný, ak odchýlka jeho kontrolovanej veľkosti od konštrukčného nepresahuje 10 mm. Náhodné odchýlky kontrolovanej veľkosti od konštrukčnej veľkosti podliehajú zákonu normálneho rozdelenia so štandardnou odchýlkou ​​mm a matematickým očakávaním. Aké percento dobrých dielov stroj vyrába?

    Riešenie. Zvážte náhodnú premennú X - odchýlka veľkosti od návrhu. Časť bude uznaná ako vhodná, ak náhodná premenná patrí do intervalu. Pravdepodobnosť výroby vhodného dielu sa zistí podľa vzorca . Preto je percento dobrých dielov vyrobených strojom 95,44%.

    Binomické rozdelenie

    Binomické je rozdelenie pravdepodobnosti výskytu m počet udalostí v P nezávislé testy, v každom z nich je pravdepodobnosť výskytu udalosti konštantná a rovná sa R . Pravdepodobnosť možného počtu výskytov udalosti sa vypočíta podľa Bernoulliho vzorca: ,

    Kde . Trvalé P A R , zahrnuté v tomto výraze, parametre binomického zákona. Binomické rozdelenie popisuje rozdelenie pravdepodobnosti diskrétnej náhodnej premennej.

    Základné číselné charakteristiky binomické rozdelenie. Matematické očakávanie je . Rozptyl je . Koeficienty šikmosti a špičatosti sú rovnaké a . S neobmedzeným nárastom počtu pokusov A A E tendenciu k nule, preto môžeme predpokladať, že binomické rozdelenie konverguje k normálnemu s rastúcim počtom pokusov.

    Príklad 29. Nezávislé testy sa vykonávajú s rovnakou pravdepodobnosťou výskytu udalosti A v každom teste. Nájdite pravdepodobnosť výskytu udalosti A v jednom pokuse, ak je rozdiel v počte vystúpení v troch pokusoch 0,63.

    Riešenie. Pre binomické rozdelenie . Nahradením hodnôt dostaneme odtiaľ alebo potom a .

    Poissonovo rozdelenie

    Zákon distribúcie zriedkavých javov

    Poissonovo rozdelenie popisuje počet udalostí m , vyskytujúce sa v rovnakých časových intervaloch za predpokladu, že udalosti prebiehajú nezávisle od seba s konštantnou priemernou intenzitou. Zároveň počet pokusov P je veľká a pravdepodobnosť udalosti nastane v každom pokuse R malý. Preto sa Poissonovo rozdelenie nazýva zákon zriedkavých javov alebo najjednoduchší tok. Parameter Poissonovho rozdelenia je hodnota charakterizujúca intenzitu výskytu udalostí v P testy. Poissonov vzorec rozdelenia .

    Poissonovo rozdelenie dobre popisuje počet žiadostí o vyplatenie poistných súm za rok, počet hovorov prijatých telefónnou ústredňou za určitý čas, počet porúch prvkov pri testovaní spoľahlivosti, počet chybných výrobkov atď. .

    Základné číselné charakteristiky pre Poissonovo rozdelenie. Matematické očakávanie sa rovná rozptylu a rovná sa A . Teda . Toto je charakteristický znak tejto distribúcie. Koeficienty šikmosti a špičatosti sa rovnajú .

    Príklad 30. Priemerný počet výplat poistných súm za deň sú dve. Nájdite pravdepodobnosť, že za päť dní budete musieť zaplatiť: 1) 6 poistných súm; 2) menej ako šesť čiastok; 3) najmenej šesť. alebo exponenciálny distribúcia.

    Toto rozdelenie sa často pozoruje pri štúdiu životnosti rôznych zariadení, doby prevádzkyschopnosti jednotlivých prvkov, častí systému a systému ako celku, keď sa zvažujú náhodné časové intervaly medzi výskytom dvoch po sebe nasledujúcich zriedkavých udalostí.

    Hustota exponenciálneho rozdelenia je určená parametrom , ktorý je tzv poruchovosť. Tento pojem je spojený so špecifickou oblasťou použitia - teóriou spoľahlivosti.

    Výraz pre integrálnu funkciu exponenciálneho rozdelenia možno nájsť pomocou vlastností diferenciálnej funkcie:

    Matematické očakávanie exponenciálneho rozdelenia, rozptyl, smerodajná odchýlka. Pre toto rozdelenie je teda typické, že smerodajná odchýlka sa číselne rovná matematickému očakávaniu. Pre akúkoľvek hodnotu parametra sú koeficienty šikmosti a špičatosti konštantné hodnoty.

    Príklad 31. Priemerná doba prevádzky televízora pred prvou poruchou je 500 hodín. Nájdite pravdepodobnosť, že náhodne vybraný televízor bude fungovať bez porúch viac ako 1000 hodín.

    Riešenie. Keďže stredný čas do prvého zlyhania je 500 . Požadovanú pravdepodobnosť nájdeme podľa vzorca .

    Najznámejším a často používaným zákonom v teórii pravdepodobnosti je zákon normálneho rozdelenia resp Gaussov zákon .

    Hlavná prednosť Normálny zákon o rozdeľovaní spočíva v tom, že je obmedzujúcim zákonom pre iné zákony rozdeľovania.

    Všimnite si, že pre normálne rozdelenie má integrálna funkcia tvar:

    .

    Teraz ukážmeže pravdepodobnostný význam parametrov a je takýto: A existuje matematické očakávanie, - štandardná odchýlka (tj ) normálneho rozdelenia:

    a) podľa definície matematického očakávania spojitej náhodnej premennej máme

    Naozaj

    ,

    keďže pod znamienkom integrálu je nepárna funkcia a hranice integrácie sú symetrické vzhľadom na pôvod;

    - Poissonov integrál .

    Takže matematické očakávanie normálneho rozdelenia sa rovná parametru A .

    b) podľa definície disperzie spojitej náhodnej premennej a berúc do úvahy, že môžeme písať

    .

    Integrácia po častiach, nastavenie , Nájsť

    Preto .

    Takže štandardná odchýlka normálneho rozdelenia sa rovná parametru .

    Ak a normálne rozdelenie sa nazýva normalizované (alebo štandardné normálne) rozdelenie. Potom, samozrejme, normalizovaná hustota (diferenciálna) a normalizovaná integrálna distribučná funkcia budú zapísané v tomto poradí v tvare:

    (Táto funkcia, ako viete, sa nazýva Laplaceova funkcia (pozri PREDNÁŠKU 5) alebo pravdepodobnostný integrál. Obe funkcie, tj. , sú tabuľkové a ich hodnoty sú zaznamenané v príslušných tabuľkách).

    Vlastnosti normálneho rozdelenia (vlastnosti normálnej krivky):

    1. Samozrejme, funkcia na celej skutočnej čiare.

    2. , to znamená, že normálna krivka je umiestnená nad osou Oh .

    3. , teda os Oh slúži ako horizontálna asymptota grafu.

    4. Normálna krivka je symetrická podľa priamky x = a (podľa toho je graf funkcie symetrický okolo osi OU ).

    Preto môžeme písať: .

    5. .

    6. Je ľahké ukázať, že body A sú inflexné body normálnej krivky (dokážte sa).

    7.To je zrejmé

    ale odvtedy , To . Okrem toho , preto sú všetky nepárne momenty rovné nule.

    Pre párne chvíle môžeme napísať:

    8. .

    9. .

    10. , Kde .

    11. Pre záporné hodnoty náhodnej premennej: , kde .


    13. Pravdepodobnosť zasiahnutia náhodnej premennej na grafe symetrickom okolo stredu distribúcie sa rovná:

    PRÍKLAD 3. Ukážte, že normálne rozložená náhodná premenná X odchyľuje od očakávania M(X) nie viac ako .

    Riešenie. Pre normálne rozdelenie: .

    Inými slovami, pravdepodobnosť, že absolútna hodnota odchýlky prekročí trojnásobok štandardnej odchýlky je veľmi malý, konkrétne 0,0027. To znamená, že len v 0,27 % prípadov sa to môže stať. Takéto udalosti, založené na princípe nemožnosti nepravdepodobných udalostí, možno považovať za prakticky nemožné.

    Udalosť s pravdepodobnosťou 0,9973 možno teda považovať za prakticky istú, to znamená, že náhodná premenná sa od matematického očakávania neodchyľuje o viac ako .

    PRÍKLAD 4. Poznať charakteristiky normálneho rozdelenia náhodnej premennej X - pevnosť v ťahu ocele: kg / mm 2 a kg / mm 2, nájdite pravdepodobnosť získania ocele s pevnosťou v ťahu 31 kg / mm 2 až 35 kg / mm 2.

    Riešenie.

    3. Exponenciálne rozdelenie (zákon exponenciálneho rozdelenia)

    Exponenciálna (exponenciálna) je rozdelenie pravdepodobnosti spojitej náhodnej premennej X , ktorá je opísaná diferenciálnou funkciou (hustota rozdelenia)

    kde je konštantná kladná hodnota.

    Je definované exponenciálne rozdelenie jeden parameter . Táto vlastnosť exponenciálneho rozdelenia naznačuje jeho výhodu oproti rozdeleniam, ktoré závisia od väčšieho počtu parametrov. Zvyčajne sú parametre neznáme a je potrebné nájsť ich odhady (približné hodnoty); samozrejme je jednoduchsie vyhodnocovat jeden parameter ako dva, ci tri atd.

    Je ľahké napísať integrálnu funkciu exponenciálneho rozdelenia:

    Exponenciálne rozdelenie sme definovali pomocou diferenciálnej funkcie; je jasné, že sa dá určiť pomocou integrálnej funkcie.

    Komentujte: Uvažujme spojitú náhodnú premennú T - trvanie prevádzkyschopnosti produktu. Označme jej akceptované hodnoty pomocou t , . Kumulatívna distribučná funkcia definuje pravdepodobnosť zlyhania produktov za určité obdobie t . Preto je pravdepodobnosť bezporuchovej prevádzky po rovnakú dobu trvania t , to znamená, že pravdepodobnosť opačnej udalosti sa rovná

    ) hrá obzvlášť dôležitú úlohu v teórii pravdepodobnosti a najčastejšie sa používa pri riešení praktických problémov. Jeho hlavnou črtou je, že je obmedzujúcim zákonom, ku ktorému sa približujú iné zákony distribúcie za veľmi bežných typických podmienok. Napríklad súčet dostatočne veľkého počtu nezávislých (alebo slabo závislých) náhodných premenných približne zodpovedá normálnemu zákonu, a to je tým presnejšie, čím viac náhodných premenných sa sčítava.

    Experimentálne bolo dokázané, že chyby merania, odchýlky geometrických rozmerov a polohy prvkov stavebných konštrukcií pri ich výrobe a montáži, variabilita fyzikálnych a mechanických vlastností materiálov a zaťaženia pôsobiace na stavebné konštrukcie podliehajú normálnemu zákonu.

    Takmer všetky náhodné premenné sa riadia Gaussovým rozdelením, ktorého odchýlka od priemerných hodnôt je spôsobená veľkým súborom náhodných faktorov, z ktorých každý je individuálne nevýznamný. (centrálna limitná veta).

    normálne rozdelenie nazývané rozdelenie náhodnej spojitej premennej, pre ktorú má hustota pravdepodobnosti tvar (obr. 18.1).

    Ryža. 18.1. Zákon normálneho rozdelenia pre 1< a 2 .

    (18.1)

    kde a a sú distribučné parametre.

    Pravdepodobnostné charakteristiky náhodnej premennej rozloženej podľa normálneho zákona sú:

    Matematické očakávanie (18.2)

    Rozptyl (18.3)

    Smerodajná odchýlka (18,4)

    Koeficient asymetrie A = 0(18.5)

    Prebytok E= 0. (18.6)

    Parameter σ zahrnutý v Gaussovom rozdelení sa rovná pomeru strednej a druhej mocniny náhodnej premennej. Hodnota A určuje polohu distribučného centra (pozri obr. 18.1) a hodnotu A- šírka rozvodu (obr. 18.2), t.j. štatistický rozptyl okolo priemeru.

    Ryža. 18.2. Zákon normálneho rozdelenia pre σ 1< σ 2 < σ 3

    Pravdepodobnosť pádu do daného intervalu (od x 1 do x 2) pre normálne rozdelenie, ako vo všetkých prípadoch, je určená integrálom hustoty pravdepodobnosti (18.1), ktorý nie je vyjadrený elementárnymi funkciami a je reprezentovaná špeciálnou funkciou, nazývanou Laplaceova funkcia (integrál pravdepodobností).

    Jedno zo zobrazení pravdepodobnostného integrálu:

    (18.7)

    Hodnota A volal kvantil.

    Je vidieť, že Ф(х) je nepárna funkcia, t.j. Ф(-х) = -Ф(х) . Hodnoty tejto funkcie sú vypočítané a prezentované vo forme tabuliek v technickej a vzdelávacej literatúre.


    Distribučnú funkciu normálneho zákona (obr. 18.3) možno vyjadriť pomocou integrálu pravdepodobnosti:

    (18.9)

    Ryža. 18.2. Funkcia zákona normálneho rozdelenia.

    Pravdepodobnosť, že náhodná premenná rozdelená podľa normálneho zákona spadá do intervalu od X. až x, je určený výrazom:

    Treba poznamenať, že

    Ф(0) = 0; Ф(∞) = 0,5; Ф(-∞) = -0,5.

    Pri riešení praktických úloh súvisiacich s distribúciou treba často uvažovať s pravdepodobnosťou pádu do intervalu, ktorý je symetrický vzhľadom na matematické očakávanie, ak dĺžka tohto intervalu t.j. ak má samotný interval hranicu od do, máme:

    Pri riešení praktických úloh sa hranice odchýlok náhodných veličín vyjadrujú cez normu, smerodajná odchýlka, vynásobený nejakým faktorom, ktorý určuje hranice oblasti odchýlok náhodnej premennej.

    Ak vezmeme a tiež použijeme vzorec (18.10) a tabuľku F (x) (príloha č. 1), dostaneme

    Tieto vzorce ukazujúže ak má náhodná veličina normálne rozdelenie, tak pravdepodobnosť jej odchýlky od strednej hodnoty najviac o σ je 68,27 %, najviac o 2σ - 95,45 % a najviac o 3σ - 99,73 %.

    Keďže hodnota 0,9973 je blízka jednotke, prakticky sa považuje za nemožné, aby sa normálne rozdelenie náhodnej premennej odchýlilo od matematického očakávania o viac ako 3σ. Toto pravidlo, ktoré platí len pre normálne rozdelenie, sa nazýva pravidlo troch sigma. Jeho porušenie je pravdepodobné P = 1 - 0,9973 = 0,0027. Toto pravidlo sa používa pri stanovovaní hraníc prípustných odchýlok tolerancií geometrických charakteristík výrobkov a štruktúr.

    Zákon normálneho rozdelenia, takzvaný Gaussov zákon, je jedným z najbežnejších zákonov. Toto je základný zákon v teórii pravdepodobnosti a jej aplikácii. Normálne rozdelenie sa najčastejšie nachádza pri štúdiu prírodných a sociálno-ekonomických javov. Inými slovami, väčšina štatistických agregátov v prírode a spoločnosti sa riadi zákonom normálneho rozdelenia. V súlade s tým môžeme povedať, že agregáty veľkého počtu veľkých vzoriek z hľadiska objemu dodržiavajú zákon normálneho rozdelenia. Tie z populácií, ktoré sa odchyľujú od normálneho rozdelenia v dôsledku špeciálnych transformácií, môžu byť blízke normálu. V tejto súvislosti treba pripomenúť, že základnou črtou tohto zákona vo vzťahu k iným zákonom rozdeľovania je, že ide o zákon hranice, ku ktorému sa za určitých (typických) podmienok približujú iné zákony rozdeľovania.

    Treba poznamenať, že pojem „normálne rozdelenie“ má konvenčný význam, ako pojem všeobecne akceptovaný v matematickej a štatisticko-matematickej literatúre. Vyhlásenie, že ten či onen znak akéhokoľvek javu sa riadi zákonom normálneho rozdelenia, vôbec neznamená nedotknuteľnosť noriem, ktoré sú vlastné skúmanému javu, a priradenie týchto noriem k druhému typu zákona neznamená akúkoľvek abnormalitu tohto javu. V tomto zmysle výraz „normálna distribúcia“ nie je celkom úspešný.

    Normálne rozdelenie (Gaussov-Laplaceov zákon) je typom spojitého rozdelenia. Kde De Moivre (1773, Francúzsko) odvodil normálne rozdelenie pravdepodobností. Hlavné myšlienky tohto objavu prvýkrát použili v teórii chýb K. Gauss (1809, Nemecko) a A. Laplace (1812, Francúzsko), ktorí veľkou mierou teoreticky prispeli k rozvoju samotného práva. Najmä K. Gauss vo svojom vývoji vychádzal z rozpoznania najpravdepodobnejšej hodnoty náhodnej premennej - aritmetického priemeru. Všeobecné podmienky pre vznik normálneho rozdelenia stanovila A. M. Lyapunova. Dokázal, že ak je študovaná vlastnosť výsledkom celkového vplyvu mnohých faktorov, z ktorých každý má málo spoločného s väčšinou ostatných a vplyv každého faktora na konečný výsledok sa značne prekrýva s celkovým vplyvom všetky ostatné faktory, potom sa rozdelenie blíži k normálu.

    Normálne je rozdelenie pravdepodobnosti spojitej náhodnej premennej, má hustotu:

    1 +1 (& #) 2

    / (x, x,<т) = - ^ е 2 st2

    kde x je matematické očakávanie alebo priemerná hodnota. Ako vidíte, normálne rozdelenie je určené dvoma parametrami: x a °. Na špecifikáciu normálneho rozdelenia stačí poznať matematické očakávanie alebo priemer a smerodajnú odchýlku. Tieto dve veličiny určujú stred zoskupenia a tvar

    krivka na grafe. Graf funkcie u (xx, b) sa nazýva normálna krivka (Gaussova krivka) s parametrami x a b (obr. 12).

    Krivka normálneho rozdelenia má inflexné body pri X ± 1. Graficky medzi X = +1 a 1 = -1 je 0,683 z celej plochy krivky (t.j. 68,3 %). V rámci hraníc X = + 2 a X- 2. je 0,954 oblastí (95,4 %) a medzi X = + 3 a X = - 3 - 0,997 z celej distribučnej oblasti (99,7 %). Na obr. 13 ilustruje povahu normálneho rozdelenia s hranicami jednej, dvoch a trisigmy.

    Pri normálnom rozdelení sa aritmetický priemer, modus a medián budú navzájom rovnať. Tvar normálnej krivky má tvar jednovrcholovej symetrickej krivky, ktorej vetvy sa asymptoticky približujú k osi x. Najväčšia ordináta krivky zodpovedá x = 0. V tomto bode na osi x je umiestnená číselná hodnota znakov, ktorá sa rovná aritmetickému priemeru, modusu a mediánu. Po oboch stranách vrcholu krivky prichádzajú jej vetvy, ktoré v určitých bodoch menia tvar konvexnosti na konkávnosť. Tieto body sú symetrické a zodpovedajú hodnotám x = ± 1, to znamená hodnotám znakov, ktorých odchýlky od priemeru sa číselne rovnajú štandardnej odchýlke. Ordináta, ktorá zodpovedá aritmetickému priemeru, rozdeľuje celú plochu medzi krivkou a osou x na polovicu. Pravdepodobnosť výskytu hodnôt študovaného atribútu je teda väčšia a menšia ako priemer

    aritmetika sa bude rovnať 0,50, to znamená x, (~ ^ x) \u003d 0,50 V

    Obr.12. Krivka normálneho rozdelenia (Gaussova krivka)

    Tvar a poloha normálnej krivky určujú hodnotu priemeru a štandardnej odchýlky. Je matematicky dokázané, že zmena hodnoty priemeru (matematického očakávania) nemení tvar normálovej krivky, ale vedie len k jej posunutiu po osi x. Krivka sa posunie doprava, ak sa zväčší ~, a doľava, ak sa zväčší ~.

    Obr.14. Krivky normálneho rozdelenia s rôznymi hodnotami parametrovV

    O zmene tvaru grafu normálnej krivky pri zmene

    štandardnú odchýlku možno posudzovať podľa maxima

    diferenciálna funkcia normálneho rozdelenia, rovná sa 1

    Ako je možné vidieť, so zvyšujúcou sa hodnotou ° sa bude maximálna ordináta krivky znižovať. V dôsledku toho sa krivka normálneho rozdelenia zmenší smerom k osi x a nadobudne plochý tvar.

    A naopak, keď sa parameter zníži na normálnu krivku, predĺži sa v kladnom smere osi y a tvar „zvonca“ sa stane vrcholovejším (obr. 14). Všimnite si, že bez ohľadu na hodnotu parametrov ~ a в je plocha ohraničená osou x a krivkou vždy rovná jednotke (vlastnosť hustoty rozloženia). Jasne to ilustruje graf (obr. 13).

    Vyššie uvedené znaky prejavu „normálnosti“ rozdelenia nám umožňujú identifikovať množstvo spoločných vlastností, ktoré majú krivky normálneho rozdelenia:

    1) akákoľvek normálna krivka dosiahne maximálny bod (X= x) prichádza plynule napravo a naľavo od neho, postupne sa približuje k osi x;

    2) každá normálna krivka je symetrická vzhľadom na priamku,

    rovnobežne s osou y a prechádza cez maximálny bod (X= x)

    maximálna ordináta je ^^^ i;

    3) akákoľvek normálna krivka má tvar „zvončeka“, má konvexnosť, ktorá smeruje nahor k maximálnemu bodu. V bodoch x ~ ° a x + v mení svoju konvexnosť a čím menšie a, tým je „zvonček“ ostrejší a čím väčšie a, tým je vrch „zvončeka“ krehkejší (obr. 14). Zmena matematického očakávania (s konštantnou hodnotou

    c) nevedie k zmene tvaru krivky.

    Keď x \u003d 0 a ° \u003d 1, normálna krivka sa nazýva normalizovaná krivka alebo normálne rozdelenie v kanonickej forme.

    Normalizovaná krivka je opísaná nasledujúcim vzorcom:

    Konštrukcia normálnej krivky podľa empirických údajov sa vykonáva podľa vzorca:

    pi 1 - "" = --- 7 = e

    kde a ™ - teoretická frekvencia každého intervalu (skupiny) distribúcie; "- súčet frekvencií rovnajúci sa objemu populácie; "- intervalový krok;

    rovnaký - pomer obvodu kruhu k jeho priemeru, čo je

    e je základ prirodzených logaritmov, rovný 2,71828;

    Druhá a tretia časť vzorca) je funkcia

    normalizovaná odchýlka CF), ktorú možno vypočítať pre ľubovoľné hodnoty X. Tabuľky hodnôt CF) sa zvyčajne nazývajú „tabuľky súradníc normálnej krivky“ (príloha 3). Pri použití týchto funkcií má pracovný vzorec pre normálne rozdelenie jednoduchú formu:

    Príklad. Uvažujme prípad zostrojenia normálnej krivky na príklade údajov o rozdelení 57 pracovníkov podľa úrovne denného zárobku (tabuľka 42). Podľa tabuľky 42 nájdeme aritmetický priemer:

    ~ = ^ = I6 54 =

    Vypočítame smerodajnú odchýlku:

    Pre každý riadok tabuľky nájdeme hodnotu normalizovanej odchýlky

    x a ~ x | 12 g => - = - ^ 2 = 1,92

    A 6.25 (dd I prvého intervalu atď.).

    V stĺpci 8 tabuľky. 42 zapíšeme tabuľkovú hodnotu funkcie Di) z aplikácie, napríklad pre prvý interval X = 1,92 nájdeme "1,9" proti "2" (0,0632).

    Na výpočet teoretických frekvencií, teda súradníc krivky normálneho rozdelenia, sa vypočíta multiplikátor:

    * = ^ = 36,5 a 6.25

    Všetky nájdené tabuľkové hodnoty funkcie / (r) sa vynásobia 36,5. Takže pre prvý interval dostaneme 0,0632 x 36,5 = 2,31 tony.

    frekvencie (P "<5) zlúčiť (v našom príklade prvé dva a posledné dva intervaly).

    Ak sú extrémne teoretické početnosti výrazne odlišné od nuly, nesúlad medzi súčtom empirických a teoretických početností môže byť významný.

    Graf rozdelenia empirických a teoretických početností (normálna krivka) podľa uvažovaného príkladu je na obrázku 15.

    Uvažujme príklad určenia frekvencií normálneho rozdelenia pre prípad, keď v extrémnych intervaloch nie je frekvencia (tabuľka 43). Tu je empirický

    X - normalizovaná odchýlka, (c) a - smerodajná odchýlka.

    frekvencia prvého intervalu je nulová. Výsledný súčet nešpecifikovaných frekvencií sa nerovná súčtu ich empirických hodnôt (56 * 57). V tomto prípade sa teoretická frekvencia vypočíta na premývanie získaných hodnôt stredu intervalu, normalizovanej odchýlky a jej funkcie.

    V tabuľke 43 sú tieto hodnoty zakrúžkované obdĺžnikom. Pri vykresľovaní normálnej krivky sa v takýchto prípadoch pokračuje teoretickou krivkou. V uvažovanom prípade bude normálna krivka pokračovať smerom k negatívnym odchýlkam od priemeru, pretože prvá nešpecifikovaná frekvencia sa rovná 5. Vypočítaná teoretická frekvencia (spresnená) pre prvý interval sa bude rovnať jednej. V súhrne sa spresnené frekvencie zhodujú s empirickými.

    Tabuľka 42

    Odhadované hodnoty

    Štatistické parametre

    interval,

    počet jednotiek,

    x) 2

    štandardizované oddelenie,

    teoretická

    frekvencia normálneho distribučného radu,

    / 0) x - A

    >>

    tisíc šesťsto päťdesiat štyri

    a = 6,25

    ^i=36,5 A

    Tabuľka 43

    Výpočet frekvencií normálneho rozdelenia (zarovnanie empirických frekvencií podľa normálneho zákona)

    počet jednotiek,

    Odhadované hodnoty

    Štatistické parametre

    Interval (u-2)

    Stredná hodnota (stred) intervalu,

    (ja, -xf

    ^xt-x) 1n a

    normalizovaná odchýlka

    x s- X

    t= x-L

    tabuľková hodnota funkcie, f(t)

    teoretická

    normálna distribučná frekvencia

    aktualizovaná hodnota teoretickej frekvencie,

    w

    -

    -

    -

    -

    -

    o= 2,41

    Ryža. 15. Empirické rozdelenie(1) a normálna krivka (2)

    Krivka normálneho rozdelenia pre skúmanú populáciu môže byť skonštruovaná iným spôsobom (na rozdiel od vyššie diskutovaného). Takže, ak je potrebné mať približnú predstavu o zhode skutočného rozdelenia s normálnym rozdelením, výpočty sa vykonajú v nasledujúcom poradí. Určí sa maximálna ordináta, ktorá zodpovedá priemernej veľkosti znakov), potom sa po vypočítaní štandardnej odchýlky vypočítajú súradnice bodov krivky normálneho rozdelenia podľa schémy uvedenej v tabuľkách 42 a 43. podľa počiatočných a vypočítaných údajov v tabuľke 43 sa priemer ~ = 26 stred zhoduje so stredom štvrtého intervalu (25-27). Frekvencia tohto intervalu "20" sa teda môže brať (pri vykresľovaní grafu) ako maximálna ordináta). S vypočítaným rozptylom (v = 2,41, pozri tabuľku 43) vypočítame hodnoty súradníc všetkých potrebných bodov krivky normálneho rozdelenia (tabuľky 44, 45). Podľa získaných súradníc nakreslíme normálnu krivku (obr. 16), pričom maximálna ordináta je frekvencia štvrtého intervalu.

    Konzistenciu empirického rozdelenia s normálnym je možné zistiť aj zjednodušenými výpočtami. Takže, ak pomer ukazovateľa stupňa asymetrie (^) k jeho strednej kvadratúrnej chybe w a "alebo pomer ukazovateľa špičatosti (E x) k jeho strednej kvadratúre t & presahuje absolútnu hodnota čísla" 3 ", sa dospelo k záveru, že empirické rozdelenie povahy normálneho rozdelenia (tj.

    A c E X

    Ak A > 3 alebo w e "> 3).

    Existujú aj iné, na prácu nenáročné metódy stanovenia „normálnosti“ rozdelenia: a) porovnanie aritmetického priemeru s modusom a mediánom; b) používanie čísel Westergard; c) aplikácia grafického obrazu pomocou semilogaritmickej siete Turbína; d) výpočet špeciálnych kritérií zhody atď.

    Tabuľka 44

    Súradnice 7-bodová zvonová krivka

    Tabuľka 45

    Výpočet súradníc bodov krivky normálneho rozdelenia

    X- 1,5 (7 =

    X - a = 23,6

    X - 0,5 (7 = = 24,8

    x + 0,5 st = 27,2

    X + a = 28,4

    X + 1,5 (7 =

    Obr.16. Krivka normálneho rozdelenia postavená na siedmich bodoch

    V praxi sa pri skúmaní populácie za účelom porovnania jej rozloženia s normálnym často používa „pravidlo 3cr“.

    Matematicky, pravdepodobnosť, že odchýlka od priemeru v absolútnej hodnote bude menšia ako trojnásobná smerodajná odchýlka, je 0,9973, to znamená, že pravdepodobnosť, že absolútna hodnota odchýlky presiahne trojnásobnú smerodajnú odchýlku, je 0,0027 alebo veľmi malá. Na základe princípu nemožnosti nepravdepodobných udalostí možno považovať za prakticky nemožný „prípad prekročenia“ 3 polievkových lyžíc. Ak je náhodná premenná normálne rozdelená, potom absolútna hodnota jej odchýlky od matematického očakávania (priemeru) nepresahuje trojnásobnú smerodajnú odchýlku.

    V praktických výpočtoch sa správajú týmto spôsobom. Ak sa pri neznámej povahe distribúcie skúmanej náhodnej premennej ukáže, že vypočítaná hodnota odchýlky od priemeru je menšia ako hodnota 3 ST, potom existuje dôvod domnievať sa, že študovaný znak je normálne distribuované. Ak tento parameter prekročí číselná hodnota 3 ST, môžeme predpokladať, že rozdelenie skúmanej hodnoty nie je v súlade s normálnym rozdelením.

    Výpočet teoretických frekvencií pre skúmaný empirický distribučný rad sa zvyčajne nazýva zarovnanie empirických kriviek podľa normálneho (alebo akéhokoľvek iného) distribučného zákona. Tento proces má teoretický aj praktický význam. Zoradenie empirických údajov odhaľuje pravidelnosť v ich distribúcii, ktorá môže byť zastretá náhodnou formou jej prejavu. Takto vytvorený vzor možno použiť na riešenie množstva praktických problémov.

    S rozložením blízkym normálu sa výskumník nachádza v rôznych oblastiach vedy a oblastiach praktickej činnosti človeka. Distribúcie tohto druhu sú v ekonómii menej bežné ako napríklad v strojárstve alebo biológii. Je to spôsobené samotnou povahou sociálno-ekonomických javov, ktoré sa vyznačujú veľkou zložitosťou vzájomne súvisiacich a vzájomne súvisiacich faktorov, ako aj prítomnosťou množstva podmienok, ktoré obmedzujú voľnú „hru“ prípadov. Ale ekonóm sa musí odvolávať na normálne rozdelenie, analyzujúc štruktúru empirických rozdelení, ako na určitý štandard. Takéto porovnanie umožňuje objasniť povahu tých vnútorných podmienok, ktoré určujú danú hodnotu rozdelenia.

    Sférická penetrácia štatistické štúdie v oblasti sociálno-ekonomických javov umožnilo odhaliť existenciu veľkého množstva rôznych typov distribučných kriviek. Nemali by sme však predpokladať, že teoretický koncept krivky normálneho rozdelenia je vo všeobecnosti málo použiteľný v štatistickej a matematickej analýze tohto typu javov. Pri analýze konkrétneho nemusí byť vždy prijateľné štatistické rozdelenie, ale v oblasti teórie a praxe má prvoradý význam výberová metóda výskumu.

    Uveďme si hlavné aspekty aplikácie normálneho rozdelenia v štatistickej a matematickej analýze.

    1. Na určenie pravdepodobnosti hodnoty konkrétneho znaku. Je to potrebné pri testovaní hypotéz o zhode jedného alebo druhého empirického rozdelenia s normálnym.

    2. Pri odhadovaní množstva parametrov, napríklad priemerov, metódou maximálnej pravdepodobnosti. Jeho podstata spočíva vo vymedzení takého zákona, ktorý podlieha totalite. Stanoví sa aj odhad, ktorý udáva maximálne hodnoty. Najlepšia aproximácia k parametrom bežnej populácie dáva pomer:

    y = -2 = e 2

    3. Na určenie pravdepodobnosti výberových priemerov vo vzťahu k všeobecným priemerom.

    4. Pri určovaní intervalu spoľahlivosti, v ktorom sa nachádza približná hodnota charakteristík všeobecnej populácie.