Proprietăți ale distribuției normale în statistică. Distribuție normală standard. Distribuție normală în natură și aplicații

) joacă în special rol importantîn teoria probabilităţilor şi este folosit cel mai adesea în rezolvarea problemelor practice. Caracteristica sa principală este că este o lege limitativă, la care se apropie alte legi de distribuție în condiții tipice foarte comune. De exemplu, suma este suficientă un numar mare variabilele aleatoare independente (sau slab dependente) respectă aproximativ legea normală, iar acest lucru este adevărat cu cât sunt mai precise cu atât mai multe variabile aleatoare sunt însumate.

S-a dovedit experimental că erorile de măsurare, abaterile dimensiunilor geometrice și poziției elementelor structurii clădirii în timpul fabricării și instalării acestora, precum și variabilitatea caracteristicilor fizice și mecanice ale materialelor și sarcinilor care acționează asupra structurilor clădirii sunt supuse legii normale.

Aproape toate variabilele aleatoare sunt supuse distribuției gaussiene, a cărei abatere de la valorile medii este cauzată de un set mare de factori aleatori, fiecare dintre care este individual nesemnificativ. (teorema limitei centrale).

Distributie normala numită distribuție aleatorie valoare continuă, pentru care densitatea de probabilitate are forma (Fig. 18.1).

Orez. 18.1. Legea distribuției normale la 1< a 2 .

(18.1)

unde a și sunt parametri de distribuție.

Caracteristici probabilistice variabilă aleatorie, distribuite conform legii normale, sunt egale cu:

Așteptări matematice (18,2)

Varianta (18,3)

Abaterea standard (18,4)

Coeficient de asimetrie A = 0(18.5)

Exces E= 0. (18.6)

Parametrul σ inclus în distribuția gaussiană este egal cu raportul pătrat mediu al variabilei aleatoare. Magnitudinea A determină poziția centrului de distribuție (vezi Fig. 18.1) și valoarea A— lățimea de distribuție (Fig. 18.2), adică. repartizarea statistică în jurul valorii medii.

Orez. 18.2. Legea distribuției normale la σ 1< σ 2 < σ 3

Probabilitatea de a cădea într-un interval dat (de la x 1 la x 2) pentru o distribuție normală, ca în toate cazurile, este determinată de integrala densității de probabilitate (18.1), care nu este exprimată prin functii elementareși este reprezentată de o funcție specială, numită funcție Laplace (integrala de probabilitate).

Una dintre reprezentările integralei de probabilitate:

(18.7)

Magnitudinea Și numit cuantilă

Este clar că F(x) - funcţie ciudată, adică Ф(-х) = -Ф(х) . Valorile acestei funcții sunt calculate și prezentate sub formă de tabele în literatura tehnică și educațională.


Funcția de distribuție a legii normale (Fig. 18.3) poate fi exprimată prin integrala de probabilitate:

(18.9)

Orez. 18.2. Funcția de distribuție normală.

Probabilitatea ca o variabilă aleatoare distribuită conform unei legi normale să se încadreze în intervalul de la X. la x, este determinată de expresia:

Trebuie remarcat faptul că

Ф(0) = 0; Ф(∞) = 0,5; Ф(-∞) = -0,5.

Când se rezolvă probleme practice legate de distribuție, este adesea necesar să se ia în considerare probabilitatea căderii într-un interval care este simetric față de așteptarea matematică, dacă lungimea acestui interval, i.e. dacă intervalul însuși are o limită de la până la , avem:

La rezolvarea problemelor practice, limitele abaterilor variabilelor aleatoare se exprimă prin standard, abaterea standard, înmulțită cu un anumit factor care determină limitele regiunii de abateri ale variabilei aleatoare.

Luând și și folosind formula (18.10) și tabelul Ф(х) (Anexa nr. 1), obținem

Aceste formule arată că dacă o variabilă aleatoare are o distribuție normală, atunci probabilitatea abaterii ei de la valoarea medie cu cel mult σ este de 68,27%, cu cel mult 2σ este de 95,45% și cu cel mult 3σ - 99,73%.

Deoarece valoarea de 0,9973 este aproape de unitate, se consideră practic imposibil ca distribuția normală a unei variabile aleatoare să se abate de la așteptarea matematică cu mai mult de 3σ. Această regulă, care este valabilă numai pentru distribuția normală, se numește regula trei sigma. Încălcarea acesteia este probabilă P = 1 - 0,9973 = 0,0027. Această regulă este utilizată la stabilirea limitelor abaterilor admisibile ale toleranțelor caracteristicilor geometrice ale produselor și structurilor.

În multe probleme legate de variabile aleatoare distribuite normal, este necesar să se determine probabilitatea unei variabile aleatoare , supusă unei legi normale cu parametri, care se încadrează pe segmentul de la la . Pentru a calcula această probabilitate folosim formula generală

unde este funcţia de distribuţie a mărimii .

Să găsim funcția de distribuție a unei variabile aleatoare distribuite conform unei legi normale cu parametri. Densitatea de distribuție a valorii este egală cu:

De aici găsim funcția de distribuție

. (6.3.3)

Să facem o schimbare de variabilă în integrală (6.3.3)

și să o punem în această formă:

(6.3.4)

Integrala (6.3.4) nu este exprimată prin funcții elementare, dar poate fi calculată printr-o funcție specială care exprimă integrala definita din expresia sau (așa-numita integrală de probabilitate) pentru care sunt întocmite tabelele. Există multe varietăți de astfel de funcții, de exemplu:

;

etc. Care dintre aceste funcții să utilizați este o chestiune de gust. Vom alege ca atare funcție

. (6.3.5)

Este ușor de observat că această funcție nu este altceva decât o funcție de distribuție pentru o variabilă aleatoare distribuită normal cu parametri.

Să fim de acord să numim funcția o funcție de distribuție normală. Anexa (Tabelul 1) conține tabele cu valorile funcției.

Să exprimăm funcția de distribuție (6.3.3) a mărimii cu parametri și prin funcția de distribuție normală. Evident,

Acum să găsim probabilitatea ca o variabilă aleatoare să cadă pe secțiunea de la până la . Conform formulei (6.3.1)

Astfel, am exprimat probabilitatea ca o variabilă aleatoare distribuită conform unei legi normale cu orice parametri să intre într-o secțiune prin funcția de distribuție standard corespunzătoare celei mai simple legi normale cu parametrii 0.1. Rețineți că argumentele funcției din formula (6.3.7) au un sens foarte simplu: există distanța de la capătul drept al secțiunii până la centrul de împrăștiere, exprimată în abateri standard; - aceeași distanță pentru capătul din stânga al secțiunii, iar această distanță este considerată pozitivă dacă capătul este situat la dreapta centrului de dispersie, și negativă dacă este la stânga.

Ca orice funcție de distribuție, funcția are următoarele proprietăți:

3. - funcţie nedescrescătoare.

În plus, din simetria distribuției normale cu parametri relativ la origine rezultă că

Folosind această proprietate, strict vorbind, ar fi posibil să se limiteze tabelele de funcții doar la valori pozitive ale argumentelor, dar pentru a evita o operație inutilă (scăderea de la unul), Anexa Tabelul 1 oferă valori atât pentru argumentele pozitive, cât și pentru cele negative.

În practică, întâmpinăm adesea problema calculării probabilității ca o variabilă aleatorie distribuită normal să cadă într-o zonă care este simetrică față de centrul de împrăștiere. Să considerăm o astfel de secțiune de lungime (Fig. 6.3.1). Să calculăm probabilitatea de a atinge această zonă folosind formula (6.3.7):

Ținând cont de proprietatea (6.3.8) a funcției și dând partea stângă a formulei (6.3.9) o formă mai compactă, obținem o formulă pentru probabilitatea ca o variabilă aleatoare distribuită conform legii normale să se încadreze într-un zonă simetrică față de centrul de împrăștiere:

. (6.3.10)

Să rezolvăm următoarea problemă. Să trasăm segmentele succesive de lungime din centrul de dispersie (Fig. 6.3.2) și să calculăm probabilitatea ca o variabilă aleatorie să cadă în fiecare dintre ele. Deoarece curba normală este simetrică, este suficient să reprezentați astfel de segmente doar într-o singură direcție.

Folosind formula (6.3.7) găsim:

(6.3.11)

După cum se poate observa din aceste date, probabilitățile de a atinge fiecare dintre următoarele segmente (al cincilea, al șaselea etc.) cu o precizie de 0,001 sunt egale cu zero.

Rotunjind probabilitățile de a intra în segmente la 0,01 (la 1%), obținem trei numere care sunt ușor de reținut:

0,34; 0,14; 0,02.

Suma acestor trei valori este 0,5. Aceasta înseamnă că, pentru o variabilă aleatorie distribuită normal, toată dispersia (cu o precizie de fracțiuni de procent) se încadrează în zona .

Acest lucru permite, cunoscând abaterea standard și așteptările matematice ale unei variabile aleatoare, să se indice aproximativ intervalul valorilor sale practic posibile. Această metodă de estimare a intervalului de valori posibile ale unei variabile aleatoare este cunoscută în statistici matematice numită „regula celor trei sigma”. Regula celor trei sigma implică și o metodă aproximativă pentru determinarea abaterii standard a unei variabile aleatoare: luați abaterea maximă posibilă practic de la medie și împărțiți-o la trei. Desigur, această tehnică brută poate fi recomandată numai dacă nu există alte metode mai precise de determinare.

Exemplul 1. O variabilă aleatoare distribuită conform unei legi normale reprezintă o eroare în măsurarea unei anumite distanțe. La măsurare, este permisă o eroare sistematică în direcția supraestimării cu 1,2 (m); Abaterea standard a erorii de măsurare este de 0,8 (m). Găsiți probabilitatea ca abaterea valorii măsurate de la valoarea adevărată să nu depășească 1,6 (m) în valoare absolută.

Soluţie. Eroarea de măsurare este o variabilă aleatorie supusă legii normale cu parametrii și . Trebuie să găsim probabilitatea ca această cantitate să cadă pe secțiunea de la până la . Conform formulei (6.3.7) avem:

Folosind tabelele de funcții (Anexă, Tabelul 1), găsim:

; ,

Exemplul 2. Găsiți aceeași probabilitate ca în exemplul anterior, dar cu condiția să nu existe o eroare sistematică.

Soluţie. Folosind formula (6.3.10), presupunând , găsim:

Exemplul 3. O țintă care arată ca o bandă (autostradă), a cărei lățime este de 20 m, este trasă într-o direcție perpendiculară pe autostradă. Viziunea se efectuează de-a lungul liniei centrale a autostrăzii. Abaterea standard în direcția de tragere este egală cu m. Există o eroare sistematică în direcția de tragere: abaterea este de 3 m.

Legea normală a distribuției probabilităților

Fără exagerare, poate fi numită lege filosofică. Observând diferite obiecte și procese din lumea din jurul nostru, de multe ori ne întâlnim cu faptul că ceva nu este suficient și că există o normă:


Iată o vedere de bază funcții de densitate distribuție normală de probabilitate și vă urez bun venit la această lecție interesantă.

Ce exemple poți da? Există pur și simplu întuneric din ele. Aceasta, de exemplu, este înălțimea, greutatea oamenilor (și nu numai), a lor forță fizică, capacitate mentala etc. Există o „masă principală” (dintr-un motiv sau altul)și există abateri în ambele sensuri.

Acestea sunt caracteristici diferite ale obiectelor neînsuflețite (aceeași dimensiune, greutate). Aceasta este o durată aleatorie a proceselor, de exemplu, timpul unei curse de o sută de metri sau transformarea rășinii în chihlimbar. Din fizică, mi-am amintit moleculele de aer: unele dintre ele sunt lente, altele rapide, dar majoritatea se mișcă la viteze „standard”.

Apoi, ne abatem de la centru cu încă o abatere standard și calculăm înălțimea:

Marcarea punctelor pe desen (Culoarea verde) și vedem că acest lucru este destul.

În etapa finală, desenăm cu atenție un grafic și deosebit de atent reflectă-l convex/concav! Ei bine, probabil că ați realizat cu mult timp în urmă că axa x este asimptotă orizontală, și este absolut interzis să „urcați” în spatele lui!

Când depuneți o soluție electronic, este ușor să creați un grafic în Excel și, în mod neașteptat pentru mine, am înregistrat chiar și un scurt videoclip pe acest subiect. Dar mai întâi, să vorbim despre cum se schimbă forma curbei normale în funcție de valorile și.

Când creșteți sau descreșteți „a” (cu „sigma” constantă) graficul îşi păstrează forma şi se deplasează la dreapta/la stânga respectiv. Deci, de exemplu, când funcția ia forma iar graficul nostru „se mută” cu 3 unități la stânga - exact la originea coordonatelor:


O cantitate distribuită normal cu zero așteptări matematice a primit un nume complet natural - centrat; funcția sa de densitate este chiar, iar graficul este simetric față de ordonată.

În cazul schimbării „sigma” (cu constantă „a”), graficul „rămâne același”, dar își schimbă forma. Când este mărită, devine mai jos și alungită, ca o caracatiță care își întinde tentaculele. Și, invers, la scăderea graficului devine mai îngustă și mai înaltă- se dovedește a fi o „caracatiță surprinsă”. Da cand scădea„sigma” de două ori: graficul anterior se îngustează și se întinde de două ori:

Totul este în deplină conformitate cu transformări geometrice ale graficelor.

Se numește o distribuție normală cu o valoare sigma unitară normalizat, și dacă este și centrat(cazul nostru), atunci se numește o astfel de distribuție standard. Are o funcție de densitate și mai simplă, care a fost deja găsită în Teorema locală a lui Laplace: . Distribuția standard și-a găsit aplicație largă în practică și foarte curând îi vom înțelege în sfârșit scopul.

Ei bine, acum hai să ne uităm la film:

Da, absolut corect - cumva nemeritat a rămas în umbră funcția de distribuție a probabilității. Să ne amintim de ea definiție:
– probabilitatea ca o variabilă aleatorie să ia o valoare MAI MINĂ decât variabila care „parcurge” toate valorile reale până la „plus” infinit.

În interiorul integralei, se folosește de obicei o literă diferită, astfel încât să nu existe „suprapuneri” cu notația, deoarece aici fiecare valoare este asociată cu integrală improprie, care este egal cu unii număr din intervalul .

Aproape toate valorile nu pot fi calculate cu precizie, dar așa cum tocmai am văzut, cu puterea de calcul modernă, acest lucru nu este dificil. Astfel, pentru funcția de distribuție standard, funcția Excel corespunzătoare conține în general un singur argument:

=NORMSDIST(z)

Unu, doi - și gata:

Desenul arată clar implementarea tuturor proprietățile funcției de distribuție, iar din nuanțele tehnice de aici ar trebui să acordați atenție asimptote orizontaleși punctul de inflexiune.

Acum să ne amintim una dintre sarcinile cheie ale subiectului, și anume, să aflăm cum să găsim probabilitatea ca o variabilă aleatorie normală va lua valoarea din interval. Geometric, această probabilitate este egală cu zonăîntre curba normală și axa x din secțiunea corespunzătoare:

dar de fiecare dată când încerc să obțin o valoare aproximativă este nerezonabil și, prin urmare, este mai rațional de utilizat formula „ușoară”.:
.

! De asemenea, își amintește , Ce

Aici puteți utiliza din nou Excel, dar există câteva „dar” semnificative: în primul rând, nu este întotdeauna la îndemână, iar în al doilea rând, valorile „gata făcute” vor ridica cel mai probabil întrebări din partea profesorului. De ce?

Am mai vorbit despre asta de multe ori: la un moment dat (și nu cu mult timp în urmă) un calculator obișnuit era un lux, iar metoda „manuală” de rezolvare a problemei în cauză este încă păstrată în literatura educațională. Esența lui este să standardiza valorile „alfa” și „beta”, adică reduc soluția la distribuția standard:

Notă : funcția este ușor de obținut din cazul generalfolosind liniar înlocuitori. Apoi, de asemenea:

iar din înlocuirea efectuată urmează exact formula pentru trecerea de la valorile unei distribuții arbitrare la valorile corespunzătoare ale distribuției standard.

De ce este necesar acest lucru? Faptul este că valorile au fost calculate meticulos de strămoșii noștri și compilate într-un tabel special, care se află în multe cărți despre terwer. Dar și mai des există un tabel de valori, despre care ne-am ocupat deja Teorema integrală a lui Laplace:

Dacă avem la dispoziție un tabel de valori ale funcției Laplace , apoi rezolvăm prin ea:

Valorile fracționale sunt în mod tradițional rotunjite la 4 zecimale, așa cum se face în tabelul standard. Și pentru control există Punctul 5 aspect.

Vă reamintesc asta și pentru a evita confuzia controlează întotdeauna, un tabel cu CE funcție este în fața ochilor tăi.

Răspuns este necesar să fie dat ca procent, astfel încât probabilitatea calculată trebuie înmulțită cu 100, iar rezultatul trebuie furnizat cu un comentariu semnificativ:

– cu un zbor de la 5 la 70 m, aproximativ 15,87% din obuze vor cădea

Ne antrenăm pe cont propriu:

Exemplul 3

Diametrul rulmenților fabricați din fabrică este o variabilă aleatorie, distribuită în mod normal, cu o așteptare matematică de 1,5 cm și o abatere standard de 0,04 cm. Aflați probabilitatea ca dimensiunea unui rulment selectat aleatoriu să fie cuprinsă între 1,4 și 1,6 cm.

În soluția eșantion și mai jos, voi folosi funcția Laplace ca cea mai comună opțiune. Apropo, rețineți că, conform formulării, capetele intervalului pot fi incluse în considerația de aici. Cu toate acestea, acest lucru nu este critic.

Și deja în acest exemplu ne-am întâlnit un caz special– când intervalul este simetric în raport cu așteptarea matematică. Într-o astfel de situație, poate fi scris sub forma și, folosind ciudățenia funcției Laplace, simplificată formula de lucru:


Se apelează parametrul delta deviere din așteptarea matematică, iar inegalitatea dublă poate fi „ambalată” folosind modul:

– probabilitatea ca valoarea unei variabile aleatoare să se abate de la așteptarea matematică cu mai puțin de .

E bine că soluția se încadrează într-o singură linie :)
– probabilitatea ca diametrul unui rulment luat la întâmplare să difere de la 1,5 cm cu cel mult 0,1 cm.

Rezultatul acestei sarcini s-a dovedit a fi aproape de unitate, dar aș dori o fiabilitate și mai mare - și anume, să aflu limitele în care se află diametrul aproape toti rulmenti. Există vreun criteriu pentru asta? Există! La întrebarea pusă răspunde așa-zisa

regula trei sigma

Esența sa este aceea practic de încredere este faptul că o variabilă aleatoare distribuită normal va lua o valoare din interval .

Într-adevăr, probabilitatea abaterii de la valoarea așteptată este mai mică decât:
sau 99,73%

În ceea ce privește rulmenții, este vorba de 9973 de piese cu un diametru de la 1,38 la 1,62 cm și doar 27 de exemplare „substandard”.

În cercetarea practică, regula „trei sigma” este de obicei folosită în direcție inversă: Dacă statistic S-a constatat că aproape toate valorile variabilă aleatoare în studiu se încadrează într-un interval de 6 abateri standard, atunci există motive convingătoare pentru a crede că această valoare este distribuită conform unei legi normale. Verificarea se realizează folosind teorie ipotezele statistice.

Continuăm să rezolvăm problemele dure sovietice:

Exemplul 4

Valoarea aleatorie a erorii de cântărire este distribuită conform legii normale cu așteptări matematice zero și o abatere standard de 3 grame. Găsiți probabilitatea ca următoarea cântărire să fie efectuată cu o eroare care să nu depășească 5 grame în valoare absolută.

Soluţie foarte simplu. După condiție, notăm imediat că la următoarea cântărire (ceva sau cineva) vom obține aproape 100% rezultatul cu o precizie de 9 grame. Dar problema implică o abatere mai restrânsă și conform formulei:

– probabilitatea ca următoarea cântărire să fie efectuată cu o eroare care să nu depășească 5 grame.

Răspuns:

Problema rezolvată este fundamental diferită de una aparent similară. Exemplul 3 lectie despre distributie uniforma. A fost o eroare rotunjire rezultatele măsurătorilor, aici vorbim despre eroarea aleatorie a măsurătorilor în sine. Astfel de erori apar din cauza caracteristici tehnice dispozitivul în sine (gama de erori acceptabile este de obicei indicată în pașaportul său), și, de asemenea, din vina experimentatorului - când noi, de exemplu, „cu ochi” luăm citiri din acul acelorași cântare.

Printre altele, există și așa-numitele sistematic erori de măsurare. Este deja Nu la nimereală erori care apar din cauza configurării sau funcționării incorecte a dispozitivului. De exemplu, cântarele de podea nereglementate pot „adăuga” în mod constant kilograme, iar vânzătorul cântărește în mod sistematic clienții. Sau poate fi calculată nu sistematic. Cu toate acestea, în orice caz, o astfel de eroare nu va fi aleatorie, iar așteptarea sa este diferită de zero.

…Dezvolt urgent un curs de instruire în vânzări =)

Să rezolvăm singuri problema inversă:

Exemplul 5

Diametrul rolei este o variabilă aleatorie distribuită normal, abaterea sa standard este egală cu mm. Aflați lungimea intervalului, simetric față de așteptarea matematică, în care este probabil să cadă lungimea diametrului rolei.

Punctul 5* layout-ul de proiectare a ajuta. Vă rugăm să rețineți că așteptările matematice nu sunt cunoscute aici, dar acest lucru nu ne împiedică deloc să rezolvăm problema.

Și o sarcină de examen pe care o recomand cu căldură pentru a consolida materialul:

Exemplul 6

O variabilă aleatoare distribuită în mod normal este specificată de parametrii săi (așteptările matematice) și (deviația standard). Necesar:

a) notează densitatea de probabilitate și descrie schematic graficul acesteia;
b) aflați probabilitatea ca acesta să ia o valoare din interval ;
c) găsiți probabilitatea ca valoarea absolută să se abate de la cel mult ;
d) folosind regula „trei sigma”, găsiți valorile variabilei aleatoare.

Astfel de probleme sunt oferite peste tot, iar de-a lungul anilor de practică am rezolvat sute și sute dintre ele. Asigurați-vă că exersați desenarea manuală a unui desen și folosind tabele de hârtie;)

Ei bine, voi privi un exemplu de complexitate crescută:

Exemplul 7

Densitatea distribuției de probabilitate a unei variabile aleatoare are forma . Găsiți, așteptări matematice, varianță, funcție de distribuție, construiți grafice de densitate și funcții de distribuție, găsiți.

Soluţie: În primul rând, să observăm că condiția nu spune nimic despre natura variabilei aleatoare. Prezența unui exponent în sine nu înseamnă nimic: se poate dovedi, de exemplu, indicativ sau chiar arbitrar distribuție continuă. Și, prin urmare, „normalitatea” distribuției trebuie să fie justificată:

Din moment ce funcţia determinat la orice valoarea reală și poate fi redusă la forma , apoi variabila aleatoare este distribuită conform legii normale.

Începem. Pentru aceasta selectați un pătrat complet si organizeaza fracție cu trei etaje:


Asigurați-vă că efectuați o verificare, revenind indicatorul la forma sa originală:

, ceea ce am vrut să vedem.

Prin urmare:
- De regula operațiunilor cu puteri"ciupiți" Și aici puteți nota imediat caracteristicile numerice evidente:

Acum să găsim valoarea parametrului. Deoarece multiplicatorul distribuției normale are forma și , atunci:
, de unde exprimăm și substituim în funcția noastră:
, după care vom parcurge din nou înregistrarea cu ochii și ne vom asigura că funcția rezultată are forma .

Să construim un grafic de densitate:

și graficul funcției de distribuție :

Dacă nu aveți Excel sau chiar un calculator obișnuit la îndemână, atunci ultimul grafic poate fi construit cu ușurință manual! La un moment dat, funcția de distribuție capătă o valoare și se găsește aici

Sa luam in considerare caz special, când parametrii de distribuție m = 0 .σ = 1 . Distributie normala N(0;1) este numit standard distributie normala. În acest caz, densitatea distribuției

(22)

Curba de distribuție construită folosind formula distribuției normale standard are o formă în formă de clopot, axa verticală este axa de simetrie, axa orizontală este asimptota. Valoarea maximă a ordonatei este

Pentru valorile argumentului x = ± 3, valorile funcției sunt aproape de zero: cu o suprafață totală sub curba de distribuție egală cu unu, 99,73% se află în acest interval. Rețineți că în interval x = ± 2 se află 95,44% din aria de sub curba de distribuție și în interval X= ±1 - 68,26%.

Figura 3.- Curba de distribuție normală standard

La modificarea unui parametru T graficul este deplasat la dreapta sau la stânga astfel încât linia dreaptă x=t- axa de simetrie

Figura 4 - Efectul parametrului T arată ca o curbă de distribuție normală

Pe măsură ce parametrul σ crește, maximul curbei de distribuție scade atunci când acesta scade, curba se întinde în sus, în timp ce conform condiției de normalizare, aria de sub curba de distribuție rămâne constantă (și egală cu unitatea);

Figura 5 - Influența parametrului σ asupra aspectului curbei de distribuție normală.

Luați în considerare din nou distribuția normală standard N(0,1). Funcția unei astfel de distribuții este uneori numită funcție Laplace, are o denumire specială Ф(х).

(23)

Această funcție este tabelată. De exemplu, F(2,48) = 0,9934. Graficul funcției este prezentat în Fig.

Figura 6 - Graficul funcției standard de distribuție normală

Simetria graficului implică relația

Ф(-х) = 1-Ф(х)

Tabulate și cuantile de distribuție normală

Cuantila de distribuție normală a ordinului p - acest număr sus , pentru care Ф(u p) = p .De exemplu,=1,645

Din simetria graficului funcției de distribuție normală standard și a formulei, urmează o relație utilă pentru cuantile:

u 1- p = u p

Este posibil să se stabilească o legătură între funcția de distribuție F(x) pentru distribuția N(m,σ) și funcția de distribuție normală standard:

(24)

Probabilitatea ca o variabilă aleatorie distribuită normal să se încadreze în intervalul de la x 1 la x 2 este determinată de formula

Adesea în calcule este necesar să se găsească probabilitatea ca o variabilă aleatorie X nu se va abate prea mult de la așteptările sale matematice m:

Regula celor trei sigma

Fie, de exemplu, ε = 3σ. Folosind tabelele funcției standard de distribuție normală găsim:

prin urmare, probabilitatea ca o variabilă aleatorie să se abate de la așteptările matematice cu mai mult de 3σ este neglijabilă:



Un astfel de eveniment este aproape imposibil. În acest sens, în practică așa-numitul regula trei sigma: abaterea unei variabile aleatoare distribuite normal de la așteptările ei matematice, de regulă, nu depășește de trei ori abaterea standard.

Luați în considerare aplicarea proprietăților distribuției normale

Exemplu.1 Rolele cu un diametru nominal de 10 mm sunt produse pe o mașină automată. Abaterea standard care caracterizează precizia mașinii este σ = 0,03 mm. În medie, câte role dintr-o sută îndeplinesc standardul dacă acest lucru necesită ca diametrul să se abate de la diametrul nominal cu cel mult 0,05 mm?

Vor fi, de asemenea, probleme pe care le rezolvați singur, la care puteți vedea răspunsurile.

Distribuție normală: fundamente teoretice

Exemple de variabile aleatoare distribuite conform unei legi normale sunt înălțimea unei persoane și masa peștilor din aceeași specie capturați. Distribuția normală înseamnă următoarele : există valori ale înălțimii umane, masa de pești din aceeași specie, care sunt percepute intuitiv ca „normale” (și de fapt, mediate), iar într-o probă suficient de mare se găsesc mult mai des decât cele care diferă în sus sau în jos.

Distribuția normală de probabilitate a unei variabile aleatoare continue (uneori o distribuție gaussiană) poate fi numită în formă de clopot datorită faptului că funcția de densitate a acestei distribuții, simetrică față de medie, este foarte asemănătoare cu tăietura unui clopot (curba roșie). în figura de mai sus).

Probabilitatea de a întâlni anumite valori într-un eșantion este egală cu aria figurii de sub curbă, iar în cazul unei distribuții normale vedem că sub partea de sus a „clopotului”, care corespunde valorilor. tinzând spre medie, aria și, prin urmare, probabilitatea, este mai mare decât sub margini. Astfel, obținem același lucru care s-a spus deja: probabilitatea de a întâlni o persoană de înălțime „normală” și de a prinde un pește de greutate „normală” este mai mare decât pentru valori care diferă în sus sau în jos. În multe cazuri practice, erorile de măsurare sunt distribuite conform unei legi apropiate de normal.

Să ne uităm din nou la figura de la începutul lecției, care arată funcția de densitate a unei distribuții normale. Graficul acestei funcții a fost obținut prin calcularea unui anumit eșantion de date din pachetul software STATISTICA. Pe el, coloanele histogramei reprezintă intervale de valori ale eșantionului, a căror distribuție este apropiată de (sau, după cum se spune în mod obișnuit în statistică, nu diferă semnificativ de) graficul real al funcției de densitate a distribuției normale, care este o curbă roșie. . Graficul arată că această curbă este într-adevăr în formă de clopot.

Distribuția normală este valoroasă în multe feluri, deoarece cunoscând doar valoarea așteptată a unei variabile aleatoare continue și abaterea ei standard, puteți calcula orice probabilitate asociată cu acea variabilă.

Distribuția normală are și avantajul de a fi una dintre cele mai ușor de utilizat. teste statistice utilizate pentru testarea ipotezelor statistice - testul t Student- poate fi utilizat numai dacă datele eșantionului respectă legea distribuției normale.

Funcția de densitate a distribuției normale a unei variabile aleatoare continue poate fi găsit folosind formula:

,

Unde X- valoarea cantității în schimbare, - valoarea medie, - abaterea standard, e=2,71828... - baza logaritmului natural, =3,1416...

Proprietăți ale funcției de densitate de distribuție normală

Modificările mediei mută curba funcției de densitate normală spre axă Bou. Dacă crește, curba se deplasează la dreapta, dacă scade, atunci la stânga.

Dacă abaterea standard se modifică, se modifică înălțimea vârfului curbei. Când abaterea standard crește, vârful curbei este mai mare, iar când scade, este mai jos.

Probabilitatea ca o variabilă aleatoare distribuită normal să se încadreze într-un interval dat

Deja în acest paragraf vom începe să rezolvăm probleme practice, al căror sens este indicat în titlu. Să vedem ce posibilități oferă teoria pentru rezolvarea problemelor. Conceptul de pornire pentru calcularea probabilității ca o variabilă aleatorie distribuită normal să se încadreze într-un interval dat este funcția cumulativă a distribuției normale.

Funcția de distribuție normală cumulativă:

.

Cu toate acestea, este problematic să se obțină tabele pentru fiecare combinație posibilă de medie și abatere standard. Prin urmare, una dintre modalitățile simple de a calcula probabilitatea ca o variabilă aleatoare distribuită normal să se încadreze într-un interval dat este utilizarea tabelelor de probabilități pentru distribuția normală standardizată.

O distribuție normală se numește standardizată sau normalizată., a cărui medie este , iar abaterea standard este .

Funcția de densitate de distribuție normală standardizată:

.

Funcția cumulativă a distribuției normale standardizate:

.

Figura de mai jos prezintă funcția integrală a distribuției normale standardizate, al cărei grafic a fost obținut prin calcularea unui anumit eșantion de date în pachetul software STATISTICA. Graficul în sine este o curbă roșie, iar valorile eșantionului se apropie de el.


Pentru a mări imaginea, puteți da clic pe ea cu butonul stâng al mouse-ului.

Standardizarea unei variabile aleatoare înseamnă trecerea de la unitățile originale utilizate în sarcină la unitățile standardizate. Standardizarea se realizează conform formulei

În practică, toate valorile posibile ale unei variabile aleatoare sunt adesea necunoscute, astfel încât valorile mediei și ale abaterii standard nu pot fi determinate cu precizie. Ele sunt înlocuite cu media aritmetică a observațiilor și abaterea standard s. Magnitudinea z exprimă abaterile valorilor unei variabile aleatoare de la media aritmetică la măsurarea abaterilor standard.

Interval deschis

Tabelul de probabilitate pentru distribuția normală standardizată, care poate fi găsit în aproape orice carte de statistică, conține probabilitățile ca o variabilă aleatorie să aibă o distribuție normală standard Z va lua o valoare mai mică decât un anumit număr z. Adică va cădea în intervalul deschis de la minus infinit până la z. De exemplu, probabilitatea ca cantitatea Z mai mic de 1,5, egal cu 0,93319.

Exemplul 1. Compania produce piese a căror durată de viață este distribuită în mod normal cu o medie de 1000 de ore și o abatere standard de 200 de ore.

Pentru o piesă selectată aleatoriu, calculați probabilitatea ca durata de viață a acesteia să fie de cel puțin 900 de ore.

Soluţie. Să introducem prima notație:

Probabilitatea dorită.

Valorile variabilelor aleatoare sunt într-un interval deschis. Dar știm cum să calculăm probabilitatea ca o variabilă aleatoare să ia o valoare mai mică decât una dată și, în funcție de condițiile problemei, trebuie să găsim una egală sau mai mare decât una dată. Aceasta este cealaltă parte a spațiului de sub curba de densitate normală (clopot). Prin urmare, pentru a găsi probabilitatea dorită, trebuie să scădeți din unitate probabilitatea menționată ca variabila aleatoare să ia o valoare mai mică decât 900 specificat:

Acum variabila aleatoare trebuie să fie standardizată.

Continuăm să introducem notația:

z = (X ≤ 900) ;

X= 900 - valoarea specificată a variabilei aleatoare;

μ = 1000 - valoare medie;

σ = 200 - abatere standard.

Folosind aceste date, obținem condițiile problemei:

.

Conform tabelelor cu variabile aleatoare standardizate (limita intervalului) z= −0,5 corespunde unei probabilități de 0,30854. Scădeți-l din unitate și obțineți ceea ce este necesar în enunțul problemei:

Deci, probabilitatea ca piesa să aibă o durată de viață de cel puțin 900 de ore este de 69%.

Această probabilitate poate fi obținută folosind funcția MS Excel NORM.DIST (valoare integrală - 1):

P(X≥900) = 1 - P(X≤900) = 1 - NORM.DIST(900; 1000; 200; 1) = 1 - 0,3085 = 0,6915.

Despre calcule în MS Excel - într-unul dintre paragrafele următoare ale acestei lecții.

Exemplul 2.Într-un anumit oraș, venitul mediu anual al familiei este o variabilă aleatorie distribuită în mod normal, cu o medie de 300.000 și o abatere standard de 50.000. Se știe că venitul a 40% dintre familii este mai mic decât A. Găsiți valoarea A.

Soluţie. În această problemă, 40% nu este altceva decât probabilitatea ca variabila aleatoare să ia o valoare dintr-un interval deschis care este mai mică decât o anumită valoare, indicată de litera A.

Pentru a găsi valoarea A, mai întâi compunem funcția integrală:

În funcție de condițiile problemei

μ = 300000 - valoare medie;

σ = 50000 - abaterea standard;

X = A- cantitatea de găsit.

Alcătuirea unei egalități

.

Din tabelele statistice constatăm că probabilitatea de 0,40 corespunde valorii limitei intervalului z = −0,25 .

Prin urmare, creăm egalitatea

și găsiți-i soluția:

A = 287300 .

Răspuns: 40% dintre familii au venituri mai mici de 287.300.

Interval închis

În multe probleme este necesar să se găsească probabilitatea ca o variabilă aleatoare distribuită normal să ia o valoare în intervalul de la z 1 la z 2. Adică va cădea într-un interval închis. Pentru a rezolva astfel de probleme, este necesar să găsiți în tabel probabilitățile corespunzătoare limitelor intervalului și apoi să găsiți diferența dintre aceste probabilități. Acest lucru necesită scăderea valorii mai mici din cea mai mare. Exemple de soluții la aceste probleme comune sunt următoarele și vi se cere să le rezolvați singur, iar apoi puteți vedea soluțiile și răspunsurile corecte.

Exemplul 3. Profitul unei întreprinderi pentru o anumită perioadă este o variabilă aleatorie supusă legii distribuției normale cu o valoare medie de 0,5 milioane. și abaterea standard 0,354. Determinați, cu două zecimale, probabilitatea ca profitul întreprinderii să fie de la 0,4 la 0,6 c.u.

Exemplul 4. Lungimea piesei fabricate este o variabilă aleatorie distribuită conform legii normale cu parametri μ =10 și σ =0,071. Găsiți probabilitatea de defecte, cu precizie cu două zecimale, dacă dimensiunile admise ale piesei trebuie să fie 10±0,05.

Sugestie: în această problemă, pe lângă găsirea probabilității ca o variabilă aleatorie să se încadreze într-un interval închis (probabilitatea de a primi o piesă nedefectă), trebuie să efectuați încă o acțiune.

vă permite să determinați probabilitatea ca valoarea standardizată Z nu mai puțin -z si nu mai mult +z, Unde z- o valoare selectată în mod arbitrar a unei variabile aleatoare standardizate.

O metodă aproximativă pentru verificarea normalității unei distribuții

O metodă aproximativă de verificare a normalității distribuției valorilor eșantionului se bazează pe următoarele proprietatea distribuției normale: coeficientul de asimetrie β 1 și coeficientul de curtoză β 2 sunt egale cu zero.

Coeficient de asimetrie β 1 caracterizează numeric simetria distribuţiei empirice faţă de medie. Dacă coeficientul de asimetrie egal cu zero, atunci media aritmetică, mediana și modul sunt egale: iar curba densității distribuției este simetrică față de medie. Dacă coeficientul de asimetrie este mai mic decât zero (β 1 < 0 ), atunci media aritmetică este mai mică decât mediana, iar mediana, la rândul său, este mai mică decât modul () și curba este deplasată spre dreapta (comparativ cu distribuția normală). Dacă coeficientul de asimetrie este mai mare decât zero (β 1 > 0 ), atunci media aritmetică este mai mare decât mediana, iar mediana, la rândul său, este mai mare decât modul () și curba este deplasată spre stânga (comparativ cu distribuția normală).

Coeficientul de kurtoză β 2 caracterizează concentrarea distribuţiei empirice în jurul mediei aritmetice în direcţia axei Oişi gradul de vârf al curbei densităţii distribuţiei. Dacă coeficientul de curtoză este mai mare decât zero, atunci curba este mai alungită (comparativ cu distribuția normală) de-a lungul axei Oi(graficul este mai cu vârf). Dacă coeficientul de curtoză este mai mic decât zero, atunci curba este mai aplatizată (comparativ cu distribuția normală) de-a lungul axei Oi(graficul este mai obtuz).

Coeficientul de asimetrie poate fi calculat folosind funcția MS Excel SKOS. Dacă bifați o matrice de date, atunci trebuie să introduceți intervalul de date într-o casetă „Număr”.


Coeficientul de curtoză poate fi calculat folosind funcția MS Excel KURTESS. Când verificați o matrice de date, este suficient să introduceți intervalul de date într-o casetă „Număr”.


Deci, după cum știm deja, cu o distribuție normală, coeficienții de asimetrie și curtoză sunt egali cu zero. Dar dacă am obține coeficienți de asimetrie de -0,14, 0,22, 0,43 și coeficienți de curtoză de 0,17, -0,31, 0,55? Întrebarea este destul de corectă, deoarece în practică avem de-a face numai cu valori aproximative, eșantion de asimetrie și curtoză, care sunt supuse unei împrăștieri inevitabile, necontrolate. Prin urmare, nu se poate cere ca acești coeficienți să fie strict egali cu zero, ei trebuie să fie suficient de aproape de zero; Dar ce înseamnă suficient?

Este necesar să se compare valorile empirice obținute cu valorile acceptabile. Pentru a face acest lucru, trebuie să verificați următoarele inegalități (comparați valorile coeficienților modulului cu valorile critice - limitele zonei de testare a ipotezelor).

Pentru coeficientul de asimetrie β 1 .