İstatistikte normal dağılımın özellikleri. Standart normal dağılım. Doğada ve uygulamalarda normal dağılım

) özellikle oynar önemli rol olasılık teorisinde ve çoğunlukla pratik problemlerin çözümünde kullanılır. Başlıca özelliği, çok yaygın tipik koşullar altında diğer dağıtım yasalarının yaklaştığı sınırlayıcı yasa olmasıdır. Örneğin, yeterince büyük sayıda bağımsız (veya zayıf bağımlı) rastgele değişkenlerin toplamı yaklaşık olarak normal yasaya uyar ve bu daha doğrudur, daha fazla rastgele değişken toplanır.

Ölçüm hatalarının, yapı yapılarının elemanlarının imalat ve montajı sırasında geometrik boyutlarındaki ve konumlarındaki sapmaların, malzemelerin fiziksel ve mekanik özelliklerinin değişkenliğinin ve bina yapılarına etki eden yüklerin normal yasaya tabi olduğu deneysel olarak kanıtlanmıştır.

Hemen hemen tüm rastgele değişkenler, ortalama değerlerden sapmasına, her biri ayrı ayrı önemsiz olan geniş bir rastgele faktör kümesinden kaynaklanan Gauss dağılımına uyar. (Merkezi Limit Teoremi).

normal dağılım olasılık yoğunluğunun forma sahip olduğu rastgele bir sürekli değişkenin dağılımı olarak adlandırılır (Şekil 18.1).

Pirinç. 18.1. 1 için normal dağılım yasası< a 2 .

(18.1)

nerede a ve dağıtım parametreleridir.

olasılık özellikleri rastgele değişken normal yasaya göre dağıtılan , eşittir:

Matematiksel beklenti (18.2)

Dağılım (18.3)

Standart sapma (18.4)

asimetri katsayısı bir = 0(18.5)

AŞIRI E= 0. (18.6)

Gauss dağılımına dahil edilen σ parametresi, rastgele bir değişkenin kök-ortalama-kare oranına eşittir. Değer a dağıtım merkezinin konumunu belirler (bkz. Şekil 18.1) ve değeri a- dağıtım genişliği (Şekil 18.2), yani. ortalama etrafında istatistiksel dağılım.

Pirinç. 18.2. σ 1 için normal dağılım yasası< σ 2 < σ 3

Normal bir dağılım için belirli bir aralığa (x 1'den x 2'ye) düşme olasılığı, her durumda olduğu gibi, olasılık yoğunluğunun (18.1) integrali ile belirlenir, bu terim cinsinden ifade edilmez. temel fonksiyonlar ve Laplace işlevi adı verilen özel bir işlevle temsil edilir. (olasılıkların integrali).

Olasılık integralinin temsillerinden biri:

(18.7)

Değer ve isminde çeyreklik.

Görüldüğü gibi F(x) - Tek işlev, yani F(-x) = -F(x) . Bu fonksiyonun değerleri teknik ve eğitim literatüründe tablolar şeklinde hesaplanır ve sunulur.


Normal yasanın dağılım fonksiyonu (Şekil 18.3), olasılık integrali cinsinden ifade edilebilir:

(18.9)

Pirinç. 18.2. Normal dağılım yasasının işlevi.

Normal yasaya göre dağıtılan bir rasgele değişkenin aralığına düşme olasılığı X. x'e, şu ifadeyle belirlenir:

bu not alınmalı

Ф(0) = 0; Ф(∞) = 0,5; Ф(-∞) = -0.5.

Dağılımla ilgili pratik problemleri çözerken, genellikle matematiksel beklentiye göre simetrik olan bir aralığa düşme olasılığı göz önünde bulundurulmalıdır, eğer bu aralığın uzunluğu, yani. aralığın kendisinin ile arasında bir sınırı varsa, elimizde:

Pratik problemleri çözerken, rastgele değişkenlerin sapma sınırları, standart, standart sapma, rastgele bir değişkenin sapma alanının sınırlarını belirleyen belirli bir faktörle çarpılarak ifade edilir.

(18.10) formülünü ve F (x) tablosunu (Ek No. 1) alarak ve kullanarak, elde ederiz.

Bu formüller gösterir bir rastgele değişken normal dağılıma sahipse, ortalama değerinden en fazla σ sapma olasılığı %68,27, %2σ - %95,45 ve en fazla 3σ - %99,73 olur.

0.9973 değeri birliğe yakın olduğu için, rastgele bir değişkenin normal dağılımının matematiksel beklentiden 3σ'dan fazla sapması pratik olarak imkansızdır. Yalnızca normal bir dağılım için geçerli olan bu kurala üç sigma kuralı denir. İhlal büyük ihtimalle P = 1 - 0,9973 = 0,0027. Bu kural, ürünlerin ve yapıların geometrik özelliklerinin toleranslarının izin verilen sapmalarının sınırlarını belirlerken kullanılır.

Normal dağılıma sahip rasgele değişkenlerle ilgili birçok problemde, parametrelerle normal yasaya uyan bir rasgele değişkenin ile ile arasındaki aralığa düşme olasılığının belirlenmesi gerekir. Bu olasılığı hesaplamak için genel formülü kullanırız.

miktarın dağılım fonksiyonu nerede .

Parametrelerle normal yasaya göre dağılmış bir rasgele değişkenin dağılım fonksiyonunu bulalım. Değerin dağılım yoğunluğu:

Buradan dağıtım fonksiyonunu buluyoruz.

. (6.3.3)

(6.3.3) integralindeki değişkenin değişimini yapalım.

ve forma getirin:

(6.3.4)

İntegral (6.3.4), temel fonksiyonlar cinsinden ifade edilmez, ancak ifade eden özel bir fonksiyon cinsinden hesaplanabilir. kesin integral tabloların derlendiği ifadeden veya (olasılık integrali olarak adlandırılır). Bu tür işlevlerin birçok çeşidi vardır, örneğin:

;

vb. Bu işlevlerden hangisinin kullanılacağı bir zevk meselesidir. Böyle bir fonksiyon seçeceğiz

. (6.3.5)

Bu fonksiyonun, parametrelerle normal olarak dağıtılmış bir rastgele değişken için dağıtım fonksiyonundan başka bir şey olmadığını görmek kolaydır.

Fonksiyonu normal dağılım fonksiyonu olarak adlandırmayı kabul ediyoruz. Ek (Tablo 1), fonksiyon değerleri tablolarını gösterir.

Niceliğin dağılım fonksiyonunu (6.3.3) parametrelerle ve normal dağılım fonksiyonu cinsinden ifade edelim. Açıkça,

Şimdi ile arasındaki segmentte rastgele bir değişkene çarpma olasılığını bulalım. Formüle (6.3.1) göre

Böylece, herhangi bir parametre ile normal yasaya göre dağılan bir rastgele değişkenin, 0.1 parametreleriyle en basit normal yasaya karşılık gelen standart dağılım fonksiyonu cinsinden arsaya düşme olasılığını ifade ettik. Formül (6.3.7)'deki fonksiyon argümanlarının çok basit bir anlamı olduğuna dikkat edin: bölümün sağ ucundan dağılım merkezine kadar standart sapmalarla ifade edilen bir mesafe vardır; - bölümün sol ucu için aynı mesafe ve bu mesafe, uç, dağılım merkezinin sağında bulunuyorsa pozitif, solundaysa negatif olarak kabul edilir.

Herhangi bir dağıtım işlevi gibi, işlev aşağıdaki özelliklere sahiptir:

3. - azalmayan fonksiyon.

Ek olarak, orijine ilişkin parametrelerle normal dağılımın simetrisinden şu sonuç çıkar:

Bu özelliği kullanarak, aslında, işlevin tablolarını yalnızca argümanın pozitif değerleriyle sınırlamak mümkün olacaktır, ancak gereksiz bir işlemden (birinden çıkarma) kaçınmak için, ekin Tablo 1'i değerleri listeler. hem olumlu hem de olumsuz argümanlar için.

Pratikte, normal olarak dağılmış bir rasgele değişkenin, dağılım merkezi etrafında simetrik olan bir alana düşme olasılığının hesaplanması sorunuyla sık sık karşılaşılır. Böyle bir uzunluk bölümü düşünün (Şekil 6.3.1). Bu siteye çarpma olasılığını (6.3.7) formülü kullanarak hesaplayalım:

Fonksiyonun (6.3.8) özelliğini hesaba katarak ve formülün (6.3.9) sol tarafına daha kompakt bir form vererek, normal yasaya göre dağıtılmış bir rastgele değişkenin bir saçılma merkezine göre simetrik bölüm:

. (6.3.10)

Aşağıdaki problemi çözelim. Saçılma merkezinden ardışık uzunluk parçalarını bir kenara koyalım (Şekil 6.3.2) ve her birine rastgele bir değişkenin düşme olasılığını hesaplayalım. Normal yasanın eğrisi simetrik olduğundan, bu tür bölümleri yalnızca bir yönde ertelemek yeterlidir.

(6.3.7) formülüne göre şunları buluruz:

(6.3.11)

Bu verilerden de anlaşılacağı gibi, aşağıdaki segmentlerin (beşinci, altıncı vb.) her birine 0.001 doğrulukla ulaşma olasılıkları sıfıra eşittir.

Segmentlere ulaşma olasılıklarını 0,01'e (%1'e kadar) yuvarlayarak, hatırlanması kolay üç sayı elde ederiz:

0,34; 0,14; 0,02.

Bu üç değerin toplamı 0,5'tir. Bu, normal olarak dağıtılan bir rastgele değişken için tüm dağılımların (yüzdenin kesirlerine kadar) bölüme uyduğu anlamına gelir.

Bu, bir rastgele değişkenin standart sapmasını ve matematiksel beklentisini bilerek, pratik olarak olası değerlerinin aralığını yaklaşık olarak belirtmeye izin verir. Rastgele bir değişkenin olası değerlerinin aralığını tahmin etmek için böyle bir yöntem bilinmektedir. matematiksel istatistiküç sigma kuralı denir. Üç sigma kuralı aynı zamanda rastgele bir değişkenin standart sapmasını belirlemek için yaklaşık bir yöntem anlamına gelir: ortalamadan pratik olarak mümkün olan maksimum sapmayı alırlar ve onu üçe bölerler. Tabii ki, bu kaba yöntem yalnızca, belirlemenin başka, daha doğru bir yolu yoksa önerilebilir.

Örnek 1. Normal yasaya göre dağıtılan bir rastgele değişken, belirli bir mesafenin ölçülmesinde bir hatadır. Ölçüm yaparken, 1.2 (m) fazla tahmin yönünde sistematik bir hataya izin verilir; ölçüm hatasının standart sapması 0,8 (m)'dir. Ölçülen değerin gerçek değerden sapmasının mutlak değerde 1,6 (m)'yi geçmeme olasılığını bulun.

Karar. Ölçüm hatası, ve parametreleriyle normal yasaya uyan rastgele bir değişkendir. Bu miktarın ile aralığına düşme olasılığını bulmamız gerekiyor. (6.3.7) formülüne göre:

Fonksiyon tablolarını (Ek, Tablo 1) kullanarak şunları buluruz:

; ,

Örnek 2. Bir önceki örnektekiyle aynı olasılığı bulun, ancak sistematik bir hata olmaması şartıyla.

Karar. (6.3.10) formülüne göre, varsayarak şunları buluruz:

Örnek 3. Genişliği 20 m olan bir şerit (otoyol) gibi görünen bir hedefe, otoyola dik bir yönde atış yapılır. Hedefleme, karayolunun merkez hattı boyunca gerçekleştirilir. Atış yönündeki standart sapma m'ye eşittir.Ateş yönünde sistematik bir hata var: undershoot 3 m.Otoba tek atışla çarpma olasılığını bulun.

Olasılık dağılımının normal yasası

Abartmadan, felsefi bir yasa olarak adlandırılabilir. Çevremizdeki dünyanın çeşitli nesnelerini ve süreçlerini gözlemlerken, çoğu zaman bir şeyin yeterli olmadığı ve bir norm olduğu gerçeğiyle karşılaşırız:


İşte temel bir görünüm yoğunluk fonksiyonları normal olasılık dağılımı ve bu en ilginç derse hoş geldiniz.

Hangi örnekler verilebilir? Onlar sadece karanlık. Bu, örneğin, insanların boyu, ağırlığı (ve sadece değil), onların Fiziksel gücü, zihinsel kapasite vb. "kitle" var (öyle ya da böyle) ve her iki yönde de sapmalar var.

Bunlar cansız nesnelerin farklı özellikleridir (aynı boyutlar, ağırlık). Bu, örneğin yüz metrelik bir yarışın zamanı veya reçinenin kehribara dönüşmesi gibi rastgele bir süreç süresidir. Fizikten akla hava molekülleri geldi: aralarında yavaş olanlar var, hızlı olanlar var ama çoğu “standart” hızlarda hareket ediyor.

Ardından, merkezden bir standart sapma daha saparız ve yüksekliği hesaplarız:

Çizimdeki işaretleme noktaları (yeşil renk) ve bunun oldukça yeterli olduğunu görüyoruz.

Son aşamada dikkatlice bir grafik çiziyoruz ve özellikle dikkatle onu yansıt dışbükeylik / içbükeylik! Muhtemelen uzun zaman önce apsis ekseninin Yatay asimptot, ve bunun için “tırmanmak” kesinlikle imkansız!

Çözümün elektronik tasarımı ile grafiği Excel'de oluşturmak kolaydır ve beklenmedik bir şekilde kendim için bu konuyla ilgili kısa bir video bile kaydettim. Ama önce normal eğrinin şeklinin ve değerlerine bağlı olarak nasıl değiştiğinden bahsedelim.

"a"yı arttırırken veya azaltırken (değişmeyen "sigma" ile) grafik şeklini korur ve sağa / sola hareket eder sırasıyla. Örneğin, fonksiyon şu şekli aldığında ve grafiğimiz 3 birim sola "hareket eder" - tam olarak orijine:


Sıfır matematiksel beklentisi olan normal dağılımlı bir miktar tamamen doğal bir isim aldı - merkezli; yoğunluk fonksiyonu Bile, ve grafik y eksenine göre simetriktir.

"sigma"da bir değişiklik olması durumunda ("a" sabiti ile), grafik "yerinde kalır", ancak şekil değiştirir. Büyütüldüğünde, dokunaçlarını geren bir ahtapot gibi alçalır ve uzar. Ve tersi, grafiği düşürürken daha dar ve uzun olur- "şaşırmış ahtapot" çıkıyor. Evet, saat azalmak iki kez "sigma": önceki tablo iki kez daralır ve uzar:

Her şey tam uyumludur grafiklerin geometrik dönüşümleri.

Birim değeri olan normal dağılıma "sigma" denir. normalleştirilmiş, ve eğer aynı zamanda merkezli(bizim durumumuz), o zaman böyle bir dağıtım denir standart. Daha önce karşılaşılmış olan daha da basit bir yoğunluk fonksiyonuna sahiptir. yerel Laplace teoremi: . Standart dağıtım pratikte geniş uygulama alanı buldu ve çok yakında amacını anlayacağız.

Şimdi bir film izleyelim:

Evet, oldukça doğru - bir şekilde haksız yere gölgede kaldık olasılık dağılım fonksiyonu. onu hatırlıyoruz tanım:
- rastgele bir değişkenin tüm gerçek değerleri "artı" sonsuza kadar "çalışan" değişkenden DAHA AZ bir değer alma olasılığı.

İntegralin içinde, notasyonda "bindirme" olmaması için genellikle farklı bir harf kullanılır, çünkü burada her değer atanır uygun olmayan integral bazılarına eşit olan sayı aralığından.

Hemen hemen tüm değerler tam olarak hesaplanamaz, ancak az önce gördüğümüz gibi, modern hesaplama gücü ile bu zor değil. Bu nedenle, standart dağıtım işlevi için karşılık gelen Excel işlevi genellikle bir argüman içerir:

=NORMSDAĞ(z)

Bir, iki - ve bitirdiniz:

Çizim, hepsinin uygulanmasını açıkça göstermektedir. dağıtım işlevi özellikleri, ve buradaki teknik nüanslardan dikkat etmelisiniz yatay asimptotlar ve bir bükülme noktası.

Şimdi konunun temel görevlerinden birini hatırlayalım, yani, nasıl bulunacağını öğrenelim - normal bir rastgele değişken olma olasılığı aralıktan bir değer alacak. Geometrik olarak, bu olasılık eşittir alan karşılık gelen bölümde normal eğri ve x ekseni arasında:

ancak her seferinde yaklaşık bir değer belirleyin mantıksız ve bu nedenle kullanmak daha mantıklı "kolay" formül:
.

! ayrıca hatırlıyor , ne

Burada Excel'i tekrar kullanabilirsiniz, ancak birkaç önemli “ama” vardır: ilk olarak, her zaman elinizin altında değildir ve ikincisi, “hazır” değerler, büyük olasılıkla öğretmenden sorular soracaktır. Niye ya?

Bundan daha önce defalarca bahsettim: bir zamanlar (ve çok uzun zaman önce değil) sıradan bir hesap makinesi bir lükstü ve söz konusu sorunu çözmenin “manuel” yolu eğitim literatüründe hala korunmaktadır. Onun özü standartlaştırmak"alfa" ve "beta" değerleri, yani çözümü standart dağılıma indirger:

Not : işlevin genel durumdan elde edilmesi kolaydırdoğrusal kullanarak ikameler. Sonra ve:

ve değiştirmeden, keyfi bir dağılımın değerlerinden standart dağılımın karşılık gelen değerlerine geçiş formülünü takip eder.

Bu neden gerekli? Gerçek şu ki, değerler atalarımız tarafından titizlikle hesaplandı ve terver ile ilgili birçok kitapta bulunan özel bir tabloda özetlendi. Ama daha da yaygın olanı, daha önce ele aldığımız değerler tablosudur. Laplace integral teoremi:

Elimizde Laplace fonksiyonunun bir değerler tablosu varsa , sonra çözüyoruz:

Kesirli değerler, standart tabloda yapıldığı gibi geleneksel olarak 4 ondalık basamağa yuvarlanır. Ve kontrol için madde 5 Yerleşim.

Size bunu hatırlatırım ve karışıklığı önlemek için her zaman kontrol altında ol, NE işlevi tablosu gözlerinizin önünde.

Cevap yüzde olarak verilmesi gerekir, bu nedenle hesaplanan olasılık 100 ile çarpılmalı ve sonuca anlamlı bir yorum getirilmelidir:

- 5 ila 70 m uçuşla, mermilerin yaklaşık %15,87'si düşecek

Kendi başımıza eğitiyoruz:

Örnek 3

Fabrikada imal edilen rulmanların çapı, 1,5 cm beklentisi ve 0,04 cm standart sapması ile normal olarak dağılan rastgele bir değişkendir.Rastgele alınan bir rulmanın boyutunun 1,4 ila 1,6 cm arasında olma olasılığını bulun.

Örnek çözümde ve aşağıda, en yaygın seçenek olarak Laplace işlevini kullanacağım. Bu arada, ifadeye göre, burada dikkate alınan aralığın sonlarını dahil edebileceğinizi unutmayın. Ancak, bu kritik değil.

Ve zaten bu örnekte tanıştık özel bir durum– aralık, matematiksel beklentiye göre simetrik olduğunda. Böyle bir durumda, şu şekilde yazılabilir ve Laplace fonksiyonunun tuhaflığını kullanarak çalışma formülünü basitleştirin:


Delta parametresi denir sapma matematiksel beklentiden ve çift eşitsizlik kullanılarak "paketlenebilir" modül:

rastgele bir değişkenin değerinin matematiksel beklentiden daha az sapma olasılığıdır.

Peki, tek satıra sığan çözüm :)
rastgele alınan bir yatağın çapının 1,5 cm'den 0,1 cm'den fazla olmaması olasılığıdır.

Bu görevin sonucu birliğe yakın çıktı, ancak daha fazla güvenilirlik istiyorum - yani çapın olduğu sınırları bulmak neredeyse herkes rulmanlar. Bunun bir kriteri var mı? Mevcut! Soru sözde tarafından cevaplanır

üç sigma kuralı

Onun özü şudur pratik olarak güvenilir normal dağılan bir rastgele değişkenin aralıktan bir değer alacağı gerçeğidir. .

Gerçekten de, beklentiden sapma olasılığı şundan daha azdır:
veya %99.73

"Rulmanlar" açısından - bunlar 1,38 ila 1,62 cm çapında 9973 parça ve sadece 27 "standart altı" kopyadır.

Pratik araştırmalarda, genellikle "üç sigma" kuralı kullanılır. ters yön: Eğer istatistiksel olarak hemen hemen tüm değerlerin incelenen rastgele değişken 6 standart sapma aralığına sığarsa, bu değerin normal yasaya göre dağıtıldığına inanmak için iyi nedenler vardır. Doğrulama teori kullanılarak gerçekleştirilir istatistiksel hipotezler.

Zorlu Sovyet görevlerini çözmeye devam ediyoruz:

Örnek 4

Tartım hatasının rastgele değeri, sıfır matematiksel beklenti ve 3 gramlık bir standart sapma ile normal yasaya göre dağıtılır. Bir sonraki tartımın mutlak değerde 5 gramı geçmeyen bir hata ile yapılması olasılığını bulunuz.

KararÇok basit. Duruma göre ve hemen bir sonraki tartımda not ediyoruz (bir şey veya birisi) 9 gramlık bir doğrulukla neredeyse %100 sonuç alacağız. Ancak problemde daha dar bir sapma var ve formüle göre:

- Bir sonraki tartımın 5 gramı aşmayan bir hatayla yapılma olasılığı.

Cevap:

Çözülmüş bir problem, görünüşte benzer bir problemden temelde farklıdır. Örnek 3 hakkında ders üniforma dağıtımı. Bir hata oluştu yuvarlamaölçüm sonuçları, burada ölçümlerin kendi rastgele hatasından bahsediyoruz. Bu hatalar nedeniyle ortaya çıkıyor teknik özellikler enstrümanın kendisi (İzin verilen hataların aralığı, kural olarak pasaportunda belirtilir), ve ayrıca deneycinin hatasıyla - örneğin, "gözle" aynı ölçeklerin okundan okumalar aldığımızda.

Diğerlerinin yanı sıra, sözde sistematikölçüm hataları. Çoktan Rastgele olmayan cihazın yanlış kurulumu veya çalışması nedeniyle oluşan hatalar. Bu nedenle, örneğin, ayarlanmamış yer kantarları sürekli olarak bir kilogramı "ekleyebilir" ve satıcı sistematik olarak alıcıların ağırlığını azaltır. Veya sistematik olarak değil, çünkü kısa sürede değiştirebilirsiniz. Ancak, her durumda, böyle bir hata rastgele olmayacaktır ve beklentisi sıfırdan farklıdır.

…Acil olarak bir satış eğitimi kursu geliştiriyorum =)

Sorunu kendi başımıza çözelim:

Örnek 5

Silindir çapı, rastgele, normal olarak dağıtılan bir rastgele değişkendir, standart sapması mm'dir. Boncuk çapının uzunluğunun olasılıkla düşeceği matematiksel beklentiye göre simetrik olan aralığın uzunluğunu bulun.

Madde 5* dizayn görünümü yardım etmek. Lütfen matematiksel beklentinin burada bilinmediğini, ancak bu sorunun çözümüne en ufak bir müdahalede bulunmadığını unutmayın.

Ve materyali birleştirmek için şiddetle tavsiye ettiğim sınav görevi:

Örnek 6

Normal dağılan bir rastgele değişken, parametreleri (matematiksel beklenti) ve (standart sapma) tarafından verilir. Gerekli:

a) olasılık yoğunluğunu yazın ve grafiğini şematik olarak gösterin;
b) aralıktan bir değer alma olasılığını bulun ;
c) modülün 'den daha fazla sapma göstermeme olasılığını bulun;
d) "üç sigma" kuralını uygulayarak, rastgele değişkenin değerlerini bulun.

Bu tür problemler her yerde karşımıza çıkıyor ve yıllarca pratik yaparak yüzlercesini çözebildim. Elle çizim yapmayı ve kağıt hesap tablolarını kullanmayı unutmayın ;)

Artan karmaşıklığın bir örneğini analiz edeceğim:

Örnek 7

Rastgele bir değişkenin olasılık dağılım yoğunluğu şu şekildedir: . Bul , matematiksel beklenti , varyans , dağılım fonksiyonu , çizim yoğunluğu ve dağılım fonksiyonları , bul .

Karar: öncelikle koşulun rastgele değişkenin doğası hakkında bir şey söylemediğine dikkat edelim. Tek başına, katılımcının varlığı hiçbir şey ifade etmez: örneğin, gösterici veya genellikle keyfi sürekli dağıtım. Ve bu nedenle, dağılımın “normalliği”nin hala kanıtlanması gerekiyor:

fonksiyon beri belirlenen hiç gerçek değer ve forma indirgenebilir, daha sonra rastgele değişken normal yasaya göre dağıtılır.

Sunuyoruz. Bunun için tam bir kare seçin ve organize etmek üç katlı kesir:


Göstergeyi orijinal formuna döndürerek bir kontrol yaptığınızdan emin olun:

görmek istediğimiz şey buydu.

Böylece:
- üzerinde güç kuralı"çimdikleme". Ve burada bariz sayısal özellikleri hemen yazabilirsiniz:

Şimdi parametrenin değerini bulalım. Normal dağılım çarpanı forma sahip olduğundan ve , o zaman:
işlevimizi ifade ettiğimiz ve değiştirdiğimiz:
, bundan sonra bir kez daha kaydın üzerinden gözlerimizle gözden geçireceğiz ve ortaya çıkan fonksiyonun forma sahip olduğundan emin olacağız. .

Yoğunluğu çizelim:

ve dağıtım fonksiyonunun grafiği :

Elinizde Excel ve hatta normal bir hesap makinesi yoksa, son tablo kolayca manuel olarak oluşturulur! Bu noktada dağıtım fonksiyonu bir değer alır ve burada

Düşünmek özel durum dağıtım parametreleri m = 0 .σ = 1 . Normal dağılım N(0;1) denir standart normal dağılım. Bu durumda dağıtım yoğunluğu

(22)

Standart normal dağılım formülüne göre oluşturulan dağılım eğrisi çan şeklindedir, dikey eksen simetri ekseni, yatay olan asimptottur. Ordinatın maksimum değeri

Argüman değerleri için x = ± 3'te, fonksiyonun değerleri sıfıra yakındır: dağılım eğrisinin altındaki toplam alan bire eşit olduğunda, %99,73 bu aralıkta yer alır. aralığında olduğunu unutmayın x = ± 2, dağılım eğrisi altındaki alanın %95,44'ü ve aralık içinde yer alır. X= ±1 - %68.26.

Şekil 3.- Standart normal dağılım eğrisi

Parametreyi değiştirirken t grafik sağa veya sola kaydırılır, böylece çizgi x=t- simetri ekseni

Şekil 4 - Parametrenin etkisi t normal dağılım eğrisi gibi

σ parametresindeki bir artışla, bir azalma ile dağılım eğrisinin maksimumu azalır ve eğri yukarı doğru uzanırken, normalizasyon koşuluna göre dağılım eğrisi altındaki alan sabit kalır (ve bire eşit)

Şekil 5 - σ parametresinin normal dağılım eğrisi üzerindeki etkisi.

Standart normal dağılımı tekrar düşünün N(0,1). Böyle bir dağılımın işlevine bazen Laplace işlevi denir, özel bir atama F (x) vardır. Denklemi yazabilirsiniz.

(23)

Bu fonksiyon tablolaştırılmıştır. Örneğin, Ф(2.48) = = 0.9934. Fonksiyonun grafiği Şekil 1 de gösterilmiştir.

Şekil 6 - Standart normal dağılım fonksiyonunun grafiği

Grafiğin simetrisinden ilişkiyi takip eder

F(-x) = 1-F(x)

tablolaştırılmış ve normal dağılımın nicelikleri

p mertebesinin normal dağılım niceliği - bu numara yukarı , hangisi için Ф(u p) = p .Örneğin,=1.645

Standart normal dağılım fonksiyonunun grafiğinin simetrisinden ve formülden, nicelikler için yararlı bir ilişki aşağıdaki gibidir:

u 1- p = u p

N(m,σ) dağılımı için F(x) dağılım işlevi ile standart normal dağılım işlevi arasında bir ilişki kurabilirsiniz:

(24)

Normal dağılıma sahip bir rastgele değişkenin x 1 ila x 2 aralığına düşme olasılığı aşağıdaki formülle belirlenir.

Genellikle hesaplamalarda rastgele bir değişkenin olma olasılığını bulmak gerekir. X beklenen m değerinden çok fazla sapmaz:

Üç Sigma Kuralı

Örneğin, ε = 3σ olsun. Standart normal dağılım fonksiyonunun tablolarını kullanarak şunları buluruz:

bu nedenle, rastgele bir değişkenin matematiksel beklentiden 3σ'dan fazla sapma olasılığı ihmal edilebilir:



Böyle bir olay neredeyse imkansızdır. Bu sebeple sözde üç sigma kuralı: normal olarak dağılmış bir rastgele değişkenin matematiksel beklentisinden sapması, kural olarak, standart sapmanın üç katını geçmez.

Normal dağılımın özelliklerinin uygulamasını düşünün

Örnek 1 10 mm nominal çapa sahip merdaneler otomatik makinede üretilmektedir. Makinenin doğruluğunu karakterize eden standart sapma σ = 0,03 mm'dir. Çapın nominalden 0,05 mm'den fazla sapmamasını gerektiriyorsa, ortalama olarak yüzden kaç rulo standardı karşılar?

Ayrıca, cevaplarını görebileceğiniz bağımsız bir çözüm için görevler olacaktır.

Normal dağılım: teorik temeller

Normal yasaya göre dağıtılan rastgele değişkenlerin örnekleri, bir kişinin boyu, aynı türden yakalanan balıkların kütlesidir. Normal dağılım şu anlama gelir : Sezgisel olarak "normal" (ve aslında - ortalama) olarak algılanan insan boyu, aynı türden balık kütlesi değerleri vardır ve bunlar, yeterince büyük bir örneklemde bunlardan çok daha yaygındır. yukarı veya aşağı farklılık gösterir.

Sürekli bir rastgele değişkenin (bazen Gauss dağılımı) normal olasılık dağılımı, ortalamaya göre simetrik olan bu dağılımın yoğunluk fonksiyonunun bir çanın kesilmesine çok benzemesi nedeniyle çan şeklinde olarak adlandırılabilir ( yukarıdaki şekilde kırmızı eğri).

Örnekte belirli değerleri karşılama olasılığı, eğrinin altındaki şeklin alanına eşittir ve normal bir dağılım durumunda, "çanın" üst kısmının altında olduğunu görüyoruz. ortalamaya, alana ve dolayısıyla olasılığa eğilimli değerlere karşılık gelen , kenarların altından daha büyüktür. Böylece, daha önce söylenenle aynı şeyi elde ederiz: "normal" boyda bir insanla tanışma, "normal" ağırlıkta bir balık yakalama olasılığı, yukarı veya aşağı farklılık gösteren değerlerden daha yüksektir. Pek çok uygulama durumunda, ölçüm hataları normale yakın bir yasaya göre dağıtılır.

Normal dağılımın yoğunluk fonksiyonunu gösteren dersin başındaki şekilde tekrar duralım. Bu fonksiyonun grafiği, yazılım paketindeki bazı veri örneklerinin hesaplanmasıyla elde edilmiştir. İSTATİSTİK. Üzerinde, histogram sütunları, dağılımı kırmızı bir eğri olan normal dağılım yoğunluk fonksiyonu grafiğine yakın olan (veya istatistiklerde dedikleri gibi, önemli ölçüde farklı olmayan) örnek değerlerin aralıklarını temsil eder. Grafik, bu eğrinin gerçekten çan şeklinde olduğunu göstermektedir.

Normal dağılım birçok yönden değerlidir, çünkü yalnızca sürekli bir rastgele değişkenin ortalamasını ve standart sapmayı bilerek, o değişkenle ilişkili herhangi bir olasılığı hesaplayabilirsiniz.

Normal dağılım, kullanımı en kolay olanlardan biri olma avantajına sahiptir. istatistiksel hipotezleri test etmek için kullanılan istatistiksel kriterler - Student t-testi- yalnızca örnek verilerin normal dağılım yasasına uygun olması durumunda kullanılabilir.

Sürekli bir rastgele değişkenin normal dağılımının yoğunluk fonksiyonu formül kullanılarak bulunabilir:

,

nerede x- değişkenin değeri, - ortalama değer, - standart sapma, e\u003d 2.71828 ... - doğal logaritmanın tabanı, \u003d 3.1416 ...

Normal dağılım yoğunluk fonksiyonunun özellikleri

Ortalamadaki değişiklikler çan eğrisini eksen yönünde hareket ettirir Öküz. Artarsa ​​eğri sağa, azalırsa sola kayar.

Standart sapma değişirse, eğri tepe noktasının yüksekliği değişir. Standart sapma arttığında eğrinin tepesi daha yüksek, düştüğünde ise daha düşüktür.

Normal dağılan bir rastgele değişkenin değerinin belirli bir aralık içinde olma olasılığı

Zaten bu paragrafta, anlamı başlıkta belirtilen pratik sorunları çözmeye başlayacağız. Teorinin problemleri çözmek için hangi olasılıkları sağladığını analiz edelim. Normal dağılıma sahip bir rastgele değişkenin belirli bir aralığa düşme olasılığını hesaplamak için başlangıç ​​konsepti, normal dağılımın integral fonksiyonudur.

İntegral normal dağılım fonksiyonu:

.

Bununla birlikte, ortalama ve standart sapmanın her olası kombinasyonu için tablolar elde etmek sorunludur. Bu nedenle, normal dağılıma sahip bir rastgele değişkenin belirli bir aralığa düşme olasılığını hesaplamanın basit yollarından biri, standart bir normal dağılım için olasılık tablolarını kullanmaktır.

Normal dağılıma standartlaştırılmış veya normalleştirilmiş dağılım denir., ortalama değeri ve standart sapması olan .

Standartlaştırılmış normal dağılımın yoğunluk fonksiyonu:

.

Standartlaştırılmış normal dağılımın kümülatif işlevi:

.

Aşağıdaki şekil, grafiği yazılım paketindeki bazı veri örneklerinin hesaplanmasıyla elde edilen standartlaştırılmış normal dağılımın integral fonksiyonunu göstermektedir. İSTATİSTİK. Grafiğin kendisi kırmızı bir eğridir ve örnek değerler ona yaklaşıyor.


Resmi büyütmek için farenin sol tuşu ile üzerine tıklayabilirsiniz.

Rastgele bir değişkeni standartlaştırmak, görevde kullanılan orijinal birimlerden standart birimlere geçmek anlamına gelir. Standardizasyon formüle göre yapılır.

Pratikte, bir rastgele değişkenin olası tüm değerleri çoğu zaman bilinmez, bu nedenle ortalama ve standart sapmanın değerleri doğru bir şekilde belirlenemez. Bunlar, gözlemlerin aritmetik ortalaması ve standart sapma ile değiştirilir. s. Değer z standart sapmaları ölçerken rastgele bir değişkenin değerlerinin aritmetik ortalamadan sapmalarını ifade eder.

Açık aralık

Hemen hemen tüm istatistik kitaplarında bulunan standartlaştırılmış normal dağılım için olasılık tablosu, rastgele bir değişkenin standart normal dağılıma sahip olma olasılıklarını içerir. Z belirli bir sayıdan daha küçük bir değer alır z. Yani, eksi sonsuzdan açık aralığa düşecektir. z. Örneğin, değerin olma olasılığı Z 1.5'ten küçük, 0.93319'a eşittir.

örnek 1Şirket, ortalama 1000 ve standart sapması 200 saatlik normal dağılım ömrüne sahip parçalar üretmektedir.

Rastgele seçilen bir parça için hizmet ömrünün en az 900 saat olma olasılığını hesaplayın.

Karar. İlk gösterimi sunalım:

İstenen olasılık.

Rastgele değişkenin değerleri açık aralıktadır. Ancak rastgele bir değişkenin verilen bir değerden daha küçük bir değer alma olasılığını hesaplayabiliriz ve problemin durumuna göre verilen değere eşit veya daha büyük bir değer bulması gerekir. Bu, çan eğrisinin altındaki boşluğun diğer kısmıdır. Bu nedenle, istenen olasılığı bulmak için, rastgele değişkenin belirtilen 900'den daha küçük bir değer alacağı belirtilen olasılığın birinden çıkarılması gerekir:

Şimdi rastgele değişkenin standartlaştırılması gerekiyor.

Notasyonu tanıtmaya devam ediyoruz:

z = (X ≤ 900) ;

x= 900 - rastgele bir değişkenin verilen değeri;

μ = 1000 - ortalama değer;

σ = 200 - standart sapma.

Bu verilere dayanarak, sorunun koşullarını elde ederiz:

.

Standart bir rastgele değişkenin tablolarına göre (aralık sınırı) z= −0.5, 0.30854 olasılığa karşılık gelir. Birlikten çıkarın ve sorunun durumunda gerekli olanı alın:

Yani parçanın ömrünün en az 900 saat olma olasılığı %69'dur.

Bu olasılık, MS Excel NORM.DIST işlevi kullanılarak elde edilebilir (integral değerinin değeri 1'dir):

P(X≥900) = 1 - P(X≤900) = 1 - NORM.DAĞ(900; 1000; 200; 1) = 1 - 0,3085 = 0,6915.

MS Excel'deki hesaplamalar hakkında - bu dersin sonraki paragraflarından birinde.

Örnek 2 Bazı şehirlerde ortalama yıllık aile geliri, ortalama değeri 300.000 ve standart sapması 50.000 olan normal dağılımlı bir rastgele değişkendir.Ailelerin %40'ının gelirinin değerden daha az olduğu bilinmektedir. A. Değer bul A.

Karar. Bu problemde %40, rastgele bir değişkenin harfle gösterilen belirli bir değerden daha küçük bir açık aralıktan bir değer alma olasılığından başka bir şey değildir. A.

Değeri bulmak için A, önce integral fonksiyonunu oluşturuyoruz:

göreve göre

μ = 300000 - ortalama değer;

σ = 50000 - standart sapma;

x = A bulunacak değerdir.

eşitlik kurmak

.

İstatistiksel tablolara göre, 0.40 olasılığının aralık sınırının değerine karşılık geldiğini buluyoruz. z = −0,25 .

Bu nedenle, eşitliği yaparız

ve çözümünü bulun:

A = 287300 .

Cevap: Ailelerin %40'ının geliri 287300'den azdır.

kapalı aralık

Birçok problemde, normal dağılıma sahip bir rasgele değişkenin aşağıdaki aralıkta bir değer alma olasılığının bulunması gerekir. z 1 ila z 2. Yani kapalı aralığa düşecektir. Bu tür problemleri çözmek için, aralığın sınırlarına karşılık gelen olasılıkları tabloda bulmak ve ardından bu olasılıklar arasındaki farkı bulmak gerekir. Bu, daha küçük olanın daha büyük olandan çıkarılmasını gerektirir. Bu yaygın sorunları çözme örnekleri aşağıdaki gibidir ve bunları kendiniz çözmeniz önerilir ve ardından doğru çözümleri ve cevapları görebilirsiniz.

Örnek 3 Bir işletmenin belirli bir dönem karı, ortalama değeri 0,5 milyon c.u olan normal dağıtım yasasına tabi rastgele bir değişkendir. ve 0.354'lük bir standart sapma. İşletmenin kârının 0,4 ila 0,6 c.u olma olasılığını iki ondalık basamak doğrulukla belirleyin.

Örnek 4Üretilen parçanın uzunluğu, parametrelerle normal yasaya göre dağıtılan rastgele bir değişkendir. μ =10 ve σ =0.071. Parçanın izin verilen boyutlarının 10 ± 0.05 olması gerekiyorsa, evlilik olasılığını iki ondalık basamak doğrulukla bulun.

İpucu: Bu problemde, rastgele bir değişkenin kapalı bir aralığa düşme olasılığının (arızalı olmayan bir parça elde etme olasılığı) bulunmasına ek olarak, bir işlem daha gereklidir.

standartlaştırılmış değerin olasılığını belirlemenizi sağlar. Z Az değil -z ve daha fazla yok +z, nerede z- standartlaştırılmış bir rastgele değişkenin keyfi olarak seçilmiş bir değeri.

Bir Dağılımın Normalliğini Kontrol Etmek İçin Yaklaşık Bir Yöntem

Örnek değerlerin dağılımının normalliğini kontrol etmek için yaklaşık bir yöntem aşağıdakilere dayanmaktadır: normal dağılımın özelliği: çarpıklık β 1 ve basıklık katsayısı β 2 sıfır.

asimetri katsayısı β 1 ortalamaya göre ampirik dağılımın simetrisini sayısal olarak karakterize eder. asimetri katsayısı ise sıfır, o zaman aritmetrik ortalama, medyan ve mod eşittir: ve dağılım yoğunluğu eğrisi ortalamaya göre simetriktir. Asimetri katsayısı sıfırdan küçükse (β 1 < 0 ), o zaman aritmetik ortalama medyandan daha küçüktür ve medyan da moddan () daha küçüktür ve eğri sağa kaydırılır (normal dağılıma kıyasla). Asimetri katsayısı sıfırdan büyükse (β 1 > 0 ), o zaman aritmetik ortalama medyandan daha büyüktür ve medyan da () modundan daha büyüktür ve eğri sola kaydırılır (normal dağılıma kıyasla).

basıklık katsayısı β 2 eksen yönünde aritmetik ortalama etrafındaki ampirik dağılımın konsantrasyonunu karakterize eder Oy ve dağılım yoğunluğu eğrisinin tepe noktası derecesi. Basıklık katsayısı sıfırdan büyükse, eğri daha uzundur (normal dağılıma kıyasla) eksen boyunca Oy(grafik daha sivridir). Basıklık katsayısı sıfırdan küçükse, eğri daha düzleşir (normal dağılıma kıyasla) eksen boyunca Oy(grafik daha geniştir).

Çarpıklık katsayısı, MS Excel işlevi SKRS kullanılarak hesaplanabilir. Bir veri dizisini kontrol ediyorsanız, bir "Sayı" kutusuna bir dizi veri girmeniz gerekir.


Basıklık katsayısı, MS Excel basıklık işlevi kullanılarak hesaplanabilir. Bir veri dizisini kontrol ederken, veri aralığını bir "Sayı" kutusuna girmek de yeterlidir.


Yani, zaten bildiğimiz gibi, normal bir dağılımda çarpıklık ve basıklık katsayıları sıfıra eşittir. Peki ya -0.14, 0.22, 0.43'e eşit çarpıklık katsayıları ve 0.17, -0.31, 0.55'e eşit basıklık katsayıları varsa? Soru oldukça adil, çünkü pratikte sadece bazı kaçınılmaz, kontrol edilemeyen dağılımlara maruz kalan yaklaşık, seçici asimetri ve basık değerleri ile ilgileniyoruz. Bu nedenle, bu katsayıların sıfıra mutlak eşitliğini istemek imkansızdır, sadece sıfıra yeterince yakın olmaları gerekir. Ama yeterince ne anlama geliyor?

Alınan ampirik değerlerin kabul edilebilir değerlerle karşılaştırılması gerekmektedir. Bunu yapmak için, aşağıdaki eşitsizlikleri kontrol etmeniz gerekir (modül katsayılarının değerlerini kritik değerlerle karşılaştırın - hipotez test alanının sınırları).

asimetri katsayısı için β 1 .