Betrouwbaarheidsinterval formule. Kwantitatieve methoden: betrouwbaarheidsintervallen schatten

Betrouwbaarheidsinterval formule. Kwantitatieve methoden: betrouwbaarheidsintervallen schatten

Betrouwbaarheidsinterval voor verwachte waarde - dit is zo'n interval berekend uit de gegevens, dat met een bekende waarschijnlijkheid de wiskundige verwachting van de algemene bevolking bevat. Een natuurlijke schatting voor de wiskundige verwachting is het rekenkundig gemiddelde van de waargenomen waarden. Daarom zullen we verderop in de les de termen "gemiddeld", "gemiddelde waarde" gebruiken. Bij de taken voor het berekenen van het betrouwbaarheidsinterval is een antwoord van het type "Het betrouwbaarheidsinterval van het gemiddelde [de waarde in een bepaald probleem] is van [lagere waarde] tot [ groter belang] ". Met behulp van het betrouwbaarheidsinterval kunt u niet alleen de gemiddelde waarden schatten, maar ook het specifieke gewicht van een bepaald kenmerk van de algemene populatie. Gemiddelde waarden, variantie, standaarddeviatie en fout, waardoor we tot nieuwe definities en formules, worden in de les gedemonteerd Steekproef- en algemene populatiekenmerken .

Punt- en intervalschattingen van het gemiddelde

Als de gemiddelde waarde van de algemene bevolking wordt geschat door een getal (punt), dan wordt de schatting van de onbekende gemiddelde waarde van de algemene bevolking genomen als het specifieke gemiddelde, dat wordt berekend uit de steekproef van waarnemingen. In dit geval valt de waarde van het steekproefgemiddelde - een willekeurige variabele - niet samen met de gemiddelde waarde van de algemene bevolking. Daarom is het bij het specificeren van de gemiddelde waarde van de steekproef noodzakelijk om tegelijkertijd de steekproeffout aan te geven. Als maat voor de steekproeffout wordt de standaardfout gebruikt, die wordt uitgedrukt in dezelfde meeteenheden als het gemiddelde. Daarom wordt vaak de volgende notatie gebruikt:.

Als de schatting van het gemiddelde moet worden geassocieerd met een bepaalde waarschijnlijkheid, moet de parameter die van belang is voor de algemene bevolking niet worden geschat op basis van één getal, maar met een interval. Het betrouwbaarheidsinterval is het interval waarin, met een bepaalde waarschijnlijkheid P de waarde van de geschatte indicator van de algemene bevolking wordt gevonden. Betrouwbaarheidsinterval, waarin de kans P = 1 - α een willekeurige variabele wordt gevonden, als volgt berekend:

,

α = 1 - P, die te vinden is in de appendix van bijna elk boek over statistiek.

In de praktijk zijn het populatiegemiddelde en de variantie niet bekend, dus de populatievariantie wordt vervangen door de steekproefvariantie en het populatiegemiddelde wordt vervangen door het steekproefgemiddelde. Het betrouwbaarheidsinterval wordt dus in de meeste gevallen als volgt berekend:

.

De formule voor het betrouwbaarheidsinterval kan worden gebruikt om het populatiegemiddelde te schatten als

  • de standaarddeviatie van de algemene bevolking is bekend;
  • of de standaarddeviatie van de populatie is niet bekend, maar de steekproefomvang is groter dan 30.

Het steekproefgemiddelde is de onbevooroordeelde schatting van het populatiegemiddelde. Op zijn beurt is de variantie van de steekproef is geen onbevooroordeelde schatting van de populatievariantie. Om een ​​onbevooroordeelde schatting te krijgen van de variantie van de algemene populatie in de steekproefvariantieformule, is de steekproefomvang N moet worden vervangen door N-1.

Voorbeeld 1. Verzamelde informatie van 100 willekeurig geselecteerde cafés in een stad dat het gemiddelde aantal werknemers daarin 10,5 is met een standaarddeviatie van 4,6. Bepaal het betrouwbaarheidsinterval van 95% van het aantal cafémedewerkers.

waar is de kritische waarde van de standaard normale verdeling voor het significantieniveau α = 0,05 .

Het 95%-betrouwbaarheidsinterval voor het gemiddelde aantal cafémedewerkers varieerde dus van 9,6 tot 11,4.

Voorbeeld 2. Voor een willekeurige steekproef uit een algemene populatie van 64 waarnemingen werden de volgende totaalwaarden berekend:

de som van de waarden in de waarnemingen,

de som van de kwadraten van de afwijking van de waarden van het gemiddelde .

Bereken het 95% betrouwbaarheidsinterval voor de verwachting.

bereken de standaarddeviatie:

,

bereken de gemiddelde waarde:

.

Vervang de waarden in de uitdrukking voor het betrouwbaarheidsinterval:

waar is de kritische waarde van de standaard normale verdeling voor het significantieniveau α = 0,05 .

We krijgen:

Het 95%-betrouwbaarheidsinterval voor de wiskundige verwachting van deze steekproef varieerde dus van 7,484 tot 11,266.

Voorbeeld 3. Voor een willekeurige steekproef uit een algemene populatie van 100 waarnemingen was de gemiddelde waarde 15,2 en de standaarddeviatie 3,2. Bereken het 95%-betrouwbaarheidsinterval voor de verwachting en vervolgens het 99%-betrouwbaarheidsinterval. Als de steekproefomvang en de variatie ervan ongewijzigd blijven en de betrouwbaarheidscoëfficiënt toeneemt, zal het betrouwbaarheidsinterval dan smaller of breder worden?

Vervang deze waarden door de uitdrukking voor het betrouwbaarheidsinterval:

waar is de kritische waarde van de standaard normale verdeling voor het significantieniveau α = 0,05 .

We krijgen:

.

Het 95%-betrouwbaarheidsinterval voor het gemiddelde van deze steekproef varieerde dus van 14,57 tot 15,82.

We vervangen deze waarden opnieuw in de uitdrukking voor het betrouwbaarheidsinterval:

waar is de kritische waarde van de standaard normale verdeling voor het significantieniveau α = 0,01 .

We krijgen:

.

Het 99%-betrouwbaarheidsinterval voor het gemiddelde van deze steekproef varieerde dus van 14,37 tot 16,02.

Zoals u kunt zien, neemt met een toename van de betrouwbaarheidscoëfficiënt ook de kritische waarde van de standaard normale verdeling toe, en daarom liggen de begin- en eindpunten van het interval verder van het gemiddelde, en dus het betrouwbaarheidsinterval want de wiskundige verwachting neemt toe.

Punt- en intervalschattingen van soortelijk gewicht

Het soortelijk gewicht van een bepaald kenmerk van de steekproef kan worden geïnterpreteerd als een puntschatting soortelijk gewicht P hetzelfde kenmerk in de algemene bevolking. Als deze waarde gerelateerd moet worden aan waarschijnlijkheid, dan moet het betrouwbaarheidsinterval van het soortelijk gewicht worden berekend P eigenschap in de algemene populatie met een waarschijnlijkheid P = 1 - α :

.

Voorbeeld 4. Er zijn twee kandidaten in een stad EEN en B lopen voor burgemeester. 200 inwoners van de stad werden willekeurig geïnterviewd, waarvan 46% antwoordde dat ze op de kandidaat zouden stemmen EEN, 26% - voor de kandidaat B en 28% weet niet op wie ze zullen stemmen. Bepaal het 95%-betrouwbaarheidsinterval voor het aandeel stadsbewoners dat de kandidaat steunt EEN.

In dit artikel leer je:

    Wat is er gebeurd Betrouwbaarheidsinterval?

    Wat is de essentie? 3 sigmaregels?

    Hoe kan deze kennis in de praktijk worden toegepast?

Tegenwoordig, als gevolg van een overvloed aan informatie in verband met een groot assortiment van goederen, verkoopgebieden, medewerkers, activiteiten, enz., het kan moeilijk zijn om de belangrijkste te benadrukken, waar u in de eerste plaats op moet letten en inspanningen moet leveren om te beheren. Definitie Betrouwbaarheidsinterval en analyse van het overschrijden van de grenzen van werkelijke waarden - een techniek die helpt u situaties te markeren, invloed hebben op de verandering in trends. Je zult in staat zijn om positieve factoren te ontwikkelen en de invloed van negatieve te verminderen. Deze technologie wordt gebruikt in veel bekende wereldbedrijven.

Er zijn zogenaamde " waarschuwingen ", die informeer managers dat de volgende waarde in een bepaalde richting is ging verder dan Betrouwbaarheidsinterval... Wat betekent dit? Dit is een signaal dat er een niet-standaard gebeurtenis heeft plaatsgevonden, die mogelijk de bestaande trend in deze richting zal veranderen. Dit is het signaal naar het feit om erachter te komen in de situatie en begrijpen wat deze heeft beïnvloed.

Overweeg bijvoorbeeld een paar situaties. We hebben de verkoopprognose berekend met prognosegrenzen voor 100 productitems voor 2011 per maand en de werkelijke verkoop in maart:

  1. Door " Zonnebloemolie»Breekt door de bovengrens van de voorspelling en viel niet binnen het betrouwbaarheidsinterval.
  2. Wat betreft "Dry Yeast", gingen ze verder dan de ondergrens van de voorspelling.
  3. Op de "Oatmeal Porridge" werd de bovengrens doorbroken.

Voor de rest van de goederen bleek de werkelijke verkoop binnen de gestelde prognosegrenzen te liggen. Die. hun verkopen waren in lijn met de verwachtingen. Dus identificeerden we 3 producten die over de grenzen gingen, en begonnen uit te zoeken wat de overschrijding van de grenzen beïnvloedde:

  1. Voor Zonnebloemolie zijn we een nieuw distributienetwerk aangegaan, wat ons extra omzet heeft opgeleverd, waardoor we de bovengrens hebben overschreden. Voor dit product is het de moeite waard om de prognose opnieuw te berekenen tot het einde van het jaar, rekening houdend met de prognose van de verkoop aan dit netwerk.
  2. Wat betreft "Dry Yeast", de auto kwam vast te zitten bij de douane en binnen 5 dagen was er een tekort, wat de verkoopdaling en het overschrijden van de ondergrens beïnvloedde. Het kan de moeite waard zijn om erachter te komen wat de reden was en te proberen deze situatie niet te herhalen.
  3. Er werd een verkooppromotie-evenement gelanceerd voor havermoutpap, wat een aanzienlijke toename van de verkoop opleverde en ertoe leidde dat de prognosegrenzen werden overschreden.

We hebben 3 factoren geïdentificeerd die van invloed waren op het overschrijden van de prognosegrenzen. Er kunnen er veel meer zijn in het leven. Om de nauwkeurigheid van prognoses en planning te verbeteren, de factoren die ertoe leiden dat de werkelijke verkoop de grenzen van de prognose overschrijdt, is het de moeite waard om prognoses en plannen voor hen afzonderlijk te markeren en op te bouwen . En denk dan na over hun impact op de belangrijkste verkoopprognose. U kunt ook regelmatig de impact van deze factoren beoordelen en de situatie ten goede veranderen voor door de invloed van negatieve factoren te verminderen en de invloed van positieve factoren te vergroten.

Met het betrouwbaarheidsinterval kunnen we:

  1. Routebeschrijving markeren, die de moeite waard zijn om aandacht aan te besteden, omdat gebeurtenissen hebben plaatsgevonden in deze richtingen die van invloed kunnen zijn op: trendverandering.
  2. Identificeer factoren die de verandering in de situatie echt beïnvloeden.
  3. Accepteren evenwichtige beslissing(bijvoorbeeld over inkoop, planning, etc.).

Laten we nu eens kijken naar wat een betrouwbaarheidsinterval is en hoe we dit in Excel kunnen berekenen aan de hand van een voorbeeld.

Wat is een betrouwbaarheidsinterval?

Het betrouwbaarheidsinterval is de prognosegrenzen (boven en onder), waarbinnen met een bepaalde kans (sigma) de werkelijke waarden worden opgenomen.

Die. we berekenen de voorspelling - dit is ons belangrijkste referentiepunt, maar we begrijpen dat de werkelijke waarden waarschijnlijk niet 100% gelijk zijn aan onze voorspelling. En de vraag rijst, in welke grenzen? werkelijke waarden kunnen worden opgenomen, als de huidige trend doorzet? En deze vraag zal ons helpen om te beantwoorden betrouwbaarheidsinterval berekening, d.w.z. - de boven- en ondergrenzen van de prognose.

Wat is Sigma Target Probability?

bij het berekenen betrouwbaarheidsinterval kunnen we stel de waarschijnlijkheid in slaan werkelijke waarden binnen de gegeven voorspellingsgrenzen... Hoe je dat doet? Om dit te doen, stellen we de sigma-waarde in en, als sigma gelijk is:

    3 sigma- dan is de kans dat de volgende werkelijke waarde binnen het betrouwbaarheidsinterval valt 99,7%, of 300 tegen 1, of is er een kans van 0,3% om over de grenzen heen te gaan.

    2 sigma- dan is de kans om de volgende waarde binnen de grenzen te bereiken ≈ 95,5%, d.w.z. de kansen zijn ongeveer 20 tegen 1, of er is een kans van 4,5% om buiten de grenzen te gaan.

    1 sigma- dan is de kans ≈ 68,3%, d.w.z. de kans is ongeveer 2 op 1, of er is een kans van 31,7% dat de volgende waarde buiten het betrouwbaarheidsinterval valt.

We hebben geformuleerd: 3 sigmaregel,die zegt dat hit kans volgende willekeurige waarde in het betrouwbaarheidsinterval met een bepaalde waarde drie sigma is 99,7%.

De grote Russische wiskundige Chebyshev bewees de stelling dat er een kans van 10% is om de voorspelde grenzen te overschrijden met een gegeven waarde van drie sigma. Die. de kans om binnen het 3 sigma-betrouwbaarheidsinterval te vallen zal ten minste 90% zijn, terwijl een poging om de voorspelling en de grenzen ervan "met het oog" te berekenen, veel grotere fouten bevat.

Hoe onafhankelijk het betrouwbaarheidsinterval in Excel berekenen?

Laten we eens kijken naar de berekening van het betrouwbaarheidsinterval in Excel (d.w.z. de boven- en ondergrenzen van de prognose) aan de hand van een voorbeeld. We hebben een tijdreeks - verkoop per maand over 5 jaar. Zie bijgevoegd document.

Om de grenzen van de voorspelling te berekenen, berekenen we:

  1. Verkoopprognose().
  2. Sigma - standaarddeviatie prognosemodellen van werkelijke waarden.
  3. Drie sigma.
  4. Betrouwbaarheidsinterval.

1. Verkoopprognose.

= (RC [-14] (gegevens in tijdreeksen)- RC [-1] (modelwaarde)) ^ 2 (kwadraat)


3. Laten we voor elke maand de waarden van afwijkingen van stadium 8 Sum ((Xi-Ximod) ^ 2) samenvatten, dwz vat januari, februari ... voor elk jaar samen.

Gebruik hiervoor de formule = SUMIF ()

SUMIF (een array met de nummers van de perioden binnen de cyclus (voor maanden van 1 tot 12); verwijzing naar het nummer van de periode in de cyclus; verwijzing naar de array met de kwadraten van het verschil tussen de oorspronkelijke gegevens en de waarden van de periodes)


4. Laten we de standaarddeviatie berekenen voor elke periode in de cyclus van 1 tot 12 (10e fase in het bijgevoegde bestand).

Om dit te doen, extraheren we uit de waarde die in stap 9 is berekend, de wortel en delen deze door het aantal perioden in deze cyclus minus 1 = ROOT ((Sum (Xi-Ximod) ^ 2 / (n-1))

Laten we formules gebruiken in Excel = ROOT (R8 (verwijzing naar (Sum (Xi-Ximod) ^ 2)/ (AANTAL.ALS ($ O $ 8: $ O $ 67) (verwijzing naar array met cyclusnummers); O8 (verwijzing naar een specifiek cyclusnummer, die in de array worden geteld))-1))

De Excel-formule gebruiken = AANTAL.ALS we tellen het nummer n


Door de standaarddeviatie van de werkelijke gegevens uit het prognosemodel te berekenen, hebben we de sigmawaarde voor elke maand verkregen - stadium 10 in het bijgevoegde bestand .

3. Laten we 3 sigma berekenen.

In de 11e fase stellen we het aantal sigma in - in ons voorbeeld "3" (11e fase in het bijgevoegde bestand):

Ook praktische sigmawaarden zijn:

1,64 sigma - 10% kans om over de limiet te gaan (1 kans op 10);

1,96 sigma - 5% kans om buiten de grenzen te gaan (1 kans op 20);

2.6 sigma - 1% kans om buiten de grenzen te gaan (1 kans op 100).

5) Drie sigma berekenen, hiervoor vermenigvuldigen we de "sigma"-waarden voor elke maand met "3".

3. Bepaal het betrouwbaarheidsinterval.

  1. De bovengrens van de voorspelling- verkoopprognose rekening houdend met groei en seizoensinvloeden + (plus) 3 sigma;
  2. Ondergrens van de voorspelling- verkoopprognose rekening houdend met groei en seizoensinvloeden - (min) 3 sigma;

Voor het gemak van het berekenen van het betrouwbaarheidsinterval voor een lange periode (zie bijgevoegd bestand), gebruiken we de Excel-formule = Y8 + VERT.ZOEKEN (W8; $ U $ 8: $ V $ 19; 2; 0), waar

Y8- verkoopprognose;

W8- het nummer van de maand waarvoor we de 3-sigma waarde nemen;

Die. De bovengrens van de voorspelling= "Verkoopprognose" + "3 sigma" (in het voorbeeld VERT.ZOEKEN (maandnummer; tabel met 3 sigma-waarden; de kolom waaruit we de sigmawaarde halen) gelijk aan nummer maand in de corresponderende regel; 0)).

Ondergrens van de voorspelling= "Verkoopprognose" minus "3 sigma".

We hebben dus het betrouwbaarheidsinterval in Excel berekend.

Nu hebben we een voorspelling en een bereik met grenzen waarbinnen de werkelijke waarden zullen vallen met een gegeven kans op sigma.

In dit artikel hebben we onderzocht wat sigma is en regel van drie sigma, hoe u het betrouwbaarheidsinterval bepaalt en waarom u deze techniek in de praktijk kunt toepassen.

Nauwkeurige voorspellingen en succes!

Hoe Forecast4AC PRO kan u helpenbij het berekenen van het betrouwbaarheidsinterval?:

    Forecast4AC PRO berekent automatisch de boven- of ondergrenzen van de voorspelling voor meer dan 1000 tijdreeksen tegelijk;

    Het vermogen om met één toetsaanslag de grenzen van de prognose te analyseren in vergelijking met de prognose, trend en werkelijke verkopen op de kaart;

Het Forcast4AC PRO-programma heeft de mogelijkheid om een ​​sigmawaarde van 1 tot 3 in te stellen.

Doe met ons mee!

Downloaden gratis apps voor prognoses en bedrijfsanalyses:


  • Novo Prognose Lite- automatisch prognoseberekening v Excel.
  • 4analytics - ABC-XYZ-analyse en analyse van emissies in Excell.
  • Qlik Sense Bureaublad en QlikViewPersonal Edition - BI-systemen voor data-analyse en visualisatie.

Test de mogelijkheden van betaalde oplossingen:

  • Novo Voorspelling PRO- forecasting in Excel voor grote datasets.

Er zijn twee soorten schattingen in statistieken: punt en interval. Puntschatting is een enkele steekproefstatistiek die wordt gebruikt om een ​​parameter van een populatie te schatten. Bijvoorbeeld, het steekproefgemiddelde is een puntschatting van de wiskundige verwachting van de algemene bevolking en de steekproefvariantie S 2- puntschatting van de variantie van de algemene bevolking 2... er werd aangetoond dat het steekproefgemiddelde een onbevooroordeelde schatting is van de wiskundige verwachting van de algemene bevolking. Het steekproefgemiddelde wordt onbevooroordeeld genoemd omdat het gemiddelde van alle steekproefgemiddelden (voor dezelfde steekproefomvang) N) is gelijk aan de wiskundige verwachting van de algemene bevolking.

Om de steekproefvariantie S 2 werd een onbevooroordeelde schatting van de populatievariantie 2, moet de noemer van de steekproefvariantie gelijk zijn aan N – 1 , maar niet N... Met andere woorden, de variantie van de algemene populatie is het gemiddelde van alle mogelijke steekproefvarianties.

Bij het beoordelen van de parameters van de algemene bevolking moet er rekening mee worden gehouden dat steekproefstatistieken zoals: , afhankelijk van specifieke monsters. Om met dit feit rekening te houden, te verkrijgen: interval schatting de wiskundige verwachting van de algemene bevolking, wordt de verdeling van steekproefgemiddelden geanalyseerd (voor meer details, zie). Het geconstrueerde interval wordt gekenmerkt door een bepaald betrouwbaarheidsniveau, wat de waarschijnlijkheid is dat de ware parameter van de algemene populatie correct wordt geschat. Vergelijkbare betrouwbaarheidsintervallen kunnen worden gebruikt om het aandeel van een kenmerk te schatten R en de belangrijkste verdeelde massa van de algemene bevolking.

Download de notitie in het formaat of, voorbeelden in het formaat

Het betrouwbaarheidsinterval plotten voor de wiskundige verwachting van de algemene bevolking met een bekende standaarddeviatie

Constructie van een betrouwbaarheidsinterval voor het aandeel van een kenmerk in de algemene populatie

In deze sectie wordt het concept van een betrouwbaarheidsinterval uitgebreid tot categorische gegevens. Hiermee kunt u het aandeel van de eigenschap in de algemene populatie schatten. R een samplefrequentie gebruiken RS= X /N... Zoals aangegeven, als de hoeveelheden NR en N(1 - p) het getal 5 overschrijden, kan de binominale verdeling worden benaderd door een normale. Daarom, om het aandeel van een kenmerk in de algemene populatie te beoordelen R een interval kan worden uitgezet waarvan het betrouwbaarheidsniveau is (1 - ) х100%.


waar PS- een selectief aandeel van een kenmerk gelijk aan X/N, d.w.z. het aantal successen gedeeld door de steekproefomvang, R- het aandeel van het kenmerk in de algemene bevolking, Z- de kritische waarde van de gestandaardiseerde normale verdeling, N- steekproefomvang.

Voorbeeld 3. Stel dat van informatie Systeem een voorbeeld van 100 facturen opgehaald die binnen vorige maand... Laten we zeggen dat 10 van deze facturen zijn gemaakt met fouten. Op deze manier, R= 10/100 = 0,1. Het 95%-betrouwbaarheidsniveau komt overeen met de kritische waarde Z = 1,96.

De kans dat tussen 4,12% en 15,88% van de facturen fouten bevat is dus 95%.

Voor een gegeven steekproefomvang lijkt het betrouwbaarheidsinterval dat het aandeel van een kenmerk in de algemene populatie bevat breder te zijn dan voor een continue willekeurige variabele. Dit komt omdat metingen van een continue willekeurige variabele meer informatie bevatten dan metingen van categorische gegevens. Met andere woorden, categorische gegevens die slechts twee waarden aannemen, bevatten niet voldoende informatie om de parameters van hun distributie te schatten.

Vschattingen berekenen die zijn afgeleid van een eindige populatie

Schatting van de wiskundige verwachting. De correctiefactor voor de uiteindelijke populatie ( fpc) werd gebruikt om te verminderen standaardfout op tijd. Bij het berekenen van betrouwbaarheidsintervallen voor schattingen van populatieparameters wordt een correctiefactor toegepast in situaties waarin steekproeven worden opgehaald zonder te worden geretourneerd. Dus het betrouwbaarheidsinterval voor de wiskundige verwachting met een betrouwbaarheidsniveau gelijk aan (1 - ) х100%, wordt berekend met de formule:

Voorbeeld 4. Laten we, om de toepassing van de correctiefactor voor de uiteindelijke populatie te illustreren, terugkeren naar het probleem van het berekenen van het betrouwbaarheidsinterval voor het gemiddelde aantal facturen dat hierboven is besproken in voorbeeld 3. Stel dat een bedrijf 5.000 facturen per maand uitgeeft, en X= 110,27 dollar., S= $ 28,95 N = 5000, N = 100, α = 0,05, t99 = 1,9842. Met formule (6) krijgen we:

Beoordeling van het aandeel van een kenmerk. Bij het kiezen zonder terug te keren, het betrouwbaarheidsinterval voor de fractie van het kenmerk met een betrouwbaarheidsniveau gelijk aan (1 - ) х100%, wordt berekend met de formule:

Betrouwbaarheidsintervallen en ethische kwesties

Ethische problemen doen zich vaak voor bij het bemonsteren van de populatie en het formuleren van statistische conclusies. De belangrijkste is hoe betrouwbaarheidsintervallen en puntschattingen van steekproefstatistieken overeenkomen. Publicatie van puntschattingen zonder passende betrouwbaarheidsintervallen (meestal 95% betrouwbaarheidsniveaus) en steekproefomvang waaruit ze zijn afgeleid, kan misleidend zijn. Dit kan de gebruiker de indruk geven dat de puntschatting precies is wat hij nodig heeft om de eigenschappen van de gehele populatie te voorspellen. Het is dus noodzakelijk om te begrijpen dat in elk onderzoek intervalschattingen op de voorgrond moeten worden geplaatst. Bovendien, Speciale aandacht zou gegeven moeten worden de juiste keuze steekproefomvang.

Meestal zijn de objecten van statistische manipulatie de resultaten van sociologische opiniepeilingen van de bevolking over verschillende politieke kwesties. Tegelijkertijd worden de resultaten van de enquête op de voorpagina's van kranten gezet en worden de fout van het steekproefonderzoek en de methodologie van statistische analyse ergens in het midden afgedrukt. Om de geldigheid van de verkregen puntschattingen te bewijzen, is het noodzakelijk om de grootte van de steekproef aan te geven op basis waarvan ze zijn verkregen, de grenzen van het betrouwbaarheidsinterval en het significantieniveau ervan.

Volgende opmerking:

Gebruikte materialen van het boek Levin en andere Statistieken voor managers. - M.: Williams, 2004 .-- p. 448-462

Centrale limietstelling stelt dat voor een voldoende grote steekproefomvang de steekproefverdeling van gemiddelden kan worden benaderd door een normale verdeling. Deze eigenschap is niet afhankelijk van het type verdeling van de algemene bevolking.

In de vorige paragrafen hebben we de kwestie van het schatten van een onbekende parameter overwogen een een nummer. Deze schatting wordt "punt" genoemd. Bij een aantal taken is het niet alleen nodig om de parameter te vinden: een een geschikte numerieke waarde, maar evalueer ook de nauwkeurigheid en betrouwbaarheid ervan. U wilt weten tot welke fouten een parametervervanging kan leiden een zijn puntschatting een en met welke mate van vertrouwen kunnen we verwachten dat deze fouten binnen de bekende grenzen blijven?

Dit soort problemen zijn vooral relevant voor een klein aantal waarnemingen, wanneer de puntschatting en in voor een groot deel is het toeval en kan de vervanging van a door a bij benadering tot ernstige fouten leiden.

Om een ​​idee te geven van de juistheid en betrouwbaarheid van de beoordeling een,

in wiskundige statistiek worden zogenaamde betrouwbaarheidsintervallen en betrouwbaarheidskansen gebruikt.

Laat voor de parameter een uit ervaring onpartijdige schatting A. We willen de mogelijke fout in dit geval evalueren. Laten we een voldoende grote kans p toekennen (bijvoorbeeld p = 0,9, 0,95 of 0,99), zodat een gebeurtenis met kans p praktisch betrouwbaar kan worden beschouwd, en we vinden een waarde s waarvoor

Dan het bereik van praktisch mogelijke waarden van de fout die optreedt bij het vervangen een op de een, zal ± s zijn; grote fouten in absolute waarde zullen alleen met een kleine kans a = 1 - p verschijnen. Laten we (14.3.1) herschrijven als:

Gelijkheid (14.3.2) betekent dat met kans p de onbekende waarde van de parameter een valt binnen het interval

In dit geval moet een omstandigheid worden opgemerkt. Eerder hebben we herhaaldelijk de kans overwogen dat een willekeurige variabele in een bepaald niet-willekeurig interval valt. Hier is de situatie anders: de hoeveelheid een niet toevallig, maar het interval / p is willekeurig. Willekeurig zijn positie op de as van de abscis, bepaald door zijn middelpunt een; de lengte van het interval 2s is in het algemeen ook willekeurig, aangezien de waarde van s in de regel wordt berekend uit experimentele gegevens. Daarom zou het in dit geval beter zijn om de waarde van p te interpreteren, niet als de kans om het punt te "raken". een in het interval / p, maar als de kans dat het willekeurige interval / p het punt zal dekken een(afb. 14.3.1).

Rijst. 14.3.1

De kans p wordt gewoonlijk genoemd vertrouwensniveau, en het interval / p is Betrouwbaarheidsinterval. Intervalgrenzen Als. een x = een- s en een 2 = een + maar belde vertrouwen grenzen.

Laten we nog een interpretatie geven van het concept van een betrouwbaarheidsinterval: het kan worden beschouwd als een interval van parameterwaarden een, verenigbaar zijn met experimentele gegevens en niet in tegenspraak met hen. Inderdaad, als we overeenkomen om een ​​gebeurtenis met waarschijnlijkheid a = 1-p praktisch onmogelijk te beschouwen, dan zullen die waarden van de parameter a waarvoor een - een> s, moet worden erkend als in tegenspraak met de experimentele gegevens, en die waarvoor | a - een een t na 2.

Laat voor de parameter een er is een onpartijdige schatting A. Als we de distributiewet van de hoeveelheid kenden een, zou het probleem van het vinden van het betrouwbaarheidsinterval heel eenvoudig zijn: het zou voldoende zijn om een ​​dergelijke waarde van s te vinden waarvoor

De moeilijkheid is dat de distributiewet van de schatting een hangt af van de distributiewet van de hoeveelheid x en dus op zijn onbekende parameters (in het bijzonder op de parameter zelf) een).

Om deze moeilijkheid te omzeilen, kan de volgende ruwe benadering worden toegepast: vervang de onbekende parameters in de uitdrukking voor s door hun puntschattingen. met relatief een groot aantal ervaringen P(ongeveer 20 ... 30) deze techniek geeft meestal bevredigende resultaten in termen van nauwkeurigheid.

Beschouw als voorbeeld het probleem van het betrouwbaarheidsinterval voor de wiskundige verwachting.

Laat het geproduceerd worden P X, wiens kenmerken de wiskundige verwachting zijn t en variantie D- onbekend. Voor deze parameters werden de volgende schattingen verkregen:

Het is vereist om het betrouwbaarheidsinterval / p te construeren, overeenkomend met de betrouwbaarheidskans p, voor de wiskundige verwachting t grootheden X.

Bij het oplossen van dit probleem zullen we gebruik maken van het feit dat de hoeveelheid t vertegenwoordigt het bedrag P onafhankelijke identiek verdeelde willekeurige variabelen X h en volgens de centrale limietstelling voor voldoende groot P de distributiewet is bijna normaal. In de praktijk kan, zelfs met een relatief klein aantal termen (ongeveer 10 ... 20), de verdelingswet van de som als ongeveer normaal worden beschouwd. We gaan uit van het feit dat de hoeveelheid t verdeeld volgens de normale wet. De kenmerken van deze wet - wiskundige verwachting en variantie - zijn respectievelijk gelijk t en

(zie hoofdstuk 13 subparagraaf 13.3). Stel dat de hoeveelheid D we kennen en vinden zo'n waarde Ep waarvoor

Door formule (6.3.5) van hoofdstuk 6 toe te passen, drukken we de kans aan de linkerkant van (14.3.5) uit in termen van de normale verdelingsfunctie

waar is de standaarddeviatie van de schatting T.

Uit de vergelijking

vinden we de waarde van Sp:

waarbij arg Ф * (х) de inverse functie is van Ф * (X), die. zo'n waarde van het argument waarvoor de normale verdelingsfunctie gelijk is aan X.

Spreiding D, waardoor de waarde wordt uitgedrukt een 1P, dat weten we niet precies; als geschatte waarde kunt u de schatting gebruiken D(14.3.4) en zet ongeveer:

Het probleem van het construeren van een betrouwbaarheidsinterval is dus bij benadering opgelost, wat gelijk is aan:

waarbij gp wordt gedefinieerd door formule (14.3.7).

Om inverse interpolatie in de tabellen van de functie Ф * (л) te voorkomen bij het berekenen van s p, is het handig om een ​​speciale tabel samen te stellen (tabel 14.3.1), waarin de waarden van de hoeveelheid

afhankelijk van de pag. De hoeveelheid (p bepaalt voor de normale wet het aantal standaarddeviaties dat rechts en links van het verstrooiingscentrum apart moet worden gezet om de kans op het raken van het resulterende gebied gelijk te maken aan p.

Door de waarde van 7 p wordt het betrouwbaarheidsinterval uitgedrukt als:

Tabel 14.3.1

Voorbeeld 1. 20 experimenten uitgevoerd op de waarde X; de resultaten worden weergegeven in de tabel. 14.3.2.

Tabel 14.3.2

Het is nodig om een ​​schatting te vinden van voor de wiskundige verwachting van de hoeveelheid x en bouw een betrouwbaarheidsinterval dat overeenkomt met een betrouwbaarheidsniveau van p = 0,8.

Oplossing. We hebben:

Nadat we als oorsprong l: = 10 hebben gekozen, vinden we volgens de derde formule (14.2.14) de onbevooroordeelde schatting D :

Volgens de tabel. 14.3.1 vinden

Vertrouwenslimieten:

Betrouwbaarheidsinterval:

Parameterwaarden T, die in dit interval liggen, komen overeen met de experimentele gegevens in de tabel. 14.3.2.

Het betrouwbaarheidsinterval voor de variantie kan op een vergelijkbare manier worden geconstrueerd.

Laat het geproduceerd worden P onafhankelijke experimenten op een willekeurige variabele x met onbekende parameters van en A, en voor de variantie D de onpartijdige schatting wordt verkregen:

Het is nodig om het betrouwbaarheidsinterval voor de variantie ruwweg te construeren.

Uit formule (14.3.11) blijkt dat de hoeveelheid D vertegenwoordigt

de som P willekeurige variabelen van het formulier. Deze hoeveelheden zijn niet

onafhankelijk, aangezien elk van hen de hoeveelheid bevat T, afhankelijk van iedereen. Het kan echter worden aangetoond dat met toenemende P de distributiewet van hun som is ook bijna normaal. praktisch bij P= 20 ... 30 het kan al als normaal worden beschouwd.

Laten we aannemen dat dit zo is, en de kenmerken van deze wet vinden: wiskundige verwachting en variantie. Sinds de score D- onbevooroordeeld, dan? M [D] = D.

Variantie berekenen D D wordt geassocieerd met relatief complexe berekeningen, dus we geven de uitdrukking zonder uitvoer:

waarbij q 4 het vierde centrale moment van de hoeveelheid is X.

Om deze uitdrukking te gebruiken, moet u de waarden \ u200b \ u200b4 en . erin vervangen D(in ieder geval bij benadering). In plaats van D je kunt zijn schatting gebruiken D. In principe kan het vierde centrale moment ook worden vervangen door een schatting, bijvoorbeeld door een waarde van de vorm:

maar zo'n vervanging geeft een extreem lage nauwkeurigheid, aangezien in het algemeen met een beperkt aantal experimenten hoge orde momenten met grote fouten worden bepaald. In de praktijk komt het echter vaak voor dat de vorm van de verdelingswet van de hoeveelheid x vooraf bekend: alleen de parameters zijn onbekend. Dan kun je proberen q 4 uit te drukken in termen van D.

Laten we het meest voorkomende geval nemen wanneer de hoeveelheid: x verdeeld volgens de normale wet. Dan wordt het vierde centrale moment uitgedrukt in variantie (zie hoofdstuk 6 subparagraaf 6.2);

en formule (14.3.12) geeft of

Vervanging in (14.3.14) het onbekende D zijn beoordeling D, krijgen we: vanwaar?

Het moment c 4 kan worden uitgedrukt in termen van D ook in sommige andere gevallen, wanneer de verdeling van de hoeveelheid x is niet normaal, maar het uiterlijk is bekend. Voor de wet van uniforme dichtheid (zie hoofdstuk 5) hebben we bijvoorbeeld:

waarbij (a, P) het interval is waarop de wet is ingesteld.

Vandaar,

Met de formule (14.3.12) krijgen we: van waar vinden we ongeveer

In gevallen waar de vorm van de verdelingswet voor 26 niet bekend is, wordt toch aanbevolen om formule (14.3.16) te gebruiken bij het ruwweg schatten van de waarde van a /), tenzij er speciale redenen zijn om aan te nemen dat deze wet heel anders is dan de normale (het heeft een merkbare positieve of negatieve kurtosis) ...

Als de geschatte waarde van a /) op de een of andere manier wordt verkregen, dan is het mogelijk om een ​​betrouwbaarheidsinterval voor de variantie te construeren op dezelfde manier als we het hebben gebouwd voor de wiskundige verwachting:

waarbij de waarde, afhankelijk van de gegeven kans p, wordt gevonden volgens de tabel. 14.3.1.

Voorbeeld 2. Vind een betrouwbaarheidsinterval van ongeveer 80% voor de variantie van een willekeurige variabele x onder de voorwaarden van voorbeeld 1, als bekend is dat de hoeveelheid x verdeeld volgens een wet die bijna normaal is.

Oplossing. De waarde blijft hetzelfde als in de tabel. 14.3.1:

Volgens de formule (14.3.16)

Met behulp van de formule (14.3.18) vinden we het betrouwbaarheidsinterval:

Het bijbehorende bereik van waarden van de standaarddeviatie: (0,21; 0,29).

14.4. Exacte methoden voor het construeren van betrouwbaarheidsintervallen voor de parameters van een willekeurige variabele verdeeld volgens de normale wet

In de vorige paragraaf hebben we gekeken naar ruwweg benaderde methoden voor het construeren van betrouwbaarheidsintervallen voor verwachting en variantie. Hier zullen we een idee geven van de exacte methoden om hetzelfde probleem op te lossen. We benadrukken dat om de betrouwbaarheidsintervallen nauwkeurig te vinden, het absoluut noodzakelijk is om van tevoren de vorm van de verdelingswet van de hoeveelheid te kennen X, terwijl dit voor de toepassing van benaderende methoden niet nodig is.

Idee precieze methoden de constructie van betrouwbaarheidsintervallen is als volgt. Elk betrouwbaarheidsinterval wordt gevonden uit de voorwaarde die de waarschijnlijkheid uitdrukt dat aan bepaalde ongelijkheden wordt voldaan, waaronder de schatting die voor ons van belang is A. Schatting distributiewet een hangt in het algemeen af ​​van de onbekende parameters van de hoeveelheid X. Soms is het echter mogelijk om ongelijkheden van een willekeurige variabele door te geven een naar een andere functie van waargenomen waarden XnX 2, ..., X blz. waarvan de distributiewet niet afhangt van onbekende parameters, maar alleen afhangt van het aantal experimenten en van de vorm van de distributiewet voor de hoeveelheid X. Dit soort toevalsvariabelen spelen een belangrijke rol in wiskundige statistiek; ze zijn het meest gedetailleerd bestudeerd voor het geval van de normale verdeling van de hoeveelheid X.

Er werd bijvoorbeeld bewezen dat voor een normale verdeling van de hoeveelheid x willekeurige waarde

gehoorzaamt aan de zogenaamde Distributierecht voor studenten Met P- 1 vrijheidsgraden; de dichtheid van deze wet heeft de vorm

waarbij Г (х) de bekende gammafunctie is:

Het werd ook bewezen dat de willekeurige variabele

heeft een "distributie% 2" met P- 1 vrijheidsgraden (zie hoofdstuk 7), waarvan de dichtheid wordt uitgedrukt door de formule

Zonder stil te staan ​​bij de conclusies van verdelingen (14.4.2) en (14.4.4), laten we zien hoe ze kunnen worden toegepast bij het construeren van betrouwbaarheidsintervallen voor de parameters ty D.

Laat het geproduceerd worden P onafhankelijke experimenten op een willekeurige variabele X, verdeeld volgens de normale wet met onbekende parameters thio. Voor deze parameters werden de schattingen verkregen

Het is nodig om voor beide parameters betrouwbaarheidsintervallen te construeren, die overeenkomen met de betrouwbaarheidskans p.

Laten we eerst het betrouwbaarheidsinterval voor de wiskundige verwachting construeren. Uiteraard wordt dit interval symmetrisch genomen ten opzichte van t; duiden met s p de helft van de lengte van het interval aan. De hoeveelheid s p moet zo worden gekozen dat de voorwaarde

Laten we proberen de linkerkant van gelijkheid (14.4.5) van de willekeurige variabele door te geven t naar een willekeurige variabele T, verdeeld volgens de studentenwet. Om dit te doen, vermenigvuldigen we beide zijden van de ongelijkheid | m-w? |

met een positieve waarde: of, met gebruik van de notatie (14.4.1),

Laten we een getal / p vinden zodat de waarde / p wordt gevonden uit de voorwaarde

Uit formule (14.4.2) blijkt dat (1) een even functie is, daarom geeft (14.4.8)

Gelijkheid (14.4.9) bepaalt de waarde van / p afhankelijk van p. Als u een tabel met waarden van de integraal tot uw beschikking heeft

dan kan de waarde van / p worden gevonden door omgekeerde interpolatie in de tabel. Het is echter handiger om vooraf een tabel met /p-waarden samen te stellen. Een dergelijke tabel staat in de bijlage (tabel 5). Deze tabel toont de waarden afhankelijk van de betrouwbaarheidskans p en het aantal vrijheidsgraden P- 1. Na bepaald / p volgens de tabel. 5 en ervan uitgaande dat

we zullen de helft van de breedte van het betrouwbaarheidsinterval / p en het interval zelf vinden

Voorbeeld 1. 5 onafhankelijke experimenten gedaan op een willekeurige variabele X, normaal verdeeld met onbekende parameters t en over. De resultaten van de experimenten zijn weergegeven in de tabel. 14.4.1.

Tabel 14.4.1

Vind een cijfer t voor de wiskundige verwachting en construeer daarvoor een 90% betrouwbaarheidsinterval / p (d.w.z. het interval dat overeenkomt met de betrouwbaarheidskans p = 0,9).

Oplossing. We hebben:

Volgens tabel 5 aanvragen voor: P - 1 = 4 en p = 0,9 vinden we waar

Het betrouwbaarheidsinterval is

Voorbeeld 2. Voor de voorwaarden van voorbeeld 1 van subsectie 14.3, uitgaande van de waarde x normaal verdeeld, vind het exacte betrouwbaarheidsinterval.

Oplossing. Volgens tabel 5 vinden we toepassingen voor: P - 1 = 19ir =

0,8 / p = 1,328; vanaf hier

In vergelijking met de oplossing van voorbeeld 1 van paragraaf 14.3 (e p = 0,072), zijn we ervan overtuigd dat de discrepantie zeer onbeduidend is. Als we de nauwkeurigheid op de tweede decimaal houden, dan vallen de betrouwbaarheidsintervallen die zijn gevonden met exacte en benaderende methoden samen:

Laten we verder gaan met het construeren van het betrouwbaarheidsinterval voor de variantie. Houd rekening met de onbevooroordeelde variantieschatting

en druk de willekeurige variabele uit D door de waarde V(14.4.3), met een verdeling x 2 (14.4.4):

De distributiewet van de hoeveelheid kennen v, men kan het interval / (1 vinden, waarin het valt met een gegeven kans p.

Distributiewet k n _ x (v) hoeveelheid I 7 heeft de vorm getoond in Fig. 14.4.1.

Rijst. 14.4.1

De vraag rijst: hoe het interval / p te kiezen? Als de distributiewet van de hoeveelheid V symmetrisch was (zoals de normale wet of de verdeling van de student), zou het natuurlijk zijn om het interval / p symmetrisch te nemen met betrekking tot de wiskundige verwachting. In dit geval is de wet k n _ x (v) asymmetrisch. Laten we afspreken om het interval / p zo te kiezen dat de kansen op de output van de hoeveelheid V buiten het interval naar rechts en naar links (gearceerde gebieden in Fig. 14.4.1) waren hetzelfde en gelijk

Om een ​​interval / p met deze eigenschap te construeren, gebruiken we table. 4 bijlagen: het bevat nummers j) zoals dat

voor de waarde v, met x 2 -verdeling met r vrijheidsgraden. In ons geval r = n- 1. Laten we het oplossen r = n- 1 en zoek in de overeenkomstige regel van de tabel. 4 twee betekenissen x 2 - de ene komt overeen met de waarschijnlijkheid de andere - waarschijnlijkheden Laten we deze aanduiden

betekenis om 2 uur en xl? Het interval heeft om 2 uur, zijn linkerhand, en y ~ rechter uiteinde.

Laten we nu het vereiste betrouwbaarheidsinterval / | vinden voor de variantie met grenzen D, en D2, dat dekt het punt D met kans p:

Laten we zo'n interval / (, = (?> B A) construeren), dat het punt bedekt D als en slechts als de hoeveelheid V valt in het interval / p. Laten we aantonen dat het interval

voldoet aan deze voorwaarde. Inderdaad, de ongelijkheden zijn gelijk aan ongelijkheden

en deze ongelijkheden zijn tevreden met waarschijnlijkheid p. Zo wordt het betrouwbaarheidsinterval voor de variantie gevonden en uitgedrukt door de formule (14.4.13).

Voorbeeld 3. Zoek het betrouwbaarheidsinterval voor de variantie onder de voorwaarden van voorbeeld 2 in paragraaf 14.3, als bekend is dat de waarde x normaal verdeeld.

Oplossing. We hebben ... Volgens tabel 4 van de bijlage

we vinden op r = n - 1 = 19

Met behulp van de formule (14.4.13) vinden we het betrouwbaarheidsinterval voor de variantie

Overeenkomstig interval voor standaarddeviatie: (0,21; 0,32). Dit interval overschrijdt slechts in geringe mate het interval (0,21; 0,29) verkregen in voorbeeld 2 van subparagraaf 14.3 met de benaderende methode.

  • Figuur 14.3.1 beschouwt een betrouwbaarheidsinterval dat symmetrisch is rond a. In het algemeen is dit, zoals we later zullen zien, optioneel.

Het betrouwbaarheidsinterval kwam bij ons uit de statistiek. Dit is een specifiek bereik dat dient om een ​​onbekende parameter te schatten met hoge graad betrouwbaarheid. De eenvoudigste manier om dit uit te leggen is met een voorbeeld.

Stel dat u een willekeurige variabele wilt onderzoeken, bijvoorbeeld het reactiepercentage van de server op een clientverzoek. Elke keer dat een gebruiker het adres van een specifieke site typt, reageert de server er met een andere snelheid op. De onderzochte responstijd is dus willekeurig. Het betrouwbaarheidsinterval stelt u dus in staat om de grenzen van deze parameter te bepalen, en dan zal het mogelijk zijn om te beweren dat met een waarschijnlijkheid van 95% de server zich in het bereik zal bevinden dat we hebben berekend.

Of je moet weten hoeveel mensen weten over merknaam bedrijven. Wanneer het betrouwbaarheidsinterval wordt berekend, kan bijvoorbeeld worden gesteld dat met 95% waarschijnlijkheid het aandeel consumenten dat hiervan op de hoogte is, tussen 27% en 34% ligt.

Nauw verwant aan deze term is een waarde als het betrouwbaarheidsniveau. Het geeft de kans weer dat de gewenste parameter in het betrouwbaarheidsinterval wordt opgenomen. Hoe groot ons gewenste bereik zal zijn, hangt af van deze waarde. Hoe meer waarde het nodig heeft, hoe smaller het betrouwbaarheidsinterval wordt, en vice versa. Meestal is deze ingesteld op 90%, 95% of 99%. De 95%-waarde is het populairst.

Deze indicator wordt ook beïnvloed door de variantie van waarnemingen en de definitie ervan is gebaseerd op de veronderstelling dat het bestudeerde attribuut gehoorzaamt. Deze uitspraak wordt ook wel de wet van Gauss genoemd. Volgens hem wordt zo'n verdeling van alle kansen van een continue stochastische variabele normaal genoemd, wat kan worden beschreven door de kansdichtheid. Als de aanname van de normale verdeling onjuist blijkt te zijn, kan de schatting onjuist blijken te zijn.

Laten we eerst eens kijken hoe we het betrouwbaarheidsinterval kunnen berekenen voor Hier zijn twee gevallen mogelijk. De variantie (de mate van spreiding van een willekeurige variabele) kan bekend zijn of niet. Als het bekend is, wordt ons betrouwbaarheidsinterval berekend met behulp van de volgende formule:

ср - t * σ / (sqrt (n))<= α <= хср + t*σ / (sqrt(n)), где

α is een teken,

t - parameter uit de Laplace-distributietabel,

σ is de vierkantswortel van de variantie.

Als de variantie onbekend is, kan deze worden berekend als we alle waarden van het gewenste kenmerk kennen. Hiervoor wordt de volgende formule gebruikt:

σ2 = х2ср - (хср) 2, waarbij

х2ср - de gemiddelde waarde van de vierkanten van het onderzochte kenmerk,

(хср) 2 - het kwadraat van het gegeven kenmerk.

De formule waarmee het betrouwbaarheidsinterval wordt berekend verandert in dit geval enigszins:

xcr - t * s / (sqrt (n))<= α <= хср + t*s / (sqrt(n)), где

хср - steekproefgemiddelde,

α is een teken,

t is een parameter die wordt gevonden met behulp van de verdelingstabel van Student t = t (ɣ; n-1),

sqrt (n) - vierkantswortel van de totale steekproefomvang,

s is de vierkantswortel van de variantie.

Overweeg dit voorbeeld. Stel dat volgens de resultaten van 7 metingen de onderzochte eigenschap is bepaald, gelijk aan 30 en de steekproefvariantie gelijk aan 36. Het is noodzakelijk om met een waarschijnlijkheid van 99% het betrouwbaarheidsinterval te vinden, dat de werkelijke waarde van de gemeten waarde bevat. parameter.

Laten we eerst bepalen waar t gelijk aan is: t = t (0,99; 7-1) = 3,71. Met behulp van de bovenstaande formule krijgen we:

xcr - t * s / (sqrt (n))<= α <= хср + t*s / (sqrt(n))

30 - 3.71 * 36 / (sqrt (7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Het betrouwbaarheidsinterval voor de variantie wordt berekend zowel in het geval van een bekend gemiddelde als wanneer er geen gegevens zijn over de wiskundige verwachting, maar alleen de waarde van de zuivere puntschatting van de variantie bekend is. We zullen hier niet de formules geven om het te berekenen, omdat ze vrij complex zijn en, indien gewenst, altijd op het net te vinden zijn.

We merken alleen op dat het handig is om het betrouwbaarheidsinterval te bepalen met behulp van Excel of een netwerkdienst, die zo wordt genoemd.

keer bekeken

Opslaan in Odnoklassniki Opslaan VKontakte