Betrouwbaarheidsintervalformule.  Kwantitatieve analysemethoden: schatting van betrouwbaarheidsintervallen

Betrouwbaarheidsintervalformule.  Kwantitatieve analysemethoden: schatting van betrouwbaarheidsintervallen

Betrouwbaarheidsinterval voor wiskundige verwachtingen - dit is een interval berekend op basis van gegevens die, met een bekende waarschijnlijkheid, de wiskundige verwachting van de algemene bevolking bevatten. Een natuurlijke schatting voor de wiskundige verwachting is het rekenkundig gemiddelde van de waargenomen waarden. Daarom zullen we in de hele les de termen ‘gemiddeld’ en ‘gemiddelde waarde’ gebruiken. Bij problemen bij het berekenen van een betrouwbaarheidsinterval is het meest gevraagde antwoord zoiets als: “Het betrouwbaarheidsinterval van het gemiddelde getal [waarde in een bepaald probleem] is van [kleinere waarde] tot [ hogere waarde]". Met behulp van een betrouwbaarheidsinterval kunt u niet alleen gemiddelde waarden schatten, maar ook het aandeel van een bepaald kenmerk van de algemene bevolking. Gemiddelde waarden, spreiding, standaarddeviatie en fout, waardoor we tot nieuwe definities en formules zullen komen, worden in de les besproken Kenmerken van de steekproef en populatie .

Punt- en intervalschattingen van het gemiddelde

Als de gemiddelde waarde van de populatie wordt geschat met een getal (punt), wordt een specifiek gemiddelde, dat wordt berekend op basis van een steekproef van waarnemingen, genomen als een schatting van de onbekende gemiddelde waarde van de populatie. In dit geval valt de waarde van het steekproefgemiddelde – een willekeurige variabele – niet samen met de gemiddelde waarde van de algemene bevolking. Daarom moet u bij het aangeven van het steekproefgemiddelde tegelijkertijd de steekproeffout aangeven. De maatstaf voor de steekproeffout is de standaardfout, die wordt uitgedrukt in dezelfde eenheden als het gemiddelde. Daarom wordt vaak de volgende notatie gebruikt: .

Als de schatting van het gemiddelde met een bepaalde waarschijnlijkheid moet worden geassocieerd, moet de parameter die van belang is in de populatie niet worden beoordeeld op basis van één getal, maar op basis van een interval. Een betrouwbaarheidsinterval is een interval waarin met een bepaalde waarschijnlijkheid P de waarde van de geschatte populatie-indicator wordt gevonden. Betrouwbaarheidsinterval waarin het waarschijnlijk is P = 1 - α de willekeurige variabele wordt gevonden, als volgt berekend:

,

α = 1 - P, die te vinden is in de bijlage bij vrijwel elk boek over statistiek.

In de praktijk zijn het populatiegemiddelde en de variantie niet bekend, dus wordt de populatievariantie vervangen door de steekproefvariantie, en het populatiegemiddelde door het steekproefgemiddelde. Het betrouwbaarheidsinterval wordt dus in de meeste gevallen als volgt berekend:

.

De betrouwbaarheidsintervalformule kan worden gebruikt om het populatiegemiddelde if te schatten

  • de standaarddeviatie van de populatie is bekend;
  • of de standaarddeviatie van de populatie is onbekend, maar de steekproefomvang is groter dan 30.

Het steekproefgemiddelde is een onbevooroordeelde schatting van het populatiegemiddelde. Op zijn beurt de steekproefvariantie is geen onbevooroordeelde schatting van de populatievariantie. Om een ​​onbevooroordeelde schatting te verkrijgen van de populatievariantie in de steekproefvariantieformule, steekproefomvang N vervangen moet worden door N-1.

Voorbeeld 1. Er werd informatie verzameld van 100 willekeurig geselecteerde cafés in een bepaalde stad dat het gemiddelde aantal werknemers daarin 10,5 bedraagt ​​met een standaardafwijking van 4,6. Bepaal het 95% betrouwbaarheidsinterval voor het aantal cafémedewerkers.

waarbij is de kritische waarde van de standaardnormale verdeling voor het significantieniveau α = 0,05 .

Het 95%-betrouwbaarheidsinterval voor het gemiddelde aantal cafémedewerkers varieerde dus van 9,6 tot 11,4.

Voorbeeld 2. Voor een willekeurige steekproef uit een populatie van 64 waarnemingen werden de volgende totaalwaarden berekend:

som van waarden in observaties,

som van kwadratische afwijkingen van waarden van het gemiddelde .

Bereken het 95% betrouwbaarheidsinterval voor de wiskundige verwachting.

Laten we de standaardafwijking berekenen:

,

Laten we de gemiddelde waarde berekenen:

.

We vervangen de waarden in de uitdrukking voor het betrouwbaarheidsinterval:

waarbij is de kritische waarde van de standaardnormale verdeling voor het significantieniveau α = 0,05 .

We krijgen:

Het 95% betrouwbaarheidsinterval voor de wiskundige verwachting van deze steekproef varieerde dus van 7,484 tot 11,266.

Voorbeeld 3. Voor een willekeurige populatiesteekproef van 100 waarnemingen is het berekende gemiddelde 15,2 en de standaarddeviatie 3,2. Bereken het betrouwbaarheidsinterval van 95% voor de verwachte waarde en vervolgens het betrouwbaarheidsinterval van 99%. Als de steekproefkracht en de variatie ervan onveranderd blijven en de betrouwbaarheidscoëfficiënt toeneemt, zal het betrouwbaarheidsinterval dan smaller of breder worden?

We vervangen deze waarden in de uitdrukking voor het betrouwbaarheidsinterval:

waarbij is de kritische waarde van de standaardnormale verdeling voor het significantieniveau α = 0,05 .

We krijgen:

.

Het 95%-betrouwbaarheidsinterval voor het gemiddelde van deze steekproef varieerde dus van 14,57 tot 15,82.

We vervangen deze waarden opnieuw in de uitdrukking voor het betrouwbaarheidsinterval:

waarbij is de kritische waarde van de standaardnormale verdeling voor het significantieniveau α = 0,01 .

We krijgen:

.

Het 99%-betrouwbaarheidsinterval voor het gemiddelde van deze steekproef varieerde dus van 14,37 tot 16,02.

Zoals we zien, neemt de kritische waarde van de standaard normale verdeling ook toe naarmate de betrouwbaarheidscoëfficiënt toeneemt, en als gevolg daarvan bevinden de begin- en eindpunten van het interval zich verder van het gemiddelde, en dus neemt het betrouwbaarheidsinterval voor de wiskundige verwachting toe. .

Punt- en intervalschattingen van het soortelijk gewicht

Het aandeel van een bepaald steekproefattribuut kan worden geïnterpreteerd als een puntschatting soortelijk gewicht P met hetzelfde kenmerk in de algemene bevolking. Als deze waarde in verband moet worden gebracht met de waarschijnlijkheid, moet het betrouwbaarheidsinterval van het soortelijk gewicht worden berekend P kenmerk in de populatie met waarschijnlijkheid P = 1 - α :

.

Voorbeeld 4. In een stad zijn er twee kandidaten A En B zijn kandidaat voor burgemeester. Er werden willekeurig 200 stadsbewoners ondervraagd, waarvan 46% antwoordde dat ze op de kandidaat zouden stemmen A, 26% - voor de kandidaat B en 28% weet niet op wie ze zullen stemmen. Bepaal het 95% betrouwbaarheidsinterval voor het aandeel stadsbewoners dat de kandidaat steunt A.

Uit dit artikel leer je:

    Wat is er gebeurd Betrouwbaarheidsinterval?

    Wat is het punt 3 Sigma-regels?

    Hoe kun je deze kennis in de praktijk toepassen?

Tegenwoordig, als gevolg van een overvloed aan informatie geassocieerd met een groot assortiment producten, verkooprichtingen, medewerkers, werkgebieden, enz., het kan moeilijk zijn om het belangrijkste te benadrukken, wat in de eerste plaats de moeite waard is om aandacht aan te besteden en moeite te doen om het te beheren. Definitie Betrouwbaarheidsinterval en analyse van werkelijke waarden die de grenzen ervan overschrijden - een techniek die zal u helpen situaties te benadrukken, het beïnvloeden van veranderende trends. Je zult positieve factoren kunnen ontwikkelen en de invloed van negatieve factoren kunnen verminderen. Deze technologie wordt gebruikt in veel bekende mondiale bedrijven.

Er zijn zogenaamde " waarschuwingen", welke leidinggevenden informeren dat de volgende waarde in een bepaalde richting ligt ging verder Betrouwbaarheidsinterval. Wat betekent dit? Dit is een signaal dat er een ongewone gebeurtenis heeft plaatsgevonden, die de bestaande trend in deze richting kan veranderen. Dit is een signaal op dat om het uit te zoeken in de situatie en begrijp wat deze heeft beïnvloed.

Denk bijvoorbeeld eens aan verschillende situaties. We hebben de verkoopprognose berekend met prognoselimieten voor 100 productartikelen voor 2011 per maand en de werkelijke verkoop in maart:

  1. Door " Zonnebloemolie» doorbrak de bovengrens van de voorspelling en viel niet binnen het betrouwbaarheidsinterval.
  2. Voor “Droge gist” hebben we de ondergrens van de prognose overschreden.
  3. “Havermoutpap” heeft de bovengrens overschreden.

Voor andere producten lag de werkelijke verkoop binnen de gegeven prognoselimieten. Die. hun omzet lag binnen de verwachtingen. We identificeerden dus drie producten die de grenzen overstegen en begonnen uit te zoeken wat hen ertoe bracht de grenzen te overschrijden:

  1. Voor Zonnebloemolie zijn we een nieuw distributienetwerk aangegaan, wat ons extra verkoopvolume heeft opgeleverd, waardoor we de bovengrens hebben overschreden. Voor dit product is het de moeite waard om de prognose tot het einde van het jaar opnieuw te berekenen, rekening houdend met de verkoopvoorspelling voor dit netwerk.
  2. Voor “Droge Gist” kwam de auto vast te staan ​​bij de douane en was er binnen 5 dagen een tekort, wat de omzetdaling beïnvloedde en de ondergrens overschreed. Het kan de moeite waard zijn om erachter te komen wat de oorzaak is en te proberen deze situatie niet te herhalen.
  3. Er werd een verkooppromotie-evenement gelanceerd voor havermoutpap, wat een aanzienlijke omzetstijging opleverde en ertoe leidde dat het bedrijf verder ging dan de prognoses.

We hebben drie factoren geïdentificeerd die van invloed zijn geweest op het overschrijden van de voorspelde limieten. Er kunnen er veel meer zijn in het leven. Om de nauwkeurigheid van prognoses en planning te vergroten, factoren die ertoe leiden dat de werkelijke verkoop verder kan gaan dan de prognose, is het de moeite waard om prognoses en plannen afzonderlijk te benadrukken en op te stellen. En overweeg vervolgens hun impact op de belangrijkste verkoopprognose. U kunt ook regelmatig de impact van deze factoren beoordelen en de situatie ten goede veranderen. door de invloed van negatieve factoren te verminderen en de invloed van positieve factoren te vergroten.

Met een betrouwbaarheidsinterval kunnen we:

  1. Selecteer routebeschrijving, die de moeite waard zijn om op te letten, omdat Er hebben zich in deze richtingen gebeurtenissen voorgedaan die van invloed kunnen zijn trendverandering.
  2. Identificeer factoren, die de verandering in de situatie echt beïnvloeden.
  3. Aanvaarden weloverwogen beslissing(bijvoorbeeld over inkoop, planning etc.).

Laten we nu eens kijken naar wat een betrouwbaarheidsinterval is en hoe we dit in Excel kunnen berekenen aan de hand van een voorbeeld.

Wat is een betrouwbaarheidsinterval?

Het betrouwbaarheidsinterval is de voorspellingsgrenzen (bovenste en onderste), waarbinnen met een gegeven waarschijnlijkheid (sigma) werkelijke waarden verschijnen.

Die. We berekenen de voorspelling - dit is onze belangrijkste richtlijn, maar we begrijpen dat het onwaarschijnlijk is dat de werkelijke waarden 100% gelijk zijn aan onze voorspelling. En de vraag rijst, binnen welke grenzen werkelijke waarden kunnen dalen, als de huidige trend zich voortzet? En deze vraag zal ons helpen antwoord te geven berekening van het betrouwbaarheidsinterval, d.w.z. - boven- en ondergrenzen van de voorspelling.

Wat is een gegeven waarschijnlijkheids-sigma?

Bij het berekenen betrouwbaarheidsinterval dat we kunnen waarschijnlijkheid instellen hits werkelijke waarden binnen de gegeven voorspellingsgrenzen. Hoe je dat doet? Om dit te doen, stellen we de waarde van sigma in en, als sigma gelijk is aan:

    3 sigma- dan zal de kans dat de volgende werkelijke waarde binnen het betrouwbaarheidsinterval valt 99,7% zijn, oftewel 300 op 1, of is er een kans van 0,3% dat de grenzen worden overschreden.

    2 sigma- dan is de kans dat de volgende waarde binnen de grenzen valt ≈ 95,5%, d.w.z. de kansen zijn ongeveer 20 tegen 1, of er is een kans van 4,5% dat je overboord gaat.

    1 sigma- dan is de waarschijnlijkheid ≈ 68,3%, d.w.z. de kansen zijn ongeveer 2 op 1, oftewel er is een kans van 31,7% dat de volgende waarde buiten het betrouwbaarheidsinterval valt.

Wij formuleerden 3 sigma-regel,die dat zegt kans op treffer nog een willekeurige waarde in het betrouwbaarheidsinterval met een bepaalde waarde drie sigma is 99,7%.

De grote Russische wiskundige Chebyshev bewees de stelling dat er een kans van 10% bestaat om de voorspelde grenzen te overschrijden bij een gegeven waarde van drie sigma. Die. de kans om binnen het 3-sigma-betrouwbaarheidsinterval te vallen zal minstens 90% zijn, terwijl een poging om de voorspelling en de grenzen ervan ‘op het oog’ te berekenen met veel grotere fouten gepaard gaat.

Hoe bereken je zelf een betrouwbaarheidsinterval in Excel?

Laten we eens kijken naar de berekening van het betrouwbaarheidsinterval in Excel (d.w.z. de boven- en ondergrenzen van de voorspelling) aan de hand van een voorbeeld. We hebben een tijdreeks: verkopen per maand gedurende 5 jaar. Zie bijgevoegd document.

Om de voorspellingslimieten te berekenen, berekenen we:

  1. Verkoopprognose().
  2. Sigma - standaardafwijking voorspellingsmodellen van werkelijke waarden.
  3. Drie sigma.
  4. Betrouwbaarheidsinterval.

1. Verkoopprognose.

=(RC[-14] (Tijdreeksgegevens)- RC[-1] (modelwaarde))^2(kwadraat)


3. Laten we voor elke maand de afwijkingswaarden van fase 8 Sum((Xi-Ximod)^2) optellen, d.w.z. Laten we januari, februari... voor elk jaar samenvatten.

Gebruik hiervoor de formule =SOM.ALS()

SUMIF(array met periodenummers binnen de cyclus (voor maanden van 1 tot en met 12); link naar het periodenummer in de cyclus; link naar een array met kwadraten van het verschil tussen de brongegevens en periodewaarden)


4. Bereken de standaardafwijking voor elke periode in de cyclus van 1 tot 12 (fase 10 in het bijgevoegde bestand).

Om dit te doen, extraheren we de wortel uit de waarde berekend in stap 9 en delen we deze door het aantal perioden in deze cyclus minus 1 = SQRT((Sum(Xi-Ximod)^2/(n-1))

Laten we de formules in Excel gebruiken =ROOT(R8 (link naar (Sum(Xi-Ximod)^2)/(AANTAL.ALS($O$8:$O$67 (link naar array met cyclusnummers); O8 (link naar een specifiek cyclusnummer dat we in de array tellen))-1))

Met behulp van de Excel-formule = AANTAL.ALS we tellen het getal n


Nadat we de standaardafwijking van de feitelijke gegevens uit het voorspellingsmodel hadden berekend, verkregen we de sigmawaarde voor elke maand - fase 10 in het bijgevoegde bestand .

3. Laten we 3 sigma berekenen.

In fase 11 stellen we het aantal sigma's in - in ons voorbeeld "3" (fase 11 in het bijgevoegde bestand):

Ook handig voor het oefenen van sigma-waarden:

1,64 sigma - 10% kans op overschrijding van de limiet (1 kans op 10);

1,96 sigma - 5% kans om de grenzen te overschrijden (1 kans op 20);

2,6 sigma - 1% kans op overschrijding van limieten (1 kans op 100).

5) Drie sigma berekenen Hiervoor vermenigvuldigen we de “sigma”-waarden voor elke maand met “3”.

3. Bepaal het betrouwbaarheidsinterval.

  1. Bovenste voorspellingslimiet- verkoopvoorspelling rekening houdend met groei en seizoensinvloeden + (plus) 3 sigma;
  2. Onderste voorspellingslimiet- verkoopprognose rekening houdend met groei en seizoensinvloeden – (minus) 3 sigma;

Voor het gemak van het berekenen van het betrouwbaarheidsinterval voor een lange periode (zie bijgevoegd bestand), zullen we de Excel-formule gebruiken =Y8+VERT.ZOEKEN(W8,$U$8:$V$19,2,0), Waar

J8- verkoopprognose;

W8- het nummer van de maand waarvoor we de 3-sigma-waarde nemen;

Die. Bovenste voorspellingslimiet= “verkoopprognose” + “3 sigma” (in het voorbeeld VLOOKUP(maandnummer; tabel met 3 sigma-waarden; kolom waaruit we de sigma-waarde extraheren gelijk aan nummer maand in de overeenkomstige regel;0)).

Onderste voorspellingslimiet= “verkoopprognose” minus “3 sigma”.

Daarom hebben we het betrouwbaarheidsinterval in Excel berekend.

Nu hebben we een voorspelling en een bereik met grenzen waarbinnen de werkelijke waarden met een gegeven sigma-waarschijnlijkheid zullen vallen.

In dit artikel hebben we gekeken naar wat sigma is en regel van drie sigma, hoe je het betrouwbaarheidsinterval bepaalt en waarom je deze techniek in de praktijk kunt gebruiken.

Wij wensen u nauwkeurige voorspellingen en succes!

Hoe Forecast4AC PRO kan u helpenbij het berekenen van het betrouwbaarheidsinterval?:

    Forecast4AC PRO berekent automatisch de boven- of ondergrenzen van de voorspelling voor meer dan 1000 tijdreeksen tegelijk;

    De mogelijkheid om met één druk op de knop de grenzen van de voorspelling te analyseren in vergelijking met de voorspelling, trend en daadwerkelijke verkopen op de grafiek;

In het Forcast4AC PRO programma is het mogelijk om de sigmawaarde in te stellen van 1 tot 3.

Doe met ons mee!

Downloaden Gratis applicaties voor prognoses en bedrijfsanalyses:


  • Novo Forecast Lite- automatisch prognoseberekening V Excel.
  • 4analyses - ABC-XYZ-analyse en emissieanalyse Excel.
  • Qlik Sense Bureaublad en QlikViewPersonal Edition - BI-systemen voor data-analyse en visualisatie.

Test de mogelijkheden van betaalde oplossingen:

  • Novo Voorspelling PRO- forecasting in Excel voor grote datasets.

Er zijn twee soorten schattingen in de statistiek: punt en interval. Puntschatting is een enkele steekproefstatistiek die wordt gebruikt om een ​​populatieparameter te schatten. Het steekproefgemiddelde bijvoorbeeld is een puntschatting van de wiskundige verwachting van de populatie en de steekproefvariantie S 2- puntschatting van populatievariantie σ 2. Er is aangetoond dat het steekproefgemiddelde een onbevooroordeelde schatting is van de wiskundige verwachting van de populatie. Een steekproefgemiddelde wordt onbevooroordeeld genoemd omdat het gemiddelde van alle steekproefgemiddelden (met dezelfde steekproefomvang) N) is gelijk aan de wiskundige verwachting van de algemene bevolking.

Om de steekproefvariantie te bepalen S 2 werd een onbevooroordeelde schatting van de populatievariantie σ 2, moet de noemer van de steekproefvariantie gelijk worden gesteld aan N – 1 , maar niet N. Met andere woorden: de populatievariantie is het gemiddelde van alle mogelijke steekproefvarianties.

Bij het schatten van populatieparameters moet er rekening mee worden gehouden dat steekproefstatistieken zoals , afhankelijk van specifieke monsters. Om met dit feit rekening te houden, te verkrijgen intervalschatting wiskundige verwachting van de algemene bevolking, analyseer de verdeling van steekproefgemiddelden (zie voor meer details). Het geconstrueerde interval wordt gekenmerkt door een bepaald betrouwbaarheidsniveau, dat de waarschijnlijkheid weergeeft dat de werkelijke populatieparameter correct wordt geschat. Soortgelijke betrouwbaarheidsintervallen kunnen worden gebruikt om het aandeel van een kenmerk te schatten R en de belangrijkste verspreide massa van de bevolking.

Download de notitie in of formaat, voorbeelden in formaat

Het construeren van een betrouwbaarheidsinterval voor de wiskundige verwachting van de populatie met een bekende standaarddeviatie

Een betrouwbaarheidsinterval construeren voor het aandeel van een kenmerk in de populatie

In deze sectie wordt het concept van het betrouwbaarheidsinterval uitgebreid naar categorische gegevens. Hierdoor kunnen we het aandeel van het kenmerk in de populatie schatten R met behulp van voorbeeldaandeel RS= X/N. Zoals aangegeven, als de hoeveelheden NR En N(1 – p) het getal 5 overschrijdt, kan de binomiale verdeling als normaal worden benaderd. Daarom een ​​schatting maken van het aandeel van een kenmerk in de populatie R het is mogelijk een interval te construeren waarvan het betrouwbaarheidsniveau gelijk is aan (1 – α)х100%.


Waar PS- steekproefaandeel van het kenmerk gelijk aan X/N, d.w.z. aantal successen gedeeld door steekproefomvang, R- het aandeel van het kenmerk in de algemene bevolking, Z- kritische waarde van de gestandaardiseerde normale verdeling, N- steekproefomvang.

Voorbeeld 3. Laten we aannemen dat van informatie Systeem een monster gehaald bestaande uit 100 ingevulde facturen vorige maand. Laten we zeggen dat 10 van deze facturen met fouten zijn opgesteld. Dus, R= 10/100 = 0,1. Het betrouwbaarheidsniveau van 95% komt overeen met de kritische waarde Z = 1,96.

De kans dat tussen 4,12% en 15,88% van de facturen fouten bevatten is dus 95%.

Voor een gegeven steekproefomvang lijkt het betrouwbaarheidsinterval dat het aandeel van het kenmerk in de populatie bevat breder dan voor een continue willekeurige variabele. Dit komt omdat metingen van een continue willekeurige variabele meer informatie bevatten dan metingen van categorische gegevens. Met andere woorden, categorische gegevens die slechts twee waarden aannemen, bevatten onvoldoende informatie om de parameters van hun distributie te schatten.

INhet berekenen van schattingen uit een eindige populatie

Schatting van wiskundige verwachtingen. Correctiefactor voor de uiteindelijke populatie ( fpc) werd gebruikt om te verminderen standaardfout op tijd. Bij het berekenen van betrouwbaarheidsintervallen voor schattingen van populatieparameters wordt een correctiefactor toegepast in situaties waarin monsters worden getrokken zonder dat deze worden geretourneerd. Er is dus een betrouwbaarheidsinterval voor de wiskundige verwachting met een betrouwbaarheidsniveau gelijk aan (1 – α)х100%, wordt berekend met de formule:

Voorbeeld 4. Laten we, om het gebruik van de correctiefactor voor een eindige populatie te illustreren, terugkeren naar het probleem van het berekenen van het betrouwbaarheidsinterval voor het gemiddelde bedrag aan facturen, zoals hierboven besproken in voorbeeld 3. Stel dat een bedrijf 5.000 facturen per maand uitgeeft, en X=110,27 dollar, S= $ 28,95, N = 5000, N = 100, α = 0,05, t99 = 1,9842. Met behulp van formule (6) verkrijgen we:

Schatting van het aandeel van een kenmerk. Bij het kiezen zonder return is het betrouwbaarheidsinterval voor het deel van het attribuut met een betrouwbaarheidsniveau gelijk aan (1 – α)х100%, wordt berekend met de formule:

Vertrouwensintervallen en ethische kwesties

Bij het nemen van steekproeven uit een populatie en het trekken van statistische conclusies doen zich vaak ethische problemen voor. De belangrijkste is hoe betrouwbaarheidsintervallen en puntschattingen van steekproefstatistieken overeenkomen. Het publiceren van puntschattingen zonder de bijbehorende betrouwbaarheidsintervallen (meestal op het betrouwbaarheidsniveau van 95%) en de steekproefomvang waarvan ze zijn afgeleid te specificeren, kan voor verwarring zorgen. Dit kan de gebruiker de indruk geven dat de puntschatting precies is wat hij nodig heeft om de eigenschappen van de gehele populatie te voorspellen. Het is dus noodzakelijk om te begrijpen dat bij elk onderzoek de nadruk niet op puntschattingen moet liggen, maar op intervalschattingen. Daarnaast, Speciale aandacht zou gegeven moeten worden de juiste keuze steekproefomvang.

Meestal zijn de objecten van statistische manipulatie de resultaten van sociologische enquêtes onder de bevolking over bepaalde politieke kwesties. Tegelijkertijd worden de onderzoeksresultaten op de voorpagina's van kranten gepubliceerd en worden de steekproeffout en de statistische analysemethodologie ergens in het midden gepubliceerd. Om de geldigheid van de verkregen puntschattingen te bewijzen, is het noodzakelijk om de steekproefomvang aan te geven op basis waarvan ze zijn verkregen, de grenzen van het betrouwbaarheidsinterval en het significantieniveau ervan.

Volgende opmerking

Er wordt gebruik gemaakt van materiaal uit het boek Levin et al. Statistics for Managers. – M.: Williams, 2004. – p. 448-462

Centrale limietstelling stelt dat bij een voldoende grote steekproefomvang de steekproefverdeling van gemiddelden kan worden benaderd door een normale verdeling. Deze eigenschap is niet afhankelijk van het type verdeling van de bevolking.

In de voorgaande paragrafen hebben we de kwestie van het schatten van een onbekende parameter besproken A een nummer. Dit wordt een “puntschatting” genoemd. Bij een aantal taken hoeft u niet alleen naar de parameter te zoeken A geschikte numerieke waarde, maar ook om de nauwkeurigheid en betrouwbaarheid ervan te evalueren. U moet weten tot welke fouten het vervangen van een parameter kan leiden A zijn puntschatting A en met welke mate van vertrouwen kunnen we verwachten dat deze fouten de bekende grenzen niet zullen overschrijden?

Dit soort problemen zijn vooral relevant bij een klein aantal waarnemingen bij de puntschatting en in is grotendeels willekeurig en de geschatte vervanging van a door a kan tot ernstige fouten leiden.

Om een ​​idee te geven van de nauwkeurigheid en betrouwbaarheid van de schatting A,

In de wiskundige statistiek worden zogenaamde betrouwbaarheidsintervallen en betrouwbaarheidskansen gebruikt.

Laat voor de parameter A onpartijdige schatting verkregen uit ervaring A. We willen in dit geval de mogelijke fout inschatten. Laten we een voldoende grote waarschijnlijkheid p toekennen (bijvoorbeeld p = 0,9, 0,95 of 0,99), zodat een gebeurtenis met waarschijnlijkheid p als praktisch betrouwbaar kan worden beschouwd, en een waarde s vinden waarvoor

Vervolgens het bereik van praktisch mogelijke waarden van de fout die optreedt tijdens de vervanging A op A, zal ± s zijn; Grote fouten in de absolute waarde zullen alleen optreden met een lage waarschijnlijkheid a = 1 - p. Laten we (14.3.1) herschrijven als:

Gelijkheid (14.3.2) betekent dat met waarschijnlijkheid p de onbekende waarde van de parameter is A valt binnen het interval

Het is noodzakelijk om één omstandigheid op te merken. Eerder hebben we herhaaldelijk rekening gehouden met de waarschijnlijkheid dat een willekeurige variabele in een bepaald niet-willekeurig interval valt. Hier is de situatie anders: de omvang A is niet willekeurig, maar het interval / p is willekeurig. De positie op de x-as is willekeurig, bepaald door het middelpunt A; Over het algemeen is de lengte van het interval 2s ook willekeurig, aangezien de waarde van s in de regel wordt berekend op basis van experimentele gegevens. Daarom zou het in dit geval beter zijn om de p-waarde niet te interpreteren als de waarschijnlijkheid dat je het punt ‘raakt’ A in het interval / p, en als de waarschijnlijkheid dat een willekeurig interval / p het punt zal bestrijken A(Afb. 14.3.1).

Rijst. 14.3.1

Meestal wordt de waarschijnlijkheid p genoemd waarschijnlijkheid van vertrouwen, en interval / p - Betrouwbaarheidsinterval. Intervalgrenzen Als. een x =a- s en een 2 = een + en worden gebeld grenzen vertrouwen.

Laten we een andere interpretatie geven aan het concept van een betrouwbaarheidsinterval: het kan worden beschouwd als een interval van parameterwaarden A, verenigbaar zijn met experimentele gegevens en deze niet tegenspreken. Als we ermee instemmen een gebeurtenis met waarschijnlijkheid a = 1-p praktisch onmogelijk te beschouwen, dan zijn die waarden van de parameter a waarvoor een - een> s moeten worden erkend als in tegenspraak met experimentele gegevens, en die waarvoor |a - A een t na 2 .

Laat voor de parameter A er is een onpartijdige schatting A. Als we de wet van de verdeling van de hoeveelheid kenden A, zou de taak van het vinden van een betrouwbaarheidsinterval heel eenvoudig zijn: het zou voldoende zijn om een ​​waarde s te vinden waarvoor

De moeilijkheid is dat de wet van de verdeling van schattingen A hangt af van de verdelingswet van de hoeveelheid X en dus op de onbekende parameters ervan (in het bijzonder op de parameter zelf A).

Om dit probleem te omzeilen, kunt u de volgende, grofweg benaderende techniek gebruiken: vervang de onbekende parameters in de uitdrukking voor s door hun puntschattingen. Met relatief groot nummer experimenten P(ongeveer 20...30) geeft deze techniek doorgaans resultaten die qua nauwkeurigheid bevredigend zijn.

Beschouw als voorbeeld het probleem van een betrouwbaarheidsinterval voor de wiskundige verwachting.

Laat het geproduceerd worden P X, waarvan de kenmerken de wiskundige verwachting zijn T en variantie D- onbekend. Voor deze parameters werden de volgende schattingen verkregen:

Het is vereist om een ​​betrouwbaarheidsinterval /p te construeren dat overeenkomt met de bep voor de wiskundige verwachting T hoeveelheden X.

Bij het oplossen van dit probleem zullen we gebruik maken van het feit dat de hoeveelheid T vertegenwoordigt de som P onafhankelijke, identiek verdeelde willekeurige variabelen X u en volgens de centrale limietstelling, voor een voldoende grote P de distributiewet is bijna normaal. In de praktijk kan de verdelingswet van het bedrag, zelfs met een relatief klein aantal termen (ongeveer 10...20), bij benadering als normaal worden beschouwd. We gaan ervan uit dat de waarde T verdeeld volgens de normale wet. De kenmerken van deze wet – wiskundige verwachting en variantie – zijn respectievelijk gelijk T En

(zie hoofdstuk 13 subparagraaf 13.3). Laten we aannemen dat de waarde D we weten en zullen een waarde Ep vinden waarvoor

Met behulp van formule (6.3.5) uit hoofdstuk 6 drukken we de waarschijnlijkheid aan de linkerkant van (14.3.5) uit via de normale verdelingsfunctie

waar is de standaardafwijking van de schatting T.

Van vgl.

vind de waarde van Sp:

waarbij arg Ф* (х) de inverse functie is van Ф* (X), die. een dergelijke waarde van het argument waarvoor de normale verdelingsfunctie gelijk is X.

Spreiding D, waarmee de hoeveelheid wordt uitgedrukt A 1P, dat weten we niet precies; als geschatte waarde kunt u de schatting gebruiken D(14.3.4) en zet ongeveer:

Het probleem van het construeren van een betrouwbaarheidsinterval is dus bij benadering opgelost, wat gelijk is aan:

waarbij gp wordt bepaald door formule (14.3.7).

Om omgekeerde interpolatie in de tabellen van de functie Ф* (l) te voorkomen bij het berekenen van s p, is het handig om een ​​speciale tabel samen te stellen (tabel 14.3.1), die de waarden van de hoeveelheid geeft

afhankelijk van r. De waarde (p bepaalt voor de normale wet het aantal standaarddeviaties dat naar rechts en links vanaf het spreidingscentrum moet worden uitgezet, zodat de kans om in het resulterende gebied te komen gelijk is aan p.

Met behulp van de waarde 7 p wordt het betrouwbaarheidsinterval uitgedrukt als:

Tabel 14.3.1

Voorbeeld 1. Er werden 20 experimenten uitgevoerd met de hoeveelheid X; de resultaten worden weergegeven in de tabel. 14.3.2.

Tabel 14.3.2

Het is vereist om een ​​schatting te vinden voor de wiskundige verwachting van de hoeveelheid X en construeer een betrouwbaarheidsinterval dat overeenkomt met de bep = 0,8.

Oplossing. We hebben:

Door l: = 10 als referentiepunt te kiezen, vinden we met behulp van de derde formule (14.2.14) de zuivere schatting D :

Volgens de tabel 14.3.1 vinden we

Vertrouwenslimieten:

Betrouwbaarheidsinterval:

Parameterwaarden T, die in dit interval liggen, zijn verenigbaar met de experimentele gegevens in de tabel. 14.3.2.

Een betrouwbaarheidsinterval voor de variantie kan op soortgelijke wijze worden geconstrueerd.

Laat het geproduceerd worden P onafhankelijke experimenten met een willekeurige variabele X met onbekende parameters voor zowel A als dispersie D er werd een onbevooroordeelde schatting verkregen:

Het is vereist om bij benadering een betrouwbaarheidsinterval voor de variantie te construeren.

Uit formule (14.3.11) blijkt duidelijk dat de hoeveelheid D vertegenwoordigt

hoeveelheid P willekeurige variabelen van de vorm . Deze waarden zijn dat niet

onafhankelijk, aangezien elk van hen de hoeveelheid omvat T, afhankelijk van iedereen. Er kan echter worden aangetoond dat dit toeneemt P de verdelingswet van hun som benadert ook normaal. Bijna bij P= 20...30 kan het al als normaal worden beschouwd.

Laten we aannemen dat dit zo is, en laten we de kenmerken van deze wet vinden: wiskundige verwachting en spreiding. Sinds de beoordeling D- Onbevooroordeeld dus M[D] = D.

Variantieberekening D D wordt geassocieerd met relatief complexe berekeningen, dus presenteren we de uitdrukking ervan zonder afleiding:

waarbij q 4 het vierde centrale moment van de magnitude is X.

Om deze uitdrukking te gebruiken, moet je de waarden \u003d 4 en vervangen D(tenminste dichtbij). In plaats van D je kunt zijn beoordeling gebruiken D. In principe kan het vierde centrale moment ook worden vervangen door een schatting, bijvoorbeeld een waarde van de vorm:

maar een dergelijke vervanging zal een extreem lage nauwkeurigheid opleveren, omdat over het algemeen met een beperkt aantal experimenten momenten van hoge orde met grote fouten worden bepaald. In de praktijk komt het echter vaak voor dat er sprake is van een soort kwantiteitsverdeling X vooraf bekend: alleen de parameters zijn onbekend. Dan kun je proberen μ 4 door te drukken D.

Laten we het meest voorkomende geval nemen, namelijk de waarde X verdeeld volgens de normale wet. Vervolgens wordt het vierde centrale moment uitgedrukt in termen van spreiding (zie hoofdstuk 6, paragraaf 6.2);

en formule (14.3.12) geeft of

Het onbekende vervangen in (14.3.14) D zijn beoordeling D, we krijgen: waar vandaan

Moment μ 4 kan worden uitgedrukt door D ook in sommige andere gevallen, wanneer de verdeling van de waarde X is niet normaal, maar het uiterlijk ervan is bekend. Voor de wet van uniforme dichtheid (zie hoofdstuk 5) hebben we bijvoorbeeld:

waarbij (a, P) het interval is waarop de wet is gespecificeerd.

Vandaar,

Met behulp van formule (14.3.12) verkrijgen we: waar vinden we ongeveer

In gevallen waarin het type verdelingswet voor de hoeveelheid 26 onbekend is, wordt bij het maken van een geschatte schatting van de waarde a/) nog steeds aanbevolen om formule (14.3.16) te gebruiken, tenzij er speciale redenen zijn om aan te nemen dat deze wet is heel anders dan normaal (heeft een merkbare positieve of negatieve kurtosis).

Als de geschatte waarde a/) op de een of andere manier wordt verkregen, kunnen we een betrouwbaarheidsinterval voor de variantie construeren op dezelfde manier als we dit voor de wiskundige verwachting hebben gebouwd:

waarbij de waarde afhankelijk van de gegeven waarschijnlijkheid p wordt gevonden volgens de tabel. 14.3.1.

Voorbeeld 2. Vind een betrouwbaarheidsinterval van ongeveer 80% voor de variantie van een willekeurige variabele X onder de omstandigheden van voorbeeld 1, als bekend is dat de waarde X verdeeld volgens een wet die dicht bij normaal ligt.

Oplossing. De waarde blijft hetzelfde als in de tabel. 14.3.1:

Volgens de formule (14.3.16)

Met behulp van formule (14.3.18) vinden we het betrouwbaarheidsinterval:

Het overeenkomstige bereik van standaarddeviatiewaarden: (0,21; 0,29).

14.4. Exacte methoden voor het construeren van betrouwbaarheidsintervallen voor de parameters van een willekeurige variabele, verdeeld volgens een normale wet

In de vorige subsectie hebben we ruwweg benaderde methoden onderzocht voor het construeren van betrouwbaarheidsintervallen voor wiskundige verwachtingen en variantie. Hier zullen we een idee geven van de exacte methoden om hetzelfde probleem op te lossen. We benadrukken dat het, om nauwkeurig betrouwbaarheidsintervallen te kunnen vinden, absoluut noodzakelijk is om vooraf de vorm van de verdelingswet van de hoeveelheid te kennen. X, terwijl dit voor de toepassing van benaderende methoden niet nodig is.

Idee precieze methoden het construeren van betrouwbaarheidsintervallen komt op het volgende neer. Elk betrouwbaarheidsinterval wordt gevonden op basis van een voorwaarde die de waarschijnlijkheid uitdrukt dat aan bepaalde ongelijkheden wordt voldaan, waaronder de schatting waarin we geïnteresseerd zijn A. Wet van waarderingsverdeling A in het algemene geval hangt af van onbekende parameters van de hoeveelheid X. Soms is het echter mogelijk om ongelijkheden uit een willekeurige variabele door te geven A naar een andere functie van waargenomen waarden X p X 2, ..., X p. waarvan de verdelingswet niet afhankelijk is van onbekende parameters, maar alleen afhangt van het aantal experimenten en van het type verdelingswet van de hoeveelheid X. Dit soort willekeurige variabelen spelen een belangrijke rol in de wiskundige statistiek; ze zijn zeer gedetailleerd bestudeerd voor het geval van een normale verdeling van de hoeveelheid X.

Dat is bijvoorbeeld bewezen bij een normale verdeling van de waarde X willekeurige waarde

gehoorzaamt aan de zogenaamde Wet studentenverdeling Met P- 1 vrijheidsgraden; de dichtheid van deze wet heeft de vorm

waarbij G(x) de bekende gammafunctie is:

Het is ook bewezen dat de willekeurige variabele

heeft een "%2 distributie" met P- 1 vrijheidsgraden (zie hoofdstuk 7), waarvan de dichtheid wordt uitgedrukt door de formule

Zonder stil te staan ​​bij de afleidingen van verdelingen (14.4.2) en (14.4.4), zullen we laten zien hoe deze kunnen worden toegepast bij het construeren van betrouwbaarheidsintervallen voor parameters Ty D.

Laat het geproduceerd worden P onafhankelijke experimenten met een willekeurige variabele X, normaal verdeeld met onbekende parameters NAAR. Voor deze parameters werden schattingen verkregen

Het is vereist om betrouwbaarheidsintervallen te construeren voor beide parameters die overeenkomen met de bep.

Laten we eerst een betrouwbaarheidsinterval construeren voor de wiskundige verwachting. Het is normaal om dit interval symmetrisch te nemen ten opzichte van T; laat sp de helft van de lengte van het interval aangeven. De waarde sp moet zo worden gekozen dat aan de voorwaarde wordt voldaan

Laten we proberen vanaf de willekeurige variabele naar de linkerkant van gelijkheid (14.4.5) te gaan T naar een willekeurige variabele T, verdeeld volgens de studentenwet. Om dit te doen, vermenigvuldigt u beide zijden van de ongelijkheid |m-w?|

door een positieve waarde: of, met behulp van notatie (14.4.1),

Laten we een getal / p zoeken zodat de waarde / p uit de voorwaarde kan worden gevonden

Uit formule (14.4.2) blijkt duidelijk dat (1) een even functie is, daarom geeft (14.4.8)

Gelijkheid (14.4.9) bepaalt de waarde / p afhankelijk van p. Als u een tabel met integrale waarden tot uw beschikking heeft

dan kan de waarde van /p worden gevonden door omgekeerde interpolatie in de tabel. Het is echter handiger om vooraf een tabel met /p-waarden op te stellen. Een dergelijke tabel wordt gegeven in de bijlage (Tabel 5). Deze tabel toont de waarden afhankelijk van het betrouwbaarheidsniveau p en het aantal vrijheidsgraden P- 1. Na / p uit de tabel bepaald te hebben. 5 en aangenomen

we zullen de helft van de breedte van het betrouwbaarheidsinterval / p en het interval zelf vinden

Voorbeeld 1. Er werden 5 onafhankelijke experimenten uitgevoerd op een willekeurige variabele X, normaal verdeeld met onbekende parameters T en over. De resultaten van de experimenten worden in tabel gegeven. 14.4.1.

Tabel 14.4.1

Vind beoordeling T voor de wiskundige verwachting en construeer er een betrouwbaarheidsinterval van 90% / p voor (d.w.z. het interval dat overeenkomt met de bep = 0,9).

Oplossing. We hebben:

Volgens tabel 5 van de aanvraag voor P - 1 = 4 en p = 0,9 vinden we waar

Het betrouwbaarheidsinterval zal zijn

Voorbeeld 2. Voor de voorwaarden van voorbeeld 1 van paragraaf 14.3, uitgaande van de waarde X normaal verdeeld, vind het exacte betrouwbaarheidsinterval.

Oplossing. Volgens tabel 5 van de bijlage vinden we wanneer P - 1 = 19ir =

0,8 / p = 1,328; vanaf hier

Als we vergelijken met de oplossing van voorbeeld 1 van subparagraaf 14.3 (e p = 0,072), zijn we ervan overtuigd dat de discrepantie zeer onbeduidend is. Als we de nauwkeurigheid tot op de tweede decimaal handhaven, vallen de betrouwbaarheidsintervallen gevonden door de exacte en geschatte methoden samen:

Laten we verder gaan met het construeren van een betrouwbaarheidsinterval voor de variantie. Beschouw de zuivere variantieschatter

en druk de willekeurige variabele uit D door omvang V(14.4.3), met verdeling x 2 (14.4.4):

De wet van de verdeling van kwantiteit kennen V, je kunt het interval /(1) vinden waarin het valt met een gegeven waarschijnlijkheid p.

Wet van distributie kn_x(v) magnitude I 7 heeft de vorm getoond in Fig. 14.4.1.

Rijst. 14.4.1

De vraag rijst: hoe kies je het interval / p? Als de wet van de verdeling van de grootte V symmetrisch was (zoals de normale wet of de Student-verdeling), zou het normaal zijn om het interval /p symmetrisch te nemen ten opzichte van de wiskundige verwachting. In dit geval de wet k p_x (v) asymmetrisch. Laten we afspreken om het interval /p zo te kiezen dat de waarschijnlijkheid van de waarde gelijk is aan: V voorbij het interval naar rechts en links (gearceerde gebieden in figuur 14.4.1) waren hetzelfde en gelijk

Om met deze eigenschap een interval /p te construeren, gebruiken we de tabel. 4 toepassingen: het bevat cijfers j) zoals dat

voor de waarde V, met x 2 -verdeling met r vrijheidsgraden. In ons geval r = n- 1. Laten we het oplossen r = n- 1 en zoek in de overeenkomstige rij van de tabel. 4 twee betekenissen x 2 - de ene komt overeen met waarschijnlijkheid, de andere - waarschijnlijkheid. Laten we deze aanduiden

waarden om 2 uur En xl? Het interval heeft j 2, met je linkerhand, en jij ~ juiste einde.

Laten we nu uit het interval / p het gewenste betrouwbaarheidsinterval /| vinden, voor de spreiding met grenzen D, en D2, wat het punt dekt D met waarschijnlijkheid p:

Laten we een interval / (, = (?> ь А) construeren dat het punt bedekt D dan en slechts dan als de waarde V valt in het interval /r. Laten we laten zien dat het interval

voldoet aan deze voorwaarde. De ongelijkheid inderdaad zijn gelijk aan ongelijkheid

en deze ongelijkheden worden tevredengesteld met waarschijnlijkheid p. Het betrouwbaarheidsinterval voor de variantie is dus gevonden en wordt uitgedrukt door formule (14.4.13).

Voorbeeld 3. Vind het betrouwbaarheidsinterval voor de variantie onder de voorwaarden van voorbeeld 2 van paragraaf 14.3, als bekend is dat de waarde X normaal verdeeld.

Oplossing. We hebben . Volgens tabel 4 van de bijlage

wij vinden bij r = n- 1 = 19

Met behulp van formule (14.4.13) vinden we het betrouwbaarheidsinterval voor de variantie

Het overeenkomstige interval voor de standaardafwijking is (0,21; 0,32). Dit interval overschrijdt slechts weinig het interval (0,21; 0,29) verkregen in voorbeeld 2 van subsectie 14.3 met behulp van de benaderende methode.

  • Figuur 14.3.1 beschouwt een betrouwbaarheidsinterval dat symmetrisch is rond a. Over het algemeen is dit, zoals we later zullen zien, niet nodig.

Het betrouwbaarheidsinterval komt uit de statistiek. Dit is een bepaald bereik waarmee een onbekende parameter kan worden geschat hoge graad betrouwbaarheid. De eenvoudigste manier om dit uit te leggen is met een voorbeeld.

Stel dat u een willekeurige variabele moet bestuderen, bijvoorbeeld de reactiesnelheid van de server op een clientverzoek. Elke keer dat een gebruiker het adres van een specifieke site typt, reageert de server met verschillende snelheden. De onderzochte responstijd is dus willekeurig. Het betrouwbaarheidsinterval stelt ons dus in staat de grenzen van deze parameter te bepalen, en dan kunnen we zeggen dat de server zich met een waarschijnlijkheid van 95% binnen het bereik zal bevinden dat we hebben berekend.

Of je moet weten hoeveel mensen er van weten handelsmerk bedrijven. Wanneer het betrouwbaarheidsinterval wordt berekend, kan bijvoorbeeld worden gezegd dat het aandeel consumenten dat zich hiervan bewust is met een waarschijnlijkheid van 95% tussen 27% en 34% ligt.

Nauw verwant aan deze term is de waarde van deid. Het vertegenwoordigt de waarschijnlijkheid dat de gewenste parameter in het betrouwbaarheidsinterval is opgenomen. Hoe groot ons gewenste bereik zal zijn, hangt af van deze waarde. Hoe groter de waarde die nodig is, hoe smaller het betrouwbaarheidsinterval wordt, en omgekeerd. Normaal gesproken is deze ingesteld op 90%, 95% of 99%. De waarde 95% is het populairst.

Deze indicator wordt ook beïnvloed door de spreiding van waarnemingen en de definitie ervan is gebaseerd op de veronderstelling dat het onderzochte kenmerk voldoet. Deze verklaring staat ook bekend als de wet van Gauss. Volgens hem is normaal een verdeling van alle kansen van een continue willekeurige variabele die kan worden beschreven door een waarschijnlijkheidsdichtheid. Als de aanname van een normale verdeling onjuist is, kan de schatting onjuist zijn.

Laten we eerst eens kijken hoe we het betrouwbaarheidsinterval kunnen berekenen. Er zijn hier twee mogelijke gevallen. Dispersie (de mate van spreiding van een willekeurige variabele) kan wel of niet bekend zijn. Als het bekend is, wordt ons betrouwbaarheidsinterval berekend met behulp van de volgende formule:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - teken,

t - parameter uit de Laplace-distributietabel,

σ is de vierkantswortel van de variantie.

Als de variantie onbekend is, kan deze worden berekend als we alle waarden van het gewenste kenmerk kennen. Hiervoor wordt de volgende formule gebruikt:

σ2 = х2ср - (хср)2, waarbij

х2ср - gemiddelde waarde van vierkanten van het bestudeerde kenmerk,

(хср)2 is het kwadraat van dit kenmerk.

De formule waarmee het betrouwbaarheidsinterval in dit geval wordt berekend, verandert enigszins:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - steekproefgemiddelde,

α - teken,

t is een parameter die wordt gevonden met behulp van de Student-verdelingstabel t = t(ɣ;n-1),

sqrt(n) - vierkantswortel van de totale steekproefomvang,

s is de vierkantswortel van de variantie.

Denk eens aan dit voorbeeld. Stel dat op basis van de resultaten van zeven metingen het bestudeerde kenmerk gelijk is aan 30 en dat de steekproefvariantie gelijk is aan 36. Het is noodzakelijk om met een waarschijnlijkheid van 99% een betrouwbaarheidsinterval te vinden dat de ware waarde bevat. waarde van de gemeten parameter.

Laten we eerst bepalen waar t gelijk aan is: t = t (0,99; 7-1) = 3,71. Met behulp van de bovenstaande formule krijgen we:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (vierkant(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Het betrouwbaarheidsinterval voor de variantie wordt berekend zowel in het geval van een bekend gemiddelde als wanneer er geen gegevens zijn over de wiskundige verwachting, en alleen de waarde van de onbevooroordeelde puntschatting van de variantie bekend is. We zullen hier geen formules geven om het te berekenen, omdat ze behoorlijk complex zijn en desgewenst altijd op internet te vinden zijn.

Laten we alleen opmerken dat het handig is om het betrouwbaarheidsinterval te bepalen met behulp van Excel of een netwerkdienst, die zo wordt genoemd.

keer bekeken