Representatief monster. Representativiteit van de steekproef

Representatief monster. Representativiteit van de steekproef

Publicatiedatum 01/09/2013 13:14

Een steekproef is een reeks gegevens die met behulp van bepaalde procedures uit een populatie zijn genomen voor verkennende analyse. Representativiteit is de eigenschap van het reproduceren van een idee van het geheel vanuit zijn deel. Met andere woorden, dit is de mogelijkheid om het idee van een deel uit te breiden naar het geheel, inclusief dit deel.

De representativiteit van een steekproef is een indicator dat de steekproef de kenmerken van de populatie waarvan zij deel uitmaakt volledig en betrouwbaar moet weerspiegelen. Het kan ook worden gedefinieerd als de eigenschap van een steekproef om de kenmerken van de populatie die significant zijn vanuit het oogpunt van het doel van het onderzoek zo volledig mogelijk weer te geven.

Laten we aannemen dat de algemene bevolking uitsluitend uit scholieren bestaat (900 mensen uit 30 klassen, 30 mensen in elke klas). Het doel van het onderzoek is de houding van schoolkinderen ten opzichte van roken. Een steekproefpopulatie die alleen uit 90 leerlingen op de middelbare school bestaat, zal de gehele populatie veel slechter vertegenwoordigen dan een steekproef van dezelfde 90 leerlingen, die uit 3 leerlingen uit elke klas zou bestaan. belangrijkste reden- ongelijke verdeling naar leeftijd. In het eerste geval zal de representativiteit van de steekproef dus laag zijn. In het tweede geval - hoog.

In de sociologie zeggen ze dat er sprake is van representativiteit van een steekproef en de niet-representatiefheid ervan.

Een voorbeeld van een niet-representatieve steekproef is een klassiek geval dat zich in 1936 in de Verenigde Staten voordeed tijdens de presidentsverkiezingen.

Literary Digest, dat zeer succesvol was geweest in het voorspellen van de uitslag van eerdere verkiezingen, zat deze keer verkeerd in zijn voorspellingen, hoewel het enkele miljoenen schriftelijke vragen stuurde naar abonnees en naar respondenten die ze selecteerden uit telefoonboeken en autoregistratielijsten. Van het kwart van de stembiljetten dat volledig werd teruggestuurd, werden de stemmen als volgt verdeeld: 57% gaf de voorkeur aan de Republikeinse kandidaat Alf Landon, en 41% gaf de voorkeur aan de zittende president, Democraat Franklin Roosevelt.

F. Roosevelt won zelfs de verkiezingen en behaalde bijna 60% van de stemmen. De fout van The Literary Digest was als volgt. Ze wilden de representativiteit van de steekproef vergroten. En omdat ze wisten dat de meeste van hun abonnees zich als Republikeinen identificeerden, besloten ze de steekproef uit te breiden met respondenten die ze hadden geselecteerd uit telefoonboeken en autoregistratielijsten. Maar ze hielden geen rekening met de bestaande realiteit en selecteerden zelfs nog meer Republikeinse aanhangers, omdat tijdens de Grote Depressie de midden- en hogere klasse zich auto's en telefoons konden veroorloven. En dit waren vooral Republikeinen, geen Democraten.

Bestaan verschillende soorten monsters: eenvoudig willekeurig, serieel, typisch, mechanisch en gecombineerd.

Eenvoudige willekeurige steekproeven bestaan ​​uit het willekeurig en zonder enig systeem selecteren uit de gehele populatie van eenheden die worden onderzocht.

Mechanische steekproeven worden gebruikt wanneer er sprake is van orde in de algemene bevolking, er is bijvoorbeeld sprake van een bepaalde opeenvolging van eenheden (registratienummers van werknemers, kieslijsten, telefoonnummers van respondenten, aantallen appartementen en huizen, etc.).

Typische selectie wordt gebruikt wanneer de gehele populatie op type in groepen kan worden verdeeld. Bij het werken met de bevolking kunnen dit bijvoorbeeld opleidings-, leeftijds-, sociale groepen zijn; bij onderzoek naar ondernemingen - een bedrijfstak of een afzonderlijke organisatie, enz.

Seriële selectie is handig wanneer eenheden worden gecombineerd in kleine series of groepen. Zo'n serie kunnen games zijn Afgemaakte producten, schoolklassen, werkteams en andere groepen.

Gecombineerde bemonstering omvat het gebruik van alle voorgaande soorten bemonstering in een of andere combinatie.

Een statistische populatie is een object van statistisch onderzoek, bestaande uit kwalitatief homogene eenheden, maar die op een aantal andere kenmerken verschillen.

De algemene bevolking is een verzameling eenheden die moeten worden bestudeerd; het aantal wordt aangegeven met N.

Steekproefpopulatie - een deel van de eenheden van de algemene bevolking, willekeurig geselecteerd, het aantal wordt aangegeven met n. Steekproefobservatie is geen continue observatie waarbij een bepaald deel van de eenheden van de onderzochte populatie, geselecteerd in willekeurige volgorde, wordt onderzocht.

Voordelen van selectieve observatie:

1) bij het onderzoeken van te grote populaties, wanneer voortdurende observatie enorme hoeveelheden arbeid en geld vereist;

2) als het nodig is om in korte tijd informatie te verkrijgen;

3) als continue observatie onmogelijk is.

Basisprincipes van monsterobservatie

1) het garanderen van willekeur - ligt in het feit dat bij het selecteren van elk van de eenheden van de populatie die wordt bestudeerd, een gelijke kans wordt geboden om in de steekproef te worden opgenomen

1) - zorgen voor een voldoende aantal geselecteerde eenheden.

Representativiteit van de steekproef is de representativiteit van het deel dat is geselecteerd uit de gehele onderzochte populatie in relatie tot de kenmerken die worden bestudeerd of die de vorming van algemene kenmerken beïnvloeden.

De essentie van de steekproefmethode is het verkrijgen van primaire gegevens door een monster te observeren, te analyseren en onder de gehele populatie te verspreiden om betrouwbare informatie over het onderzochte fenomeen te verkrijgen.

De kenmerken van de algemene bevolking - gemiddelde, variantie, aandeel - worden algemeen genoemd en worden dienovereenkomstig aangeduid met x, p, waarbij p de verhouding is, de verhouding van het aantal M eenheden dat een bepaald kenmerk bezit, tot de gehele populatie van de algemene bevolking , dat wil zeggen p = M/N.

Generaliserende kenmerken in een steekproefpopulatie worden steekproefkarakteristieken genoemd en worden dienovereenkomstig aangegeven met x, waarbij frequentie is, de verhouding van het aantal eenheden dat een bepaald kenmerk in de steekproefpopulatie l bezit, d.w.z. = m/n.

Het verschil x - x = x wordt de representativiteitsfout van het steekproefgemiddelde genoemd, respectievelijk het verschil - p = wordt de frequentiefout genoemd en het verschil - = - de spreidingsfout.

Representativiteitsfout is de discrepantie tussen het steekproefkenmerk en het verwachte kenmerk van de populatie.

Systematische representativiteitsfouten - fouten die ontstaan ​​in verband met de kenmerken van het aangenomen systeem voor het selecteren en verwerken van observatiegegevens of in verband met een overtreding vastgestelde regels selectie.



Willekeurige fouten in de representativiteit zijn fouten die ontstaan ​​als gevolg van willekeurige verschillen tussen de eenheden in de steekproef en de eenheden in de populatie.

Standaardfout monsters:

Marginale steekproeffout: (t-betrouwbaarheidsfactor).

De omvang van de willekeurige standaard- en marginale fout hangt af van:

1) over de aangenomen methode voor het vormen van de steekproefpopulatie;

2) op de steekproefomvang;

3) over de mate van variabiliteit van het onderzochte kenmerk in de algemene bevolking.

3) Willekeurige selectie en de typen ervan. Eenvoudige willekeurige, niet-repetitieve selectie en eenvoudige willekeurige herhaalde selectie. Typische, mechanische en seriële selectie.
In de praktijk worden verschillende selectiemethoden gebruikt. Fundamenteel kunnen deze methoden in twee typen worden verdeeld:

1. Selectie waarbij de algemene bevolking niet in delen hoeft te worden verdeeld. Deze omvatten: a) eenvoudige willekeurige, niet-repetitieve selectie; b) eenvoudige willekeurige herhaalde selectie.

2. Selectie, waarbij de bevolking in delen wordt verdeeld. Deze omvatten: a) typische selectie; b) mechanische selectie; c) seriële selectie. Eenvoudige willekeurige selectie is een selectie waarbij objecten één voor één uit de gehele populatie worden geselecteerd. U kunt een eenvoudige selectie maken verschillende manieren . Om bijvoorbeeld n objecten uit een populatie van volume N te extraheren, doe je dit: schrijf getallen van 1 tot N op kaarten, die grondig gemengd zijn, en neem er willekeurig één kaart uit; er wordt een voorwerp onderzocht dat hetzelfde nummer heeft als de verwijderde kaart; vervolgens wordt de kaart terug in de stapel gelegd en wordt het proces herhaald, d.w.z. de kaarten worden gemengd, er wordt er willekeurig één uitgenomen, enz. Dit gebeurt n keer; Als gevolg hiervan wordt een eenvoudige willekeurige herhaalde bemonstering van volume n verkregen. Als de verwijderde kaarten niet in het pakket worden teruggeplaatst, is de bemonstering een eenvoudige willekeurige, niet-repetitieve steekproef. Bij een grote populatieomvang blijkt het beschreven proces zeer arbeidsintensief. In dit geval gebruiken ze kant-en-klare tabellen met "willekeurige getallen", waarin de getallen in willekeurige volgorde zijn gerangschikt. Om bijvoorbeeld 50 objecten uit een genummerde populatie te selecteren, opent u een willekeurige pagina van de tabel met willekeurige getallen en noteert u 50 getallen op een rij; Het voorbeeld omvat die objecten waarvan de nummers overeenkomen met de geschreven willekeurige getallen. Als blijkt dat een willekeurig getal in de tabel groter is dan het getal N, dan wordt zo’n willekeurig getal overgeslagen. Bij het uitvoeren van niet-repetitieve steekproeven moeten ook willekeurige getallen uit de tabel die al eerder zijn aangetroffen, worden overgeslagen. Typische selectie wordt selectie genoemd, waarbij objecten niet uit de gehele populatie worden geselecteerd, maar uit elk van de ‘typische’ delen ervan. Als er bijvoorbeeld onderdelen op meerdere machines worden geproduceerd, wordt de selectie niet gemaakt uit de gehele set onderdelen die door alle machines worden geproduceerd, maar uit de producten van elke machine afzonderlijk. Typische selectie wordt gebruikt wanneer het onderzochte kenmerk merkbaar varieert in verschillende typische delen van de algemene bevolking. Als producten bijvoorbeeld op meerdere machines worden vervaardigd, waaronder steeds minder versleten machines, dan is een typische selectie geschikt. Mechanische selectie wordt selectie genoemd, waarbij de populatie “mechanisch” wordt verdeeld in evenveel groepen als er objecten zijn die in de steekproef moeten worden opgenomen, en uit elke groep wordt één object geselecteerd. Als u bijvoorbeeld 20% van de door een machine geproduceerde onderdelen moet selecteren, wordt elk vijfde onderdeel geselecteerd; als het nodig is om 5% van de delen te selecteren, dan wordt elk twintigste deel geselecteerd, enz. Opgemerkt moet worden dat mechanische selectie soms de representativiteit van het monster niet kan garanderen. Als bijvoorbeeld elke twintigste rol die wordt gedraaid wordt geselecteerd en het mes onmiddellijk na selectie wordt vervangen, zullen alle rollen die met botte messen zijn gedraaid, worden geselecteerd. In dit geval is het noodzakelijk om het samenvallen van het selectieritme met het ritme van het vervangen van de snijder te elimineren, waarvoor het bijvoorbeeld nodig is om elke tiende van de twintig gedraaide rollen te selecteren. Seriële selectie is een selectie waarbij objecten uit de algemene bevolking niet één voor één worden geselecteerd, maar in “reeksen” die voortdurend worden onderzocht. Als producten bijvoorbeeld door een grote groep automatische machines worden vervaardigd, worden de producten van slechts enkele machines aan een uitgebreid onderzoek onderworpen. Er wordt gebruik gemaakt van seriële selectie wanneer het onderzochte kenmerk in verschillende series enigszins varieert. Wij benadrukken dat in de praktijk vaak gebruik wordt gemaakt van gecombineerde selectie, waarbij bovengenoemde methoden worden gecombineerd. Soms wordt de populatie bijvoorbeeld verdeeld in reeksen van dezelfde grootte, vervolgens worden verschillende reeksen geselecteerd door middel van eenvoudige willekeurige steekproeven, en ten slotte worden individuele objecten uit elke reeks geëxtraheerd door middel van eenvoudige willekeurige steekproeven.



4) Variatieserie. Empirische distributiefunctie. Histogram en veelhoek.
Laten we in een experiment een willekeurige variabele X met een verdelingsfunctie F(x) waarnemen. En laat een eenmalig experiment ons in staat stellen een van de mogelijke betekenissen ervan te vinden. Laten we aannemen dat het experiment onder dezelfde omstandigheden een willekeurig aantal keren kan worden herhaald, en dat de experimenten (proeven) zelf onafhankelijk zijn.

De resultaten van de n onderzochte experimenten zijn een reeks x1, x2, …, xn van reële getallen, die een steekproef van grootte n wordt genoemd. Dit is de praktische interpretatie van bemonstering. Elke xi (i=1, 2, …, n) wordt een variant genoemd (voorbeeldelement, waargenomen waarde, attribuutwaarde).

De waargenomen waarden x1, x2 xn verkregen als resultaat van n experimenten vertegenwoordigen een steekproef uit de volledige reeks waarden die de waarde X die voor ons van belang is, kan aannemen. Het is gebruikelijk om te zeggen dat we te maken hebben met een reeks van waarden die overeenkomen met een bepaalde steekproef uit de algemene bevolking. De steekproef in kwestie moet de eigenschap representativiteit (representativiteit) hebben, dat wil zeggen zodanig zijn dat de gegevens ervan kunnen worden gebruikt om een ​​correct beeld te krijgen van de gehele populatie als geheel. Of het betreffende monster representatief is of niet, hangt af van de selectiemethode.

In de wiskundige literatuur wordt het woord 'monster' veel vaker in een andere betekenis gebruikt. We kunnen een specifiek monster x1, x2, ..., xn beschouwen als een realisatie van de waarden van een systeem van willekeurige variabelen (X1, X2, ..., Xn), identiek verdeeld, volgens dezelfde wet als X.

Een steekproef van volume n uit de verdeling van een willekeurige variabele X is een reeks x1, x2, ..., xn van onafhankelijke en identiek verdeelde - volgens dezelfde wet als X - willekeurige variabelen.

Vaak doet zich in praktische situaties het volgende probleem voor: er is een steekproef en er is geen informatie over de vorm van de verdelingsfunctie F(x). Het is nodig om een ​​schatting (benadering) te maken voor deze onbekende functie F(x).

De meest geprefereerde schatting van de functie F(x) is de empirische verdelingsfunctie Fn(x), die als volgt wordt gedefinieerd

waarbij nx het aantal varianten is dat kleiner is dan x (x behoort tot R), n is de steekproefomvang.

De functie Fn(x) dient als goede benadering voor de onbekende verdelingsfunctie voor grote n.
Empirische distributiefunctie

Laat de statistische frequentieverdeling van een kwantitatief kenmerk X bekend zijn. Laten we de notatie introduceren:

– het aantal waarnemingen waarbij de waarde van het attribuut is waargenomen kleiner is;

– totaal aantal waarnemingen (steekproefomvang).

Het is duidelijk dat de relatieve frequentie van de gebeurtenis gelijk is.

Als deze verandert, zal de relatieve frequentie ook veranderen, dat wil zeggen dat de relatieve frequentie een functie is van.

Omdat deze functie empirisch (experimenteel) wordt gevonden, wordt deze empirisch genoemd.

Een empirische distributiefunctie (steekproefverdelingsfunctie) is een functie die voor elke waarde de relatieve frequentie van een gebeurtenis bepaalt.

Dus, per definitie, waar is het aantal opties, kleiner, is de steekproefomvang.

Uit de definitie van een functie volgen de volgende eigenschappen:

1) de waarden van de empirische functie behoren tot het segment

2) – niet-afnemende functie;

3) als – kleinste optie, dan, op;

als dit de beste optie is, dan op.

De empirische verdelingsfunctie van de steekproef dient dus om de theoretische verdelingsfunctie van de populatie te schatten.
Voor de duidelijkheid zijn er verschillende statistische verdelingsgrafieken gemaakt.

Op basis van de gegevens van een discrete variatiereeks wordt een polygoon van frequenties of relatieve frequenties geconstrueerd.

Een frequentiepolygoon is een onderbroken lijn waarvan de segmenten de punten (x1; n1), (x2; n2), ..., (xk; nk) verbinden. Om een ​​frequentiepolygoon te construeren, worden de xi-varianten uitgezet op de abscis-as, en de corresponderende frequenties ni op de ordinaat-as. Punten (xi; ni) zijn verbonden door rechte lijnen en er wordt een frequentiepolygoon verkregen (Fig. 1).

Een polygoon van relatieve frequenties is een onderbroken lijn waarvan de segmenten de punten (x1; W1), (x2; W2), ..., (xk; Wk) verbinden. Om een ​​polygoon van relatieve frequenties te construeren, worden varianten xi uitgezet op de abscis-as, en relatieve frequenties Wi, die daarmee corresponderen, worden uitgezet op de ordinaat-as. Punten (xi; Wi) worden verbonden door rechte lijnsegmenten en er wordt een polygoon van relatieve frequenties verkregen.

Bij een continu karakteristiek is het raadzaam een ​​histogram op te bouwen.

Vanuit het oogpunt van de statistische benadering wordt de representativiteit van de steekproef verzekerd door aan de volgende voorwaarden te voldoen: a) elk van de objecten in de algemene populatie moet dezelfde waarschijnlijkheid hebben om in de steekproef vertegenwoordigd te zijn; b) er wordt geselecteerd uit homogene populaties; c) het aantal objecten in de steekproef moet groot genoeg zijn; d) de steekproef en de populatie moeten statistisch gezien zo homogeen mogelijk zijn.

Het maken van een eenvoudige waarschijnlijkheidssteekproef kan worden uitgevoerd met behulp van de randomisatiemethode - een willekeurige selectieprocedure. Bij deze methode worden de kenmerken van de proefpersonen genegeerd, heeft hun opname in de steekproef dezelfde waarschijnlijkheid en is deze onbevooroordeeld. Dit betekent dat elke proefpersoon een gelijke kans heeft om in de steekproef te worden opgenomen. De procedure voor het construeren van een eenvoudige willekeurige steekproef omvat de volgende stappen: a) het is noodzakelijk om te verkrijgen volle lijst leden van de bevolking en nummer deze lijst; b) bepaal de verwachte steekproefomvang, dat wil zeggen het verwachte aantal proefpersonen; c) haal zoveel getallen uit de tabel met willekeurige getallen als er steekproefeenheden nodig zijn (als er bijvoorbeeld 100 mensen in de steekproef zitten, worden er 100 willekeurige getallen uit de tabel gehaald, die door een computerprogramma kunnen worden gegenereerd). Een vereenvoudigde versie van randomisatie is de mechanische selectie van onderwerpen op basis van een lijst van de algemene bevolking op een bepaald interval (K), dat willekeurig wordt bepaald.

Ondanks zijn eenvoud heeft deze methode aanzienlijke beperkingen:

Verhoogt de inspanning en kosten van het verzamelen van gegevens aanzienlijk als de populatie numeriek groot is of over een groot gebied is verspreid geografisch gebied(dit is typisch bij het maken van LDP's die zijn ontworpen voor het grote publiek);

De resultaten van eenvoudige willekeurige steekproeven hebben vaak een lage nauwkeurigheid en een grote standaardfout.

In het geval van een heterogene populatie wordt aanbevolen om, alvorens een steekproef te vormen, deze populatie in homogene delen te verdelen. Ze kunnen worden gevormd op basis van een of ander kenmerk: administratief-territoriale eenheden (bijvoorbeeld stadsdelen), sociaal-demografische kenmerken (geslacht, leeftijd, sociale status) of organisatorische aansluiting van de onderwerpen ( onderwijsinstellingen) enz. Een dergelijke steekproef wordt geregionaliseerd (gestratificeerd) genoemd. Vervolgens wordt uit elk homogeen deel willekeurig selectie in het monster uitgevoerd. Om te evalueren bijvoorbeeld methoden voor het bestuderen van interpersoonlijke identiteit in groepen en subgroepen En methoden voor het bestuderen van microgroepen en groepsidentiteit (met betrekking tot onderwijsgroepen voor adolescenten en jongeren) werden zes middelbare scholen in drie districten en twee universiteiten in Rostov aan de Don geselecteerd. Vervolgens werden met behulp van een willekeurige selectiemethode zes groepen van scholen uit de 10e en 11e klas geselecteerd groepen studenten 2 universitaire cursussen (totaal 18 groepen) Het totaal aantal vakken bedroeg 413 personen.



Een andere optie voor randomisatie is het maken van een serieel (cluster of cluster) monster. Hier zijn de eenheden van willekeurige selectie niet de objecten zelf, maar groepen (clusters of nesten). Objecten binnen groepen worden continu onderzocht.

Het creëren van een niet-waarschijnlijkheidssteekproef, die op grote schaal wordt toegepast bij het beoordelen van psychodiagnostische technieken en het opstellen van normen, gebeurt niet volgens het toevalsbeginsel, maar volgens subjectieve criteria: beschikbaarheid, typiciteit, gelijke vertegenwoordiging, enz. Er zijn verschillende manieren om zo'n monster te vormen:

1) Quotummethode. In eerste instantie wordt een bepaald aantal groepen objecten geïdentificeerd (bijvoorbeeld mannen en vrouwen van 18-25 jaar, 26-35 jaar en 36-55 jaar). Voor elke groep wordt het aantal proefpersonen vermeld dat met deze techniek moet worden onderzocht Het aantal proefpersonen dat in elk van de groepen moet worden opgenomen, wordt ingesteld in verhouding tot het eerder bekende aandeel van de groep in de algemene bevolking (bijvoorbeeld als de algemene bevolking wordt vertegenwoordigd door 5000 mensen, waarvan 2000 zijn er vrouwen en 3000 mannen, dan zijn er in de quotasteekproef 200 vrouwen en 300 mannen), of hetzelfde voor elke groep. Binnen groepen worden objecten willekeurig geselecteerd.

2) De “sneeuwbal”-methode. De steekproef is als volgt opgebouwd: elke respondent wordt, beginnend bij de eerste, gevraagd naar contacten van zijn vrienden, collega's en kennissen die aan de selectievoorwaarden zouden voldoen en aan het onderzoek zouden kunnen deelnemen. Met uitzondering van de eerste stap wordt de steekproef dus gevormd met deelname van de onderzoeksobjecten zelf.

3) Spontane selectiemethode: de meest toegankelijke respondenten worden bevraagd. De omvang en samenstelling van spontane steekproeven is niet vooraf bekend en wordt slechts door één parameter bepaald: de wens en activiteit van de respondenten.

4) Methode voor het selecteren van typische objecten. Na zonering (stratificatie) wordt uit elke groep een typisch object geselecteerd, d.w.z. een object dat dicht bij het gemiddelde ligt wat betreft de meeste kenmerken die in het onderzoek zijn bestudeerd.

De representativiteit van een steekproef wordt gemeten aan de hand van het verschil tussen de kenmerken van de steekproef en die van de algemene bevolking. (Hoe meer de steekproef en de algemene bevolking statistisch homogeen zijn, des te representatiever de steekproef is.) De werkelijke waarde van dit verschil blijft echter onbekend, waardoor de maatstaf voor representativiteit de waarschijnlijke waarde is, bepaald volgens de regels van de wiskundige statistiek, of het gemiddelde kwadraat van de mogelijke waarden ervan.

Bij het ontwikkelen, evalueren en standaardiseren van een methodiek wordt op basis daarvan een oordeel over de mate van representativiteit gevormd schattingen van de minimale steekproefomvang En En overeenstemming van de empirische verdeling met de normale verdeling .

De vereiste steekproefomvang om kwantitatieve representativiteit te garanderen, wordt vaak gedefinieerd als de minimale steekproefomvang die nodig is om ervoor te zorgen dat het steekproefgemiddelde () met niet meer dan een gespecificeerd bedrag verschilt van het werkelijke populatiegemiddelde. In dit geval kan de minimale steekproefomvang worden geschat door te bepalen Betrouwbaarheidsinterval voor de gemiddelde waarde volgens de methode-indicatoren:

waarbij n de minimale steekproefomvang is, ua – waarden voor standaardbetrouwbaarheidskansen, - standaarddeviatie van de steekproef, D - een gespecificeerde hoeveelheid afwijking van het steekproefgemiddelde van het algemene gemiddelde.

Volgens bijvoorbeeld methodologie voor het bestuderen van gezelligheid-terugtrekking We hebben een pilot-enquête uitgevoerd onder 50 proefpersonen. Met behulp van de ‘sleutel’ verwerken we de resultaten en verkrijgen we testindicatoren voor elk onderwerp. Vervolgens voeren we op dit monster (N=50) de berekening uit:

a) gemiddelde waarde: , (3)

waar is de testindicator van elk onderwerp, N is het aantal onderwerpen;

b) standaardafwijking (gemiddelde kwadraten): (4).

Volgens de resultaten van het steekproefonderzoek is het gemiddelde 11,25 en de standaarddeviatie 3,47. We stellen bijvoorbeeld een betrouwbaarheidskans van 95% ( ua= 1,96 in tabel. 1) en afwijking van de gemiddelde waarde van het monster van de werkelijke waarde van het gemiddelde resultaat met niet meer dan D= 0,5 en met behulp van formule (1) vinden we

= 154.

Met een steekproefomvang dus N= 154 is er een kans van 95% dat het rekenkundig gemiddelde van de steekproef met niet meer dan 0,5 punt zal verschillen van het algemene gemiddelde.

tafel 1

Waarden uu voor standaardbetrouwbaarheidskansen

A 1 - een u A
0,05 0,95 1,96
0,01 0,99 2,58
0,001 0,999 3,28

In dit geval moeten we een aanvullend onderzoek uitvoeren op 104 proefpersonen en daarmee de steekproefomvang vergroten tot 154. De minimale steekproefomvang hangt af van het gegeven niveau vanid, de waarde D en steekproefstandaarddeviatie. Hoe groter deid, hoe kleiner de waarde D of meer standaarddeviatie , daarom is een grotere minimumsteekproef vereist.

Normale verdeling meestal gebruikt om een ​​reeks empirische gegevens statistisch te beschrijven, de representativiteit van een steekproef en schaal te beoordelen (methodologie) en testscores te standaardiseren (gebaseerd op conversie naar een intervalschaal). Statistische criteria voor het testen van hypothesen (z-test, criterium, Fisher's F-test, Student's t-test, enz.) zijn gebaseerd op de eigenschappen van de normale verdeling.

De normaliteit van de verdeling wordt beoordeeld aan de hand van het Kolmogorov-Smirnov-criterium, dat als het meest consistent wordt beschouwd voor het bepalen van de mate waarin de empirische verdeling in overeenstemming is met de normale. Als P>0,1, dan wordt geconcludeerd dat deze empirische verdeling ongeveer normaal is. Als voorbeeld kunnen we de indicatoren noemen normaliteit schattingen op schalen multidimensionale professionele psychologische persoonlijkheidstest.

Vergelijking van de empirische verdeling met de theoretische normale verdeling kan ook worden gedaan door eigenschappen zoals scheefheid () en kurtosis () te beoordelen. De scheefheid en kurtosis van een normale verdeling zijn nul. Als ten minste één van deze twee indicatoren van de geteste empirische verdeling significant afwijkt gegeven waarde betekent dit dat de geschatte verdeling afwijkend is.

De asymmetrie van de empirische verdeling wordt bepaald door de formule:

, (5)

Waar - rekenkundig gemiddelde, - standaardafwijking,

Gemiddeld kubieke (), (6)

MET– wortelgemiddelde kwadraat () (7).

Als de empirische verdeling niet normaal is, is de steekproef niet representatief in kwaliteit en/of kwantiteit. Dit kan er echter ook op duiden dat deze techniek geen normale verdeling van de resultaten geeft, omdat het stimulusmateriaal slecht is samengesteld (bijvoorbeeld veel test taken hebben geen gemiddeld diagnostisch vermogen).

Het concept van standaarditeit

Standaarditeit– eenwording, het tot uniforme normen brengen verschillende delen PDM en procedures voor de toepassing ervan.

Vanaf het allereerste begin van hun ontwikkeling worden psychodiagnostische methoden opgevat als universeel, niet-specifiek, d.w.z. die gebruikt kunnen worden door verschillende specialisten V verschillende situaties. Daarom moet de PDM beschikken over een uniforme procedure, standaard prikkelmateriaal (verklaringen, tekeningen etc.), standaard methode verwerking en wijze van interpretatie van de resultaten. Dit is wat ons in staat stelt conclusies te vergelijken, d.w.z. evalueer de manifestatie van dezelfde mentale parameter in verschillende situaties en bij verschillende mensen en, afhankelijk van de sterkte van de manifestatie van de gediagnosticeerde parameter, adequate aanbevelingen ontwikkelen. Het standaardkarakter van de PDM en de voorwaarden voor het gebruik ervan maken het mogelijk om de resultaten van verschillende specialisten tijdens de diagnose te vergelijken verschillende mensen. Bij elke afwijking van de PDM van de standaard kunnen de resultaten ervan niet worden vergeleken met de resultaten die zijn verkregen met het origineel van deze techniek, gebruikt bij andere mensen of in een andere situatie.

Het ontbreken of schenden van de standaardisatie van het DMP betekent echter niet dat deze techniek helemaal niet kan worden toegepast. Een niet-gestandaardiseerde techniek kan worden gebruikt voor onderzoeksdoeleinden - om nieuwe mentale verschijnselen te bestuderen, nieuwe feiten te identificeren en wetenschappelijke resultaten te verzamelen, oorzaak-en-gevolg relaties en patronen vast te stellen. Deze techniek kan echter niet worden gebruikt voor psychodiagnostische doeleinden.

Het meeste sociologische onderzoek is niet continu, maar selectief: volgens strikte regels er wordt een bepaald aantal mensen geselecteerd, wat de sociaal-demografische kenmerken van de structuur van het bestudeerde object weerspiegelt. Dit soort onderzoek heet sampling.

Bij het samenstellen van een sociologische steekproef worden veel speciale termen gebruikt, waaronder de twee belangrijkste: algemeen En steekproefpopulatie.

De populatie waaruit opties worden geselecteerd voor gezamenlijk onderzoek wordt opgeroepen algemeen en het deel van de leden dat uit de algemene bevolking wordt geselecteerd, wordt genoemd monsters,of steekproefpopulatie. De omvang van de populatie wordt aangegeven door het symbool N, en de steekproefomvang is N.

Bevolking beschouw de gehele bevolking of dat deel ervan dat de socioloog wil bestuderen, een groep mensen die een of meer eigenschappen hebben die moeten worden bestudeerd. Vaak is de populatie (ook wel populatie genoemd) zo groot dat het interviewen van elk lid uiterst omslachtig en kostbaar is. Dit zijn degenen op wie de theoretische interesse van een socioloog is gericht (in de zin dat een wetenschapper alleen indirect over elke vertegenwoordiger van de algemene bevolking kan leren - op basis van informatie over de steekproefpopulatie).

Bemonstering is een verzameling elementen van een object van sociologisch onderzoek dat onderworpen is aan directe studie. Het concept van steekproeven in de statistiek en de sociologie wordt in twee betekenissen beschouwd:

– steekproef (als gevolg van een actie) – een representatief deel van de algemene bevolking waarin de wet van de verdeling van een kenmerk overeenkomt met de wet van de verdeling van dit kenmerk in de algemene bevolking;

– bemonstering (als methode of actieproces) – een methode om objecten uit een algemene populatie te selecteren in een steekproef.

Het monster zou moeten de beste manier vertegenwoordigen het object van studie (algemene bevolking).

Steekproefpopulatie– gereduceerd model van de algemene bevolking. Met andere woorden, dit is een groep mensen die de socioloog interviewt. Een steekproef, of steekproefkader, omvat alleen degenen die de socioloog rechtstreeks wil interviewen. Laten we ons voorstellen dat het onderwerp van zijn onderzoek, dat wil zeggen het onderwerp, de economische activiteit van gepensioneerden is. Alle gepensioneerden – ouderen ouder dan 55 jaar (vrouwen) en 60 jaar (mannen) – zullen de algemene bevolking vormen. Met behulp van speciale formules berekende de socioloog dat het voor hem voldoende was om 2,5 duizend gepensioneerden te ondervragen. Dit wordt zijn steekproefpopulatie.

De basisregel voor de samenstelling ervan is: Elk element in de populatie moet een gelijke kans hebben om in de steekproef te worden opgenomen..Maar hoe bereik je dit? Allereerst moet u zoveel mogelijk eigenschappen of parameters van de algemene bevolking achterhalen, bijvoorbeeld de spreiding in leeftijd, inkomen, nationaliteit en woonplaats van respondenten. De spreiding in de leeftijden van respondenten wordt genoemd variatie,specifieke leeftijdswaarden – waarden, en het geheel van alle waardenvormen variabel.

De variabele ‘leeftijd’ heeft dus waarden van 0 tot 70 (gemiddelde levensverwachting) of meer jaren. De waarden zijn gegroepeerd in intervallen: 0–5, 6–10, 11–15 jaar, enz. Ze kunnen op verschillende manieren worden gegroepeerd, het hangt allemaal af van de doelstellingen van het onderzoek. De waardenintervallen voor de variabele ‘leeftijd’ beginnen in het geval van gepensioneerden bij 55 en 60 jaar.

Een hele bevolking, een hele natie of een zeer grote sociale groep vormt zelden een algemene bevolking. In de meeste empirische onderzoeken is de socioloog geïnteresseerd in een bepaald probleem, bijvoorbeeld de toename van het aantal echtscheidingen onder jonge gezinnen in grote steden of interesse in investeringsactiviteiten onder de middenklasse van de hoofdstad. Echtscheidingen en investeringsactiviteiten- dit zijn de onderwerpen die een bepaalde onderzoeker in een bepaalde periode interesseren. Dienovereenkomstig worden alle mensen die bij dit proces betrokken zijn of aan dit evenement deelnemen, gebeld belangengroep Er kunnen duizenden of tienduizenden mensen zijn. Zij vormen de bronpopulatie, of populatie, waaruit de socioloog een steekproef construeert en deze interviewt.

De essentie van de steekproefmethode is om aan de hand van de eigenschappen van een deel (steekproef) de numerieke kenmerken van het geheel (algemene populatie) te beoordelen, en aan de hand van individuele groepen elementen - over hun totaliteit, die soms wordt gezien als een verzameling van oneindig veel groot volume. De basis van de steekproefmethode is de interne verbinding die in populaties bestaat tussen het individu en het algemene, het deel en het geheel.

Representatief monster in de sociologie wordt gekeken naar een steekproefpopulatie waarvan de belangrijkste kenmerken volledig samenvallen (vertegenwoordigd in dezelfde verhouding of met dezelfde frequentie) met dezelfde kenmerken van de algemene bevolking. Alleen voor dit type steekproef kunnen de resultaten van een onderzoek van bepaalde eenheden (objecten) worden uitgebreid naar de gehele populatie. Voorwaarde om een ​​representatieve steekproef op te bouwen - de beschikbaarheid van informatie over de algemene bevolking, dat wil zeggen ofwel een volledige lijst van eenheden (onderwerpen) van de algemene bevolking, ofwel informatie over de structuur volgens kenmerken die de houding ten opzichte van het onderzoeksonderwerp aanzienlijk beïnvloeden.

Onder representativiteit In de sociologie begrijpen we de eigenschappen van een steekproef die het mogelijk maken om als model te fungeren, als vertegenwoordiger van de algemene bevolking, op het moment van de enquête. Met andere woorden, representatief monster vertegenwoordigt een accuraat model van de algemene bevolking dat het zou moeten weerspiegelen (op basis van parameters die significant zijn voor het onderzoek). Voor zover een steekproef representatief is, kunnen conclusies op basis van het onderzoek van die steekproef op de gehele populatie worden toegepast.

Vertegenwoordiger Onder een onderzoek wordt verstaan ​​een onderzoek waarbij de afwijking in de steekproefpopulatie voor controlekenmerken niet groter is dan 5%. Bij het uitvoeren van een pilot-enquête onder een kleine populatie (bijvoorbeeld binnen een faculteit van maximaal 100-250 personen), zal een continu onderzoek representatief zijn. Op universitair niveau zal het voldoende zijn om 25% van het totale aantal studenten te ondervragen.

Zodra de socioloog heeft besloten wie hij wil interviewen, bepaalt hij bemonsteringsframe Vervolgens wordt de vraag over het type bemonstering beantwoord.

Bemonsteringstypen De belangrijkste soorten statistische steekproeven worden willekeurig (waarschijnlijkheid) en niet-willekeurig (niet-waarschijnlijkheid) genoemd. Het steekproeftype geeft aan hoe mensen in de steekproefpopulatie zijn opgenomen. steekproefomvang meldt hoeveel van hen daar zijn aangekomen.

Laten we verder gaan met de kenmerken van de meest voorkomende monsters.


Gerelateerde informatie.


Bij de vorming van een steekproefpopulatie wordt een belangrijke rol gespeeld door het volume ervan te bepalen en de representativiteit te waarborgen.

“Als het steekproeftype ons vertelt hoe mensen in de steekproefpopulatie terechtkomen, vertelt de steekproefomvang ons hoeveel van hen daar terecht zijn gekomen.” Dat wil zeggen dat de steekproefgrootte het aantal eenheden is dat deel uitmaakt van de steekproefpopulatie. En het is heel belangrijk dat de steekproef representatief is, dat wil zeggen dat de ideeën over de algemene bevolking als geheel niet worden vertekend. “De vereisten voor representativiteit van de steekproef betekenen dat, volgens de geselecteerde parameters (criteria), de samenstelling van de ondervraagden de overeenkomstige verhoudingen in de algemene bevolking moet benaderen.”

Een van de belangrijkste problemen waarmee een socioloog in de regel wordt geconfronteerd als hij besluit de tijdens zijn onderzoek verkregen gegevens wel of niet te vertrouwen, is hoeveel mensen moeten worden geïnterviewd om echt representatieve informatie te verkrijgen. Helaas bestaat er in de natuur geen enkele en duidelijke formule waarmee je de optimale omvang van de steekproefpopulatie kunt berekenen. En dit wordt heel eenvoudig uitgelegd. Feit is dat het bepalen van de omvang van de steekproefpopulatie niet zozeer een statistisch als wel een inhoudelijk probleem is.

Met andere woorden, de omvang van de steekproef hangt van veel factoren af, waarvan de belangrijkste de volgende zijn:

  • 1. kosten voor het verzamelen van informatie, inclusief tijd;
  • 2. het verlangen naar een zekere statistische betrouwbaarheid van de resultaten, die de onderzoeker hoopt te verkrijgen;
  • 3. de waarde en nieuwheid van de informatie die naar aanleiding van het onderzoek is verkregen.

De steekproefomvang wordt bepaald door de mate van homogeniteit of heterogeniteit van de algemene bevolking, en het aantal kenmerken dat deze karakteriseert. Een populatie wordt als homogeen beschouwd waarin een gecontroleerd kenmerk, bijvoorbeeld het niveau van geletterdheid, gelijkmatig verdeeld is, dat wil zeggen dat er geen leegtes of clusters ontstaan; nadat we slechts een paar mensen hebben geïnterviewd, kunnen we concluderen dat de meerderheid van de bevolking mensen zijn geletterd. Hoe homogener de populatie, hoe kleiner de steekproefomvang. Bijvoorbeeld: “laten we zeggen dat we selecteren uit een populatie van 2000 mensen, waarbij we de samenstelling van de steekproefpopulatie controleren op basis van geslacht”: 70% mannen en 30% vrouwen. Volgens de waarschijnlijkheidstheorie kan worden aangenomen dat er onder ongeveer elke tien geselecteerde respondenten drie vrouwen zullen zijn. Als we minimaal 90 vrouwen willen interviewen, moeten we op basis van bovenstaande verhouding minimaal 300 mensen selecteren. Laten we nu aannemen dat de bevolking voor 90% uit mannen en voor 10% uit vrouwen bestaat. In dit geval is het, om 90 vrouwen in de steekproef op te nemen, noodzakelijk om minstens 900 mensen te selecteren.” Uit het voorbeeld blijkt dat de steekproefomvang afhangt van de spreiding van het attribuut (spreiding) en moet worden berekend op basis van het attribuut waarvan de waardespreiding het grootst is.

“De mate van homogeniteit van een sociaal object hangt in wezen af ​​van hoe gedetailleerd we het willen bestuderen. Bijna elk, zelfs het meest “elementaire” object blijkt uiterst complex te zijn. Alleen in analyse presenteren we het als relatief eenvoudig, waarbij bepaalde eigenschappen ervan worden benadrukt. Hoe grondiger en gedetailleerder de analyse, hoe meer eigenschappen van een bepaald object we in hun combinatie in aanmerking willen nemen, en niet afzonderlijk, hoe groter de steekproefomvang zou moeten zijn.’

In een representatieve steekproef zijn alle elementen van de populatie in dezelfde verhouding vertegenwoordigd. Maar hoe zorgvuldig dit principe ook wordt gevolgd, er zullen nog steeds af en toe fouten voorkomen. We hebben de mogelijkheid om de representativiteitsfout te bepalen. De fout van representativiteit wordt in de regel 'de discrepantie tussen twee populaties genoemd - de algemene bevolking, waarop de theoretische interesse van de socioloog is gericht en een idee van de eigenschappen waarvan hij uiteindelijk wil verkrijgen, en de steekproef, waarop de praktische interesse van de socioloog is gericht, die zowel als onderzoeksobject fungeert als als middel om informatie over een bevolking te verkrijgen. Het is belangrijk om te bedenken dat het met behulp van de steekproefmethode nooit mogelijk is om een ​​absoluut nauwkeurige schatting van het waargenomen kenmerk te verkrijgen; er is altijd een kans op fouten, maar als de kans op fouten klein is, zal deze hoogstwaarschijnlijk niet voorkomen. In de binnenlandse literatuur is er, naast de term 'representativiteitsfout', nog een andere: 'steekproeffout'. Ze worden meestal door elkaar gebruikt, maar het concept van 'steekproeffout' is kwantitatief nauwkeuriger dan 'representativiteitsfout'. De steekproeffout is “de afwijking van de gemiddelde kenmerken van de steekproefpopulatie van de gemiddelde kenmerken van de populatie. In de praktijk wordt het bepaald door bekende kenmerken van de populatie te vergelijken met steekproefgemiddelden.”

De representativiteit van een steekproef wordt bepaald door twee componenten: systematische en willekeurige fouten. Willekeurige fouten worden in verband gebracht “met statistische fouten (afhankelijk van de dynamiek van de onderzochte kenmerken) en onvoorziene schendingen van de procedure voor het verzamelen van informatie (procedurefouten gemaakt tijdens de registratie van kenmerken).” Willekeurige fouten nemen af ​​naarmate de steekproefomvang toeneemt. Willekeurige fouten kunnen worden gemeten met behulp van de methoden van de wiskundige statistiek, als tijdens de vorming van de steekproefpopulatie het principe van willekeur in acht wordt genomen, verzekerd door strikt gedefinieerde regels die de methode vormen voor het vormen van de steekproefpopulatie, en kan worden geëlimineerd.

In de praktijk is het principe van willekeur zeer moeilijk waar te nemen, en soms is het eenvoudigweg onmogelijk, wat leidt tot systematische fouten die ontstaan ​​“als gevolg van de onvolledige objectiviteit van de steekproef van de algemene bevolking (gebrek aan informatie over de algemene bevolking, selectie van de meest “handige” elementen van de algemene bevolking voor onderzoek), en ook vanwege de inconsistentie van de steekproef met de doelstellingen van het onderzoek.” Soms worden dergelijke fouten offsetfouten genoemd. Ze komen voor tijdens verschillende televisiepeilingen, wanneer de tv-presentator kijkers uitnodigt om bepaalde telefoonnummers te bellen, een sms-bericht te sturen en hun mening over een bepaald onderwerp te uiten. Uiteraard kunnen we niet beweren dat deze mensen de mening van de gehele bevolking van het land, en zelfs van het televisiepubliek, weerspiegelen. Hoogstwaarschijnlijk zijn bij dergelijke onderzoeken meer opgeleide en actievere mensen betrokken dan bij de gehele algemene bevolking, zodat elk televisieonderzoek systematische vervormingen bevat en oppervlakkig is.

Maar ook bij een correct georganiseerd onderzoek ontstaan ​​er systematische fouten. Op straat beantwoorden bijvoorbeeld alleen degenen die geen haast hebben de vragen van de interviewer. Vertekening kan worden vermeden door de principes van willekeurige steekproeven te volgen en bijvoorbeeld elke tiende voorbijganger te interviewen.

Redenen voor systematische fouten:

  • 1. “Tijdens het onderzoek was het steekproefkader niet correct samengesteld (er werden verouderde, onvolledige gegevens gebruikt, of er waren geen statistieken over bepaalde kenmerken die belangrijk zijn voor de steekproef),
  • 2. de methode voor het selecteren van observatie-eenheden was slecht gekozen,
  • 3. Sommige respondenten zijn om verschillende redenen ‘afgevallen’ uit de enquête (afwezig, geweigerd te antwoorden), enzovoort.’

Het is onmogelijk om dergelijke fouten met wiskundige middelen te elimineren, dus het is noodzakelijk om een ​​logische analyse uit te voeren van de oorzaken van systematische fouten en maatregelen te ontwikkelen die deze kunnen elimineren. “Het is praktisch onmogelijk om de omvang van bias-fouten te bepalen met behulp van wiskundige formules, zodat deze automatisch worden overgedragen naar de resultaten en conclusies van het onderzoek. Offsetfouten zijn meestal het gevolg van:

  • - onjuiste initiële statistische gegevens over de parameters van controlekenmerken van de algemene bevolking;
  • - te kleine (statistisch onbeduidende) steekproefomvang;
  • - onjuiste toepassing van de methode voor het selecteren van analyse-eenheden (bijvoorbeeld selectie uit een onjuist samengestelde lijst, mislukte keuze van plaats en tijd voor het uitvoeren van de enquête).

Er zijn bepaalde grenzen aan de steekproeffout die afhankelijk zijn van het doel van het onderzoek. Economische en demografische voorspellingen, zoals de volkstelling, vereisen een grotere betrouwbaarheid en nauwkeurigheid. Bij dergelijke prognoses resulteren aanzienlijke fouten in miljoenen verliezen aan materiële hulpbronnen en misrekeningen in prognoses en planning. Maar vaker worden sociologische studies uitgevoerd om algemene trends en algemene oriëntatie op sociaal gebied te begrijpen, waarvoor geen honderd procent betrouwbaarheid vereist is. Er is een ruwe inschatting van de betrouwbaarheid van de onderzoeksresultaten: “een verhoogde betrouwbaarheid zorgt voor een steekproeffout van maximaal 3%. Normaal - tot 3-10%, bij benadering - 10 tot 20%, bij benadering - van 20 tot 40%, en geschat - meer dan 40%.

Er zijn dus verschillende manieren om de fout te voorkomen:

  • § elk element van de algemene bevolking moet dezelfde waarschijnlijkheid hebben om in de steekproefpopulatie te worden opgenomen;
  • § de bevolking is bij voorkeur homogeen;
  • § het is noodzakelijk om informatie te hebben over de structuur van de algemene bevolking en haar karaktereigenschappen;
  • § houd bij het samenstellen van een steekproefpopulatie vooraf rekening met willekeurige en systematische fouten.

Als we bijvoorbeeld, na het interviewen van 380 mensen in een nederzetting waar de totale populatie van oplosmiddelen 10.000 mensen bedraagt, ontdekken dat 36% van de ondervraagde kopers de voorkeur geeft aan binnenlandse producten, dan kunnen we met een waarschijnlijkheidsgraad van 95 procent zeggen dat 46 ± 5% kopen voortdurend binnenlandse producten (dat wil zeggen van 41 tot 51%) van de inwoners van deze nederzetting.

Veel omstandigheden compliceren het probleem van de steekproefberekening en kunnen er vaak toe leiden dat een formeel statistisch representatieve steekproef kwalitatief niet representatief blijkt te zijn.”

De kwaliteit van de steekproef wordt beoordeeld aan de hand van twee indicatoren: representativiteit en betrouwbaarheid. Representativiteit is hierboven al besproken. En om een ​​betrouwbaar monster te maken, is het noodzakelijk om de basis ervan correct te construeren. Om dit te doen, wordt aan de volgende vereisten voldaan:

  • 1. Volledigheid van de steekproef, wat de aanwezigheid van alle elementen van de populatie in het steekproefkader vereist. Als de steekproef niet veel observatie-eenheden bevat, vooral niet de observatie-eenheden die de essentiële kenmerken en kenmerken van het object bevatten, zullen de onderzoeksresultaten onvolledig en eenzijdig zijn.
  • 2. Afwezigheid van duplicatie, wat de ontoelaatbaarheid impliceert van herhaalde opname van dezelfde observatie-eenheid in de steekproef (een student verhuisde bijvoorbeeld naar een andere school om te studeren, hij werd opgenomen in de nieuwe lijst, zonder te worden verwijderd uit de oude lijst, hij werd dus tweemaal in de steekproef opgenomen).
  • 3. Nauwkeurigheid van de steekproefinformatie, wat inhoudt dat niet-bestaande observatie-eenheden worden uitgesloten van het steekproefkader. Op de kieslijsten die worden voorbereid voor de volgende verkiezingen voor gedeputeerden op verschillende niveaus, blijven bijvoorbeeld vaak overleden mensen of bewoners van gesloopte huizen achter.
  • 4. Toereikendheid, wat betekent dat de basis van de geselecteerde steekproef gerelateerd moet zijn aan de oplossing van de doelstellingen die in het onderzoek zijn gesteld. Bijvoorbeeld een volledige lijst van alle leerlingen op een school -- goede basis om een ​​voorbeeld te vormen bij het bestuderen van het probleem van algemene academische prestaties. Maar als we geïnteresseerd zijn in de houding van middelbare scholieren ten opzichte van de belangrijkste academische disciplines, dan kan deze lijst alleen worden gebruikt om te vormen nieuwe basis monsters - een lijst met middelbare scholieren.
  • 5. Gemak van het werken met het steekproefkader, waarin het noodzakelijk is om alle elementen die erin zijn opgenomen duidelijk te nummeren, en de samengestelde lijsten centraal moeten worden opgeslagen.

“Er zijn twee belangrijke benaderingen om de representativiteit van een steekproef te rechtvaardigen:

  • 1. Bij de statistische benadering wordt de representativiteit verzekerd door speciale probabilistische steekproefmethoden. Om onderzoeksresultaten te generaliseren naar de algemene bevolking, worden rigoureuze inductieve statistische gevolgtrekkingsprocedures toegepast en wordt de steekproeffout met een bepaalde waarschijnlijkheid geschat.
  • 2. Niet-statistische rechtvaardiging voor representativiteit houdt theoretisch bewijs in dat de steekproef de populatie goed genoeg vertegenwoordigt. Er is geen statistische schatting van steekproeffouten bij gebruik van deze aanpak.”

Op het eerste gezicht lijkt het simpelweg onmogelijk om de representativiteit van de steekproef in de praktijk te garanderen, maar in feite hangt alles af van de programmadoelen en doelstellingen van het onderzoek.

Als we een onderzoek van grote sociale betekenis uitvoeren, waarvan we na voltooiing conclusies moeten trekken over de hele populatie, dan is het noodzakelijk om strikt alle vereisten van een representatieve steekproefprocedure te volgen, aangezien fouten in dergelijke onderzoeken onaanvaardbaar zijn.

Als we worden geconfronteerd met meer bescheiden taken en het betrouwbaarheidsniveau van de conclusies veilig kan worden verlaagd, dan is het noodzakelijk om aan alle vereisten te voldoen voor een hoogwaardige representatie van de steekproefpopulatie. Als we besluiten de statistische betrouwbaarheid van gegevens te benadrukken, zullen we de mensen misleiden die gewend zijn wiskundige berekeningen te geloven. We mogen niet vergeten dat de informatie die we via enquêtes en andere methoden ontvangen slechts voorwaardelijk wordt vertaald in kwantitatieve indicatoren. En het is niet ongebruikelijk dat kwantitatieve indicatoren slechts bij benadering de essentie van sociale processen weerspiegelen. “Daarom krijgen inspanningen gericht op de nauwkeurigheid van de statistische onderbouwing van de resultaten alleen betekenis onder de voorwaarde van een serieuze kwalitatieve analyse van het probleem en de zinvolle studie ervan.”

Men moet niet vergeten dat de socioloog zijn aandacht precies op de essentie moet richten sociale problemen, betrek andere specialisten, praktijkmensen en theoretici bij het werk, bestudeer zorgvuldig de literatuur op het gebied van economie, psychologie en sociologie over het onderwerp onderzoek. En om statistische problemen met betrekking tot het type en de omvang van de steekproef op te lossen, moet hij eerst duidelijk de specifieke vragen formuleren die moeten worden opgelost, en zich pas daarna wenden tot de overeenkomstige berekeningen van verschillende statistieken.

keer bekeken