134. nap: Statisztikai érvelés

Radácsi László
Dec 12, 2025By Radácsi László

Az általánosításnak létezik egy tudományosabbnak tűnő változata, amelynek gyakran bedőlünk: ez a statisztikai érvelés. Annyiban különbözik az egyszerű általánosítástól, hogy itt nemcsak érzésekre hagyatkozunk („sok”, „legtöbb”), hanem konkrét számokat használunk. A módszer lényege, hogy egy adott mintán történt megfigyelést terjesztünk ki a nem megfigyelt esetekre is.

Mivel a számok tekintélyt parancsolnak, hajlamosak vagyunk kritika nélkül elfogadni az ilyen következtetéseket. Pedig a statisztikai általánosítás két sarkalatos pontja – a mintanagyság és a torzítatlan minta – gyakran sérül.

Tegyük fel, hogy egy egyetem vezetői kíváncsiak a hallgatói ügyfélszolgálat minőségére. Készítenek egy kérdőívet, amit a hallgatók 63%-a tölt ki. Az eredmények szerint a válaszadók többsége pozitívan nyilatkozik: 42% nagyon elégedett, 24% elégedett.

Mit állíthatnak ebből jogosan az egyetem vezetői? Azt mondhatják: „A válaszadó hallgatók többsége elégedett.” Ez tény, hiszen a beérkezett adatok ezt mutatják.

De mit nem mondhatnak? Nem jelenthetik ki, hogy „Az egyetem hallgatóinak többsége elégedett.” Miért? Mert a hallgatók 37%-a nem válaszolt. Lehet, hogy ők annyira dühösek, hogy rá se néztek a kérdőívre, vagy teljesen közömbösek. Mivel a minta nem teljes (és nem biztos, hogy reprezentatív), az egész diákságra történő általánosítás kockázatos.

Még nagyobb hiba lenne azt mondani: „Az egyetem polgárai elégedettek.” Az „egyetemi polgárok” csoportjába ugyanis beletartoznak a tanárok, a kutatók és az adminisztratív dolgozók is, akiket meg sem kérdeztek.

A statisztikai érvelésnél tehát a megfogalmazás rendkívül fontos. Egyetlen szócsere („válaszadók” helyett „mindenki”) hamissá teheti az egész következtetést. A számok nem hazudnak, de a belőlük levont hanyag következtetések igen.


🛠️ Pro tippek

1. Keresd a bázist! Ha látsz egy százalékot („az emberek 60%-a”), azonnal keresd meg az apró betűs részt: Kik voltak a megkérdezettek? Hányan voltak? Ha egy samponreklámban „10 nőből 9 ajánlja”, de a mintavétel a gyártó saját irodájában történt, a szünetben összegyűlt pénzügyesek körében, az adat értéktelen és érdektelen.
2. Figyeld a „csendes” tömeget! Egy önkéntes alapú kérdőívnél (pl. internetes szavazás) mindig torz a minta, mert tipikusan csak azok válaszolnak, akiknek erős véleményük van (nagyon szeretik vagy nagyon utálják az adott dolgot). Arról nem is beszélve, hogy egy internetes szavazásnál egy speciális réteg véleménye rögtön eltűnik: azok, akiknek nincs internet hozzáférése. Az átlagember véleménye gyakran láthatatlan marad.
3. Vigyázz a kategóriákkal! Ha a kutatás „budapesti fiatalokról” szól, a konklúzió nem szólhat a „magyar lakosságról”. Figyeld meg, hol történik ugrás a csoportok megnevezésében (pl. „válaszadók” -> „hallgatók” -> „egyetemi polgárok”).