Ako klamať so štatistikou?

Aby ste klamali so štatistikami, skúste pri výpočte priemeru niečoho použiť na zmenu výsledkov abnormálne vysoké alebo nízke čísla. Ak má napríklad 9 ľudí 750€ a pri desiatej osobe máte iba 0,70€, priemerná suma, ktorú má každý v skupine, je 670€, aj keď takmer každý má viac. Štatistiky môžu tiež klamať pomocou malého súboru údajov. Ak napríklad urobíte prieskum na 10000 ľuďoch, vaše výsledky budú pravdepodobne presné, ale ak budete skúmať iba 5 ľudí, vaše výsledky budú pravdepodobne vypnuté. Ak sa chcete dozvedieť, ako klamať pomocou štatistickej grafiky, posuňte sa nadol!

Stredný priemer je číslo v súbore údajov
Stredný priemer je číslo v súbore údajov, ktoré leží v strede medzi nižšími a vyššími číslami.

Ako každý, kto má cit pre detail, vie, že štatistiky môžu byť veľmi klzké, bez znalosti toho, ako ich interpretovať. Prečítajte si nižšie uvedené kroky, aby ste sa dozvedeli, ako pochopiť zložité a zavádzajúce štatistiky a využiť tieto znalosti vo svoj prospech.

Metóda 1 z 3: Klamanie s priemermi

  1. 1
    Rozumieť terminológii. Slovo „priemer“ sa pri diskusii o štatistických údajoch používa veľmi často. Na prvý pohľad znie tento výraz dostatočne jednoducho: priemer je množstvo, ktoré spadá zhruba do stredu. V skutočnosti však existuje niekoľko rôznych typov priemerov, ktoré môžu byť všetky zavádzajúce, ak nie sú správne pochopené.
    • Priemerný Priemerný je dosiahnutý sčítaním všetkých čísel v súbore dát a ich vydelením počtom záznamov v sade. Inými slovami, ak máte čísla 3, 3, 5, 4 a 7, priemerný priemer môžete dosiahnuť ich súčtom (aby ste získali 22) a potom súčet vydelili 5 (pretože v zozname je 5 čísel) sada).
      • V tomto prípade je priemerný priemer 4,4.
    • Medián priemernej je číslo v súbore dát, ktorá spadá uprostred medzi nižšími číslami a vyššími číslami. Pri použití rovnakých údajov ako predtým (3, 3, 5, 4 a 7) je stredný priemer 4, pretože 2 z čísel sú nižšie a 2 sú väčšie.
    • Režim priemeru je reprezentácia Medzi najčastejšie čísla v dátovom súbore. Použitím nášho príkladu je priemer režimu 3, pretože sa zobrazuje dvakrát.
  2. 2
    Klamte so strednými priemermi. Priemerný priemer sa môže zdať najspoľahlivejší zo všetkých vyššie popísaných metód, ale v skutočnosti to tak nie je. Dôvodom je, že abnormálne vysoké alebo nízke čísla v súbore údajov môžu výrazne ovplyvniť priemer. Aby ste klamali so stredným priemerom, zozbierajte odľahlé údaje a použite ich vo svojej rovnici.
    • Predstavte si napríklad, že by ste zisťovali príjem 50 domácností v susedstve. Väčšina domácností zarobí 29900 až 44800€ ročne, ale jedna domácnosť zarobí 3,70 milióna eur ročne. Keď vypočítate priemerný priemer, číslo bude výrazne vyššie ako „skutočný“ priemerný príjem v tejto oblasti, pretože číslo 3,70 milióna eur je oveľa väčšie ako ostatné.
    • Podobným spôsobom, ak by ste mali údaje, ktoré ukazujú, že 9 ľudí malo na bankových účtoch 750€, ale desiata osoba mala iba 0,70€, priemerný priemer by vyšiel na 670€ - takmer o 10% menej ako väčšina bežná čiastka.
    • Renomované prieskumy často vyhodnocujú najvyššie a najnižšie čísla pred vypočítaním priemerného priemeru. Nie každý prieskum, ktorý vidíte v správach, má však dobrú povesť. Pokiaľ nemáte buď prístup k celému súboru údajov sami, alebo neuvidíte písomné uistenie, že mimoriadne hodnoty boli odstránené, je bezpečnejšie predpokladať, že neboli.
  3. 3
    Klamte so strednými priemermi. Stredný priemer je v skutočnosti najťažšie číslo, s ktorým sa dá „klamať“, pretože v porovnaní s väčšinou súborov údajov nemôže byť nikdy príliš vysoké ani príliš nízke. Musí nevyhnutne ležať v strede. Stredný priemer však môžete použiť na skrytie veľmi veľkého alebo malého čísla. Ak je napríklad váš súbor údajov 1, 1, 2, 3, 4, 5, 3000, priemerný priemer je 3.
    • Keď máte rovnomerný počet záznamov, môžete dosiahnuť stredný priemer tak, že nájdete priemer dvoch záznamov v strede. To stále neznamená extrémne hodnoty.
    • Dávajte si pozor na priemerné priemery, ktoré sa používajú na opis zmien v priebehu času. Spoločnosť, ktorá každoročne zvyšuje ceny svojich služieb o 3%, by ich mohla tento rok zvýšiť o 20% a skryť to prezentovaním mediánu priemeru 3% za posledných 9 rokov.
    Priemer režimu je reprezentáciou najbežnejšieho čísla v súbore údajov
    Priemer režimu je reprezentáciou najbežnejšieho čísla v súbore údajov.
  4. 4
    Klamte s priemermi režimu. V niektorých veciach je priemer režimov takmer nemožné - napríklad priemerný počet lístkov zakúpených na osobu na loptovú hru sa v režime takmer vždy presne odrazí. Priemerné režimy však môžu tiež vylúčiť dôležité údaje, najmä v menších množinách údajov.
    • Ak máte napríklad množinu údajov všetkých čísel v rozsahu od 1 do 100, ale číslo 1 je zahrnuté trikrát, 1 bude priemer režimu množiny, aj keď priemer (a v tomto prípade rozumnejší) priemer je oveľa bližší k 50.
    • Akýkoľvek prieskum, ktorý hodnotí v širokom meradle, je možné manipulovať, aby sa zdôraznil režim. Ak urobíte prieskum na 100 ľuďoch na stupnici od 1 do 10 o ich pocitoch z predmetu a viac ľudí ho ohodnotí „10“ ako akékoľvek iné číslo, potom aj keď iba jeden ďalší človek dá hodnotenie 10 ako ohodnotí 1, 10 je priemer režimu.
  5. 5
    Lež s reprezentačnými číslami. Ak máte množinu údajov, ktorá je definovaná abstraktnými, a nie konkrétnymi číslami (napríklad prieskum spokojnosti zákazníkov), je takmer desivé ľahko s touto sadou klamať. Ak požiadate ľudí, aby ohodnotili svoju spokojnosť na stupnici od 1 do 3, nemusí to znamenať, že zákazníci, ktorí si vybrali 3, sú trikrát šťastnejší ako tí, ktorí vybrali 1. Táto skutočnosť sa používa najmä na skreslenie priemerov, ale môže byť tiež aplikovaný na stredné a niekedy dokonca priemerné priemery.

Metóda 2 z 3: Ležanie s množinami údajov

  1. 1
    Použite malú sadu. Každý dobrý štatistik vie, že jediný spôsob, ako sa priblížiť k užitočnému priemeru alebo odhaliť skutočný trend, je zhromaždiť údaje z čo najširšieho súboru. Ak môžete získať informácie od 100 ľudí, je to dobré; 10000 je ešte lepšie. Čím viac informácií vložíte do svojej množiny údajov, tým je väčšia pravdepodobnosť, že skončia s presnými priemermi. Použitím sady povedzme 3 alebo 5 údajov môžete dosiahnuť výsledky, ktoré presne neodrážajú stav vecí.
    • Ak napríklad nájdete dvoch ľudí, ktorí sa nedávno zranili niečím hlúpym - napríklad ako vankúš - a použijete ich ako celý svoj súbor údajov, môžete argumentovať tým, že vankúše sú kategoricky nebezpečné pre každého. Bez ohľadu na to, aké priemery sa rozhodnete zobrazovať, pokiaľ neodhalíte veľkosť vzorky iba dvoch ľudí, neexistuje jasný spôsob, ako vyvrátiť vaše tvrdenie.
  2. 2
    Použite kontrolovanú sadu. Najpresnejšie súbory údajov sú nielen veľké, ale aj široké. Geologička, ktorá skúma druhy minerálov v púšti, bude mať presnejší zoznam, ak zozbiera veľa vzoriek z každej časti púšte, a nie 1000 vzoriek z rovnakého miesta. Obmedzením rozsahu súboru údajov môžete výrazne ovplyvniť výsledky.
    • Niekedy je to užitočné a urobené účelovo. Ľudia, ktorí napríklad skúmajú pomocou demografických údajov, by sa mohli chcieť dozvedieť konkrétne o typoch zamestnaní, ktoré muži zvyčajne zastávajú, a preto budú skúmať iba mužov. Pokiaľ je to v údajoch jasne uvedené, nie je na tom nič tienisté.
    • Najmä údaje z malých vysokoškolských výskumných projektov majú tendenciu byť zneužité na porovnanie kontrolovaného súboru údajov so všeobecným výsledkom. Dôvodom je, že mnohé výskumné projekty na úrovni vysokých škôl nemajú čas ani zdroje na použitie širokej náhodnej vzorky priemerných občanov a namiesto toho sa spoliehajú iba na vysokoškolských študentov. Opäť je to v poriadku, pokiaľ sú tieto informácie jasne uvedené, ale spravodajské organizácie, ktoré hľadajú senzačné titulky, často zakryli detaily malého vysokoškolského štúdia, aby vyzerali oveľa zamotanejšie.
  3. 3
    Použite nevyváženú sadu. Táto technika je obzvlášť mazaná, pretože môže klamať aj vtedy, keď má divák k dispozícii veľa podrobností. Ide o to, použiť údaje, ktoré sa nedajú spravodlivo porovnať, a zaobchádzať s nimi, akoby boli na rovnakej úrovni. Ak máte napríklad 100000 mesto, ktoré za 10 rokov získalo 10000 obyvateľov, a porovnáte ho s mestom s 10 obyvateľmi, ktoré za posledných 10 rokov získalo ďalších 10 obyvateľov, percentuálne podiely každého zisku ukazujú, že malé mesto rástlo oveľa rýchlejšie.
    • Niekedy to používajú ľudia, ktorí analyzujú trhové údaje na predloženie zavádzajúceho obrazu o tržbách. Povedzme, že sledujete predaj jabĺk a pomarančov, ale v polovici štúdie nezostali žiadne pomaranče, pretože je ich nedostatok. Ak budete pokračovať v porovnávaní údajov po zvyšok štúdie, v porovnaní s predajom pomarančov dôjde k obrovskému nárastu predaja jabĺk, aj keď jablká zrazu zrejme neboli populárnejšie.
Priemerný priemer sa dosiahne sčítaním všetkých čísel v súbore údajov
Priemerný priemer sa dosiahne sčítaním všetkých čísel v súbore údajov a ich vydelením počtom záznamov v sade.

Metóda 3 z 3: Ležanie s grafikou

  1. 1
    Nechajte os y prázdnu. Nič neposkytuje jasnejší obraz o dátach ako graf alebo tabuľka, ale aj s nimi sa dá jemne manipulovať, aby poskytli rôzne efekty. Dôvodom je, že ľudia majú tendenciu pozrieť sa na tvary a veľkosti v grafoch, než sa začnú obťažovať kontrolou číselných špecifík, ktoré sú s nimi spojené. Najjednoduchším spôsobom manipulácie s osou y je jednoducho ju neoznačiť.
    • Ak máte na osi x sadu 5 pruhov, ale žiadny indikátor ich vzájomnej výšky, neexistuje spôsob, ako zistiť, či medzi nimi existuje nejaký skutočný významný rozdiel.
  2. 2
    Na osi y používajte veľmi veľké alebo malé čísla. Povedzme, že sa váš súbor údajov pohybuje v rozmedzí od 1 do 50. Ak chcete rozdiely skryť, zmerajte os y v krokoch po 100; aby ste ich zvýraznili nespravodlivo, zmerajte os y v krokoch po desiate. Rozdiel medzi 3 a 10 vyzerá obrovský, keď sa meria v desatinách (je vzdialený 70 jednotiek!), Ale je sotva dokonca viditeľný na grafe, kde 100 je prvý prírastok (je to oveľa, oveľa menej ako 1 jednotka od seba!).
  3. 3
    Začnite s osou y uprostred rozsahu. Ak sa vaše údaje pohybujú v rozmedzí od 11 do 51, môžete najnižšie číslo ešte znížiť a najvyššie ešte zvýrazniť tak, že os y označíte tak, že sa začína na 10. Tým sa pruh predstavujúci 11 stane sotva vyšším ako os x. Bude to vyzerať takmer ako nič, pokiaľ nie je niekto dostatočne zdatný, aby sa skutočne pozrel pozorne a zistil, že graf bol spustený z 10 namiesto 0.
    • Stĺpec predstavujúci 51 sa v takom grafe stane 50 -krát vyšší ako prúžok predstavujúci 11, pretože menší prút je vysoký iba 1 jednotku. Ak by graf začínal na 0, pruh predstavujúci 51 by bol menší ako 5 -násobok výšky stĺpca predstavujúceho 11.
  4. 4
    Použite nesprávne škálovanie. Kedykoľvek vidíte slová "nie je v mierke" v drobným písmom, je pravdepodobné, ste naraziť príklad tohto. Nie vždy sa to robí zlomyseľne; niekedy sú príslušné čísla tak výrazne odlišné, že neexistuje spôsob, ako ich presne znázorniť na tej istej stránke. Môže sa však ľahko použiť na nechutné účely.
    • Vizuálnu reprezentáciu veľkosti je možné nakresliť napríklad na mierku výšky, ale nie na šírku, takže vyšší predmet (napríklad budova) sa tiež zdá byť oveľa tenší alebo širší, ako v skutočnosti je.
  5. 5
    Na vynechanie údajov použite grafiku. Bežne sa to prejavuje v rozsiahlych prieskumoch, ktoré rozdeľujú výsledky podľa určitých kategórií, ako je napríklad slávny graf, ktorý ukazuje, ktorý výraz pre sýtený nápoj je v ktorom regióne v celej Európe najpopulárnejší. Na prvý pohľad sa tieto informácie zdajú veľmi podrobné, ale čoskoro vyvstanú otázky: aké široké sú údaje z prieskumu? Aký je prah na určenie výsledku? Je použitý priemer, medián alebo priemerný priemer?
    • Ak by ste použili iba jeden výsledok z každej oblasti, ktorú ste skúmali, a vyhodili všetky ostatné, výsledky by ste mohli ľahko ovládať podľa oblasti bez toho, aby ste niekedy prezradili, že veľkosť vzorky na oblasť je malá. Opäť je to kvôli nedostatku konkrétnych informácií, ktoré robia výsledky tak ťažko kvantifikovateľnými.
Skúste pri výpočte priemeru niečoho použiť na zmenu výsledkov abnormálne vysoké alebo nízke čísla
Aby ste klamali so štatistikami, skúste pri výpočte priemeru niečoho použiť na zmenu výsledkov abnormálne vysoké alebo nízke čísla.

Tipy

  • Ak máte pochybnosti, overte si to. Ak nemôžete získať podrobné a úplné informácie o veľkosti, rozsahu a metódach vzorkovania za štatistikou, neverte jej.

Varovania

  • Je celkom ľahké klamať so štatistikou, keď viete, ako to urobiť, ale nie je to úplne etické. Dávajte si pozor, ako využijete získané znalosti. Nepoužívajte ho na to, aby ste niekoho zranili, podviedli alebo odcudzili.
Súvisiace články
  1. Ako spoznať nových ľudí?
  2. Ako zmeniť RSVP z Áno na Nie?
  3. Ako byť hrdinom v reálnom živote?
  4. Ako overiť niekoho pocity?
  5. Ako hovoriť s cudzími ľuďmi?
  6. Ako osloviť manželský homosexuálny pár s rovnakým priezviskom?
FacebookTwitterInstagramPinterestLinkedInGoogle+YoutubeRedditDribbbleBehanceGithubCodePenWhatsappEmail