Obsah:

Aké sú odľahlé hodnoty pri analýze údajov?
Aké sú odľahlé hodnoty pri analýze údajov?

Video: Aké sú odľahlé hodnoty pri analýze údajov?

Video: Aké sú odľahlé hodnoty pri analýze údajov?
Video: Полный курс React Query за час | TanStack Query v4 для начинающих 2024, November
Anonim

V štatistike an odľahlé je a údajov bod, ktorý sa výrazne líši od iných pozorovaní. An odľahlé môže to byť spôsobené variabilitou merania alebo môže naznačovať experimentálnu chybu; posledne menované sú niekedy vylúčené z údajov nastaviť. An odľahlý môže spôsobiť vážne problémy štatistické analýzy.

Vzhľadom na to, ako zistíte odľahlé hodnoty v údajoch?

Bod, ktorý spadá mimo údajov vnútorné oplotenie súboru je klasifikované ako malé odľahlé , zatiaľ čo ten, ktorý spadá mimo vonkajších plotov, je klasifikovaný ako hlavný odľahlý . Ak chcete nájsť vnútorné ploty pre vaše údajov najprv vynásobte medzikvartilový rozsah číslom 1,5. Potom pridajte výsledok k Q3 a odčítajte ho od Q1.

Okrem vyššie uvedeného, mám zo svojich údajov odstrániť odľahlé hodnoty? Pre a väčšina, ak vaše údaje si týmito extrémnymi prípadmi ovplyvnený, ty môcť viazaný a vstup pre historického predstaviteľa vaše údaje to vylučuje odľahlé hodnoty . Určte od prípadu k prípadu čo a účinok odľahlé hodnoty bol. A odtiaľ sa rozhodnite, či chcete odstrániť , zmeniť alebo ponechať krajný hodnoty.

V súvislosti s tým, ako sa analýza údajov vysporiada s odľahlými hodnotami?

Tu sú štyri prístupy:

  1. Zrušte odľahlé záznamy. V prípade Billa Gatesa alebo inej skutočne odľahlej hodnoty je niekedy najlepšie tento záznam úplne odstrániť zo súboru údajov, aby daná osoba alebo udalosť neskreslila vašu analýzu.
  2. Obmedzte svoje odľahlé údaje.
  3. Priraďte novú hodnotu.
  4. Skúste premenu.

Aký je príklad odľahlej hodnoty?

Odľahlý . more Hodnota, ktorá "leží mimo" (izmut menšia alebo väčšia ako) väčšina ostatných hodnôt v množine údajov. Pre príklad v skóre 25, 29, 3, 32, 85, 33, 27, 28 sú obe 3 a 85 " odľahlé hodnoty ".

Odporúča: