Obsah:

Ako sa vysporiadate s hodnotami NA v R?
Ako sa vysporiadate s hodnotami NA v R?

Video: Ako sa vysporiadate s hodnotami NA v R?

Video: Ako sa vysporiadate s hodnotami NA v R?
Video: Lady Gaga - Bad Romance (Official Music Video) 2024, November
Anonim

Keď importujete množinu údajov z iných štatistických aplikácií, chýbajúce hodnoty môže byť zakódované číslom, napríklad 99. S cieľom nechať R ved to je a chýbajúca hodnota musíte to prekódovať. Ďalšia užitočná funkcia v R do vysporiadať sa s chýbajúcimi hodnotami je na . vynechať (), ktoré odstránia neúplné pozorovania.

Len tak, ako sa vysporiadate s NA v R?

Možnosti NA v R

  1. vynechať a na. vylúčiť: vráti objekt s odstránenými pozorovaniami, ak obsahujú nejaké chýbajúce hodnoty; rozdiely medzi vynechaním a vylúčením NA možno vidieť v niektorých predikčných a reziduálnych funkciách.
  2. pass: vráti objekt nezmenený.
  3. fail: vráti objekt, iba ak neobsahuje žiadne chýbajúce hodnoty.

Podobne, ako riešite chýbajúce kategorické údaje v R? Existujú rôzne spôsoby, ako zvládnuť chýbajúce hodnoty kategorických spôsobov.

  1. Ignorujte pozorovania chýbajúcich hodnôt, ak máme do činenia s veľkými súbormi údajov a menší počet záznamov obsahuje chýbajúce hodnoty.
  2. Ignorujte premennú, ak nie je významná.
  3. Vytvorte model na predpovedanie chýbajúcich hodnôt.
  4. K chýbajúcim údajom pristupujte ako k inej kategórii.

Podobne sa možno pýtať, ako nastavíte chýbajúce hodnoty v R?

In R , chýbajúce hodnoty sú reprezentované symbolom NA (nie je k dispozícií). nemožné hodnoty (napr. delenie nulou) sú reprezentované symbolom NaN (nie číslom). Na rozdiel od SAS, R používa rovnaký symbol pre znak a číslicu údajov . Pre viac praxe pri práci s chýbajúce údaje , vyskúšajte tento kurz upratovania údaje v R.

Čo znamená Na Rm v R?

Pri použití funkcie dátového rámca na . rm v r odkazuje na logický parameter, ktorý hovorí funkcii, či sa má alebo nemá odstrániť NA hodnoty z výpočtu. To doslova znamená NA odstrániť. Nie je to funkcia ani operácia. Je to jednoducho parameter používaný niekoľkými funkciami dátového rámca.

Odporúča: