Comment faire pour supprimer les valeurs aberrantes dans spss

Contenu

Exploratoire anaylsis de données
Analyse de régression
Conseils avertissements

article data-type="article">

Outliers sont des valeurs extrêmes qui peuvent fausser les résultats d`une analyse statistique et de créer des conclusions inexactes.

Outliers dans les analyses statistiques sont les valeurs extrêmes qui ne semblent pas correspondre à la majorité d`un ensemble de données. Si pas supprimé, ces valeurs extrêmes peuvent avoir un effet important sur les conclusions qui pourraient être tirées des données en question, car ils peuvent fausser les coefficients de corrélation et les lignes de meilleur ajustement dans la mauvaise direction. SPSS est l`un d`un certain nombre de programmes statistiques de logiciels d`analyse qui peuvent être utilisés pour interpréter un ensemble de données et d`identifier et de supprimer les valeurs aberrantes.

Exploratoire Anaylsis de données

Cliquez sur "Analyser". Sélectionnez "Statistiques descriptives" puis "Explorer".
Glissez et déposez les colonnes contenant les données variables dépendantes dans la case "Liste dépendante." Cliquez sur "OK".
Supprimez toutes les valeurs aberrantes identifiées par SPSS dans les parcelles à tiges et à feuilles ou boîte parcelles en supprimant les points de données individuels. Alternativement, vous pouvez configurer un filtre pour exclure ces points de données.
Sélectionnez "Data" puis "Select Cases" et cliquez sur une condition qui a des valeurs aberrantes que vous souhaitez exclure. Déterminer une valeur pour cette condition qui exclut seulement les valeurs aberrantes et aucun des points de données non-périphériques.
Choisissez "Si condition est satisfaite» dans la case «Sélectionner» puis cliquez sur le bouton "Si" juste en dessous. Entrez la règle pour exclure les valeurs aberrantes que vous avez déterminé à l`étape précédente dans la zone en haut à droite. Par exemple, si vous excluez les mesures ci-dessus 74,5 pouces de la condition "hauteur", vous devez entrer "hauteur < = 74.5." Click "Continue" and "OK" to activate the filter.

Analyse de régression

Dans le menu "Analyser", sélectionnez "Régression" et "linéaire". Sélectionnez les variables dépendantes et indépendantes que vous souhaitez analyser.
Cliquez sur "Enregistrer" puis sélectionnez "la distance de Cook." Les valeurs calculées pour la distance de Cook seront sauvegardés dans votre fichier de données en tant que variables marquées "COO-1."
Exécuter un boxplot en sélectionnant "Graphiques" suivi de "Boxplot." Cliquez sur "Simple" et sélectionnez "Résumés des variables distinctes." Entrez "COO-1" dans la case "cases représentent," et entrez un ID ou le nom permettant d`identifier les cas dans les «cas d`étiquetage par" boîte.
Agrandir le boxplot dans le fichier de sortie en double-cliquant dessus. Prenez note des cas qui se situent au-delà des lignes noires --- ce sont vos valeurs aberrantes. Vous pouvez choisir de supprimer toutes les valeurs aberrantes ou seulement les valeurs extrêmes, qui sont marqués par un astérisque (*).
Retournez dans le fichier de données et de localiser les cas qui doivent être effacées. Travailler de bas en haut, mettez en surbrillance le numéro à l`extrême gauche, dans la colonne grise, de sorte que la totalité de la ligne est sélectionnée. Cliquez sur "Modifier" et sélectionnez "Effacer". Répétez cette étape pour chaque valeur aberrante que vous avez identifié à partir de la boîte à moustaches.

Conseils Avertissements

Lors de l`effacement des cas dans la section 2, étape 5, toujours travailler à partir du bas du fichier de données en mouvement parce que les numéros d`identification changent lorsque vous effacez un cas. Si vous travaillez à partir du haut vers le bas, vous finirez par effacer les mauvais cas.