Loisirs et Intérêts

Introduction à noyau estimation de la densité

Kernel estimation de la densité est une méthode statistique pour représenter un ensemble de données . Liés à des histogrammes , Kernel estimation de la densité offre un moyen pour estimer la distribution d'une variable dans la population . Le procédé est relativement complexe , mais les résultats d' une interprétation visuelle de densité probable d'une variable , en d'autres termes , la fréquence avec laquelle une variable apparaît dans une population . Utilise

noyau estimations densité d'estimation forme d'une fonction de densité . Une fonction de densité montre la fréquence avec laquelle une variable apparaît dans un échantillon aléatoire d'une population. L' estimation de la densité du noyau est considéré comme une méthode non paramétrique . Dans les statistiques , il existe des méthodes paramétriques et non paramétriques . Méthodes paramétriques font des hypothèses plus que les non - paramétriques . Aucune hypothèse sur la distribution , des moyens , ou les écarts-types sont nécessaires dans les statistiques non paramétriques . Par exemple , si vous voulez savoir si le dixième essai dans une salle de classe aurait un score plus élevé que le premier neuf , dans le raisonnement paramétrique vous auriez à savoir la moyenne et l'écart type pour obtenir une réponse . Dans le raisonnement non - paramétrique , sachant simplement le nombre de test est assez pour savoir la dernière épreuve a une chance d'être au-dessus des scores précédents de 10 pour cent .
Noyau

l' estimation de la densité du noyau comporte deux volets essentiels : le noyau et la bande passante. Le noyau est la fonction de densité . Il existe six types communs de fonctions de densité dans les statistiques non paramétriques : normal, uniformes , triangulaires , Epanechnikov , quartique , triweight et cosinus . Chacune de ces fonctions est utilisée pour estimer la fréquence d'une variable aléatoire dans une population .

Bande passante

Le deuxième volet , la bande passante , de lisser la données résultant de la fonction de densité du noyau. La bande passante a donc impacte fortement la représentation visuelle des données . Une ligne brisée peut devenir progressivement lissée avant que les données a été ainsi paraphrasé qu'il n'est plus utile . Dans la formule du noyau de l'estimation de densité , la largeur de bande est représentée par la lettre h . Il faut être positif et se traduire par une distribution qui résume à un.
Avantages

Kernel estimation de la densité a des avantages à d'autres méthodes d'estimation non paramétriques , notamment des histogrammes . Les histogrammes représentent la distribution d'une variable dans les bacs le long d'une plage horizontale . Bacs empilés représentent une plus grande densité de la variable dans le secteur des données. Parce histogrammes symbolisent données les poubelles , la variable est compartimentée et différentes distributions sont irrégulières et discret , déformer la distribution de fluide d'une variable qui existe réellement dans une population . Kernel estimation de la densité représente mieux cette fluidité avec la ligne lisse , dont la finesse est déterminée par la largeur de bande choisie dans la formule de la densité du noyau .


https://fr.htfbw.com © Loisirs et Intérêts