Kernel stime di densità Stima forma di una funzione di densità . Una funzione di densità mostra la frequenza con cui una variabile compare in un campione casuale di una popolazione . Il Density Estimation Kernel è considerato un metodo non parametrico . In statistica , ci sono metodi parametrici e non parametrici . Metodi parametrici fanno più assunzioni di quelle non- parametrici . Nessuna ipotesi circa la distribuzione , mezzi , o deviazioni standard sono necessari nelle statistiche non- parametriche . Ad esempio , se si voleva sapere se la decima prova in una classe avrebbe un punteggio superiore a quello dei primi nove mesi , nel ragionamento parametrico si dovrebbe conoscere la media e la deviazione standard per ricavare una risposta. Nel ragionamento non- parametrica , semplicemente conoscendo il numero di test è sufficiente conoscere l'ultimo test ha una probabilità del 10 per cento di essere al di sopra dei punteggi precedenti.
Kernel
la densità di stima kernel ha due componenti fondamentali : il kernel e la larghezza di banda . Il kernel è la funzione di densità . Ci sono sei tipi comuni di funzioni di densità nelle statistiche non - parametriche : normale , uniformi , triangolari , Epanechnikov , quartica , triweight e coseno . Ciascuna di queste funzioni viene utilizzato per stimare la frequenza di una variabile casuale in una popolazione .
Bandwidth
La seconda componente , la larghezza di banda , leviga la derivante dati dalla funzione di densità del kernel . La larghezza di banda , pertanto , ha fortemente impatti la rappresentazione visiva dei dati . Una linea frastagliata può diventare progressivamente lisciata finché i dati sono stati così parafrasato che non è più utile . Nella formula stima della densità Kernel , la larghezza di banda è rappresentata dalla lettera h . Essa deve essere positivo e il risultato in una distribuzione che riassume a uno.
Vantaggi
Kernel Density Estimation ha vantaggi ad altri metodi di stima non parametrici , in particolare istogrammi . Istogrammi rappresentano la distribuzione di una variabile in bidoni lungo un intervallo orizzontale . Contenitori impilati rappresentano una maggiore densità della variabile nel settore dei dati . Perché istogrammi simboleggiano dati tramite cassonetti , la variabile è compartimentato e diverse distribuzioni sono frastagliate e discreto , travisando la distribuzione del fluido di una variabile che esiste realmente in una popolazione . Kernel Density Estimation meglio rappresenta questa fluidità con la linea liscia , la cui morbidezza è determinata dalla larghezza di banda scelto nella formula densità kernel .