Jádrové odhady regresní funkce pro korelovaná data

Similar documents
Jádrové odhady gradientu regresní funkce

Computation of Information Value for Credit Scoring Models

Local Polynomial Regression

Nonparametric Regression with Correlated Errors

Econ 582 Nonparametric Regression

Segmentace textury. Jan Kybic

Estimation of cumulative distribution function with spline functions

Introduction. Linear Regression. coefficient estimates for the wage equation: E(Y X) = X 1 β X d β d = X β

Additive Isotonic Regression

Bayesian estimation of bandwidths for a nonparametric regression model with a flexible error density

Quantitative Economics for the Evaluation of the European Policy. Dipartimento di Economia e Management

Error distribution function for parametrically truncated and censored data

O Combining cross-validation and plug-in methods - for kernel density bandwidth selection O

Introduction to Nonparametric Regression

Wavelet Regression Estimation in Longitudinal Data Analysis

A Note on Data-Adaptive Bandwidth Selection for Sequential Kernel Smoothers

A tour of kernel smoothing

PREWHITENING-BASED ESTIMATION IN PARTIAL LINEAR REGRESSION MODELS: A COMPARATIVE STUDY

4 Nonparametric Regression

University, Tempe, Arizona, USA b Department of Mathematics and Statistics, University of New. Mexico, Albuquerque, New Mexico, USA

Empirical likelihood and self-weighting approach for hypothesis testing of infinite variance processes and its applications

Bandwidth selection for kernel conditional density

Nonparametric Regression of Presidential Approval Rating with Correlated Observations

arxiv: v1 [stat.me] 28 Jun 2007

Density estimation Nonparametric conditional mean estimation Semiparametric conditional mean estimation. Nonparametrics. Gabriel Montes-Rojas

Nonparametric Regression Härdle, Müller, Sperlich, Werwarz, 1995, Nonparametric and Semiparametric Models, An Introduction

Modelling Non-linear and Non-stationary Time Series

Nonparametric Inference via Bootstrapping the Debiased Estimator

DavidAllanBurt. Dissertation submitted to the Faculty of the. Virginia Polytechnic Institute and State University

Optimal Estimation of Derivatives in Nonparametric Regression

Local Polynomial Modelling and Its Applications

Robust Nonparametric Estimation of the Intensity Function of Point Data

SIMULTANEOUS CONFIDENCE BANDS AND HYPOTHESIS TESTING FOR SINGLE-INDEX MODELS

Local linear multiple regression with variable. bandwidth in the presence of heteroscedasticity

df=degrees of freedom = n - 1

Nonparametric Methods

BOUNDARY KERNELS FOR DISTRIBUTION FUNCTION ESTIMATION

arxiv: v2 [math.st] 16 Oct 2013

Plot of λ(x) against x x. SiZer map based on local likelihood (n=500) x

DEPARTMENT MATHEMATIK ARBEITSBEREICH MATHEMATISCHE STATISTIK UND STOCHASTISCHE PROZESSE

On the use of Nonparametric Regression in Assessing Parametric Regression Models

ECON 721: Lecture Notes on Nonparametric Density and Regression Estimation. Petra E. Todd

OFFICE OF NAVAL RESEARCH FINAL REPORT for TASK NO. NR PRINCIPAL INVESTIGATORS: Jeffrey D. Hart Thomas E. Wehrly

Local Adaptive Smoothing in Kernel Regression Estimation

The choice of weights in kernel regression estimation

Updating on the Kernel Density Estimation for Compositional Data

Integral approximation by kernel smoothing

Zudi Lu, Dag Tjøstheim and Qiwei Yao Spatial smoothing, Nugget effect and infill asymptotics

Smooth functions and local extreme values

Beyond Curve Fitting? Comment on Liu, Mayer-Kress and Newell.

Difference-based Variance Estimation in Nonparametric Regression with Repeated Measurement Data

Časopis pro pěstování matematiky a fysiky

arxiv: v5 [stat.me] 12 Jul 2016

3 Nonparametric Density Estimation

OPTIMAL POINTWISE ADAPTIVE METHODS IN NONPARAMETRIC ESTIMATION 1

A Monte Carlo Investigation of Smoothing Methods. for Error Density Estimation in Functional Data. Analysis with an Illustrative Application to a

By 3DYHOýtåHN, Wolfgang Härdle

41903: Introduction to Nonparametrics

Kernel Density Estimation

Appendix. Title. Petr Lachout MFF UK, ÚTIA AV ČR

UNIVERSITÄT POTSDAM Institut für Mathematik

Generated Covariates in Nonparametric Estimation: A Short Review.

Working Paper Series

Robust Nonparametric Smoothing of Nonstationary Time-Series

The Pennsylvania State University VARYING-COEFFICIENT MODELS: NEW MODELS, INFERENCE PROCEDURES AND APPLICATIONS

Causal Inference Basics

USING A BIMODAL KERNEL FOR A NONPARAMETRIC REGRESSION SPECIFICATION TEST

Nonparametric Function Estimation with Infinite-Order Kernels

arxiv: v2 [stat.me] 12 Sep 2017

Uniform confidence bands for kernel regression estimates with dependent data IN MEMORY OF F. MARMOL

Convergence rates for uniform confidence intervals based on local polynomial regression estimators

Nonparametric Regression. Badr Missaoui

CONSISTENCY OF CROSS VALIDATION FOR COMPARING REGRESSION PROCEDURES. By Yuhong Yang University of Minnesota

An Asymptotic Study of Variable Bandwidth Selection for Local Polynomial Regression with Application to Density Estimation

Alternatives to Basis Expansions. Kernels in Density Estimation. Kernels and Bandwidth. Idea Behind Kernel Methods

Bootstrap metody II Kernelové Odhady Hustot

Uncertainty Quantification for Inverse Problems. November 7, 2011

ESTIMATORS IN THE CONTEXT OF ACTUARIAL LOSS MODEL A COMPARISON OF TWO NONPARAMETRIC DENSITY MENGJUE TANG A THESIS MATHEMATICS AND STATISTICS

Nonparametric Statistics

Simple Linear Regression

Additive Models: Extensions and Related Models.

Asymptotically Optimal Regression Trees

Maximum Smoothed Likelihood for Multivariate Nonparametric Mixtures

On the Choice of Difference Sequence in a Unified Framework for Variance Estimation in Nonparametric Regression

Statistica Sinica Preprint No: SS

when we observe high-frequency data with microstructure noise over a long time

Single Index Quantile Regression for Heteroscedastic Data

Goodness-of-fit tests for the cure rate in a mixture cure model

Bickel Rosenblatt test

Nonparametric Regression

NADARAYA WATSON ESTIMATE JAN 10, 2006: version 2. Y ik ( x i

Sparse Nonparametric Density Estimation in High Dimensions Using the Rodeo

Kernel density estimation

Optimal Ridge Detection using Coverage Risk

Acceleration of some empirical means. Application to semiparametric regression

A New Test in Parametric Linear Models with Nonparametric Autoregressive Errors

Statistical inference on Lévy processes

Lecture Notes 15 Prediction Chapters 13, 22, 20.4.

Data-Based Choice of Histogram Bin Width. M. P. Wand. Australian Graduate School of Management. University of New South Wales.

Function of Longitudinal Data

Transcription:

Jádrové odhady regresní funkce pro korelovaná data Ústav matematiky a statistiky MÚ Brno Finanční matematika v praxi III., Podlesí 3.9.-4.9. 2013

Obsah Motivace Motivace

Motivace Co se snažíme získat?

Motivace Co se snažíme získat?

Regresní model Motivace Standardní regresní model Y i =m(x i )+ε i, i = 1,..., n, kde m - neznámá regresní funkce Y i - měřená data x i - body, ve kterých se provádí měření ε i - chyby

Jádro Motivace Co je to jádro?

Jádro Motivace Co je to jádro? Jádro K je reálná funkce splňující podmínky: K Lip[ 1, 1], K( 1) = K(1) = 0 support(k) = [ 1, 1] 1 j = 0 1 1 x j K(x)dx = 0 j = 1 β 2 0 j = 2

Epanečnikovo jádro 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 2 1.5 1 0.5 0 0.5 1 1.5 2

Jak se používá?

Jak se používá? Nadaraya-Watsonův odhad regresní funkce m(x, h) = n i=1 j=1 K h (x i x) Y n i, K h (x j x) kde K h (.) = 1 h K ( ḣ ) h - vyhlazovací parametr

Vyhlazovací parametr Co se stane, když ho zvoĺıme špatně?

Vyhlazovací parametr Co se stane, když ho zvoĺıme špatně?

Jaká je optimální hodnota?

Jaká je optimální hodnota?

Jaká je optimální hodnota? ( σ 2 1 1 h opt = K 2 ) (x)dx 1/5 1 nβ2 2A, A 2 = m (x) 2 dx 2 0

Krosvalidační metoda Jak zvolit správné h?

Krosvalidační metoda Jak zvolit správné h? CV (h) = 1 n n ( ) 2 m j (x j, h) Y j min, j=1 kde m j (x j, h) je odhad m(x j, h), kde je x j smazáno

Regresní model s korelovanými chybami Jak se náš model změní?

Regresní model s korelovanými chybami Jak se náš model změní? Y i =m(x i )+ε i, i = 1,..., n, kde ε i - neznámý kauzální ARMA proces, neboli E(ε i ) = 0, var(ε i ) = σ 2 cov(ε i, ε j ) = γ i j = σ 2 ρ i j, corr(ε i, ε j ) = ρ i j

Proč prostě nepoužijeme předchozí metodu?

Proč prostě nepoužijeme předchozí metodu?

Plug-in přístup Motivace Můžeme nějak využít optimální hodnotu h?

Plug-in přístup Motivace Můžeme nějak využít optimální hodnotu h? S = k= ( 1 S 1 h opt = K 2 ) (x)dx 1/5 nβ2 2A, 2 γ k, A 2 = 1 0 m (x) 2 dx

Plug-in přístup Motivace Můžeme nějak využít optimální hodnotu h? S = k= ( 1 S 1 h opt = K 2 ) (x)dx 1/5 nβ2 2A, 2 γ k, A 2 = 1 0 m (x) 2 dx ĥ PI = (Ŝ 1 1 K 2 (x)dx nβ 2 2Â2 ) 1/5

Jak odhadnout S a A 2?

Jak odhadnout S a A 2? odhad S

Jak odhadnout S a A 2? odhad S odhadnutím chyb pomocí nějakého počátečního vyhlazení (průměr, přehlazení,...)

Jak odhadnout S a A 2? odhad S odhadnutím chyb pomocí nějakého počátečního vyhlazení (průměr, přehlazení,...) - nefunguje

Jak odhadnout S a A 2? odhad S odhadnutím chyb pomocí nějakého počátečního vyhlazení (průměr, přehlazení,...) - nefunguje odhadnutím spektrální hustoty f (λ) = 1 2π t= e itλ γ t

Jak odhadnout S a A 2? odhad S odhadnutím chyb pomocí nějakého počátečního vyhlazení (průměr, přehlazení,...) - nefunguje odhadnutím spektrální hustoty odhad A 2 f (λ) = 1 2π t= e itλ γ t

Jak odhadnout S a A 2? odhad S odhadnutím chyb pomocí nějakého počátečního vyhlazení (průměr, přehlazení,...) - nefunguje odhadnutím spektrální hustoty f (λ) = 1 2π t= odhad A 2 pracuje se na tom - viz Koláček (2008) e itλ γ t

Částečná krosvalidace (PCV) Dá se nějak obejít korelace?

Částečná krosvalidace (PCV) Dá se nějak obejít korelace? rozdělení pozorování do g skupin tak, že vezmeme každé g-té pozorování minimalizace průměru obyčejných CV každé skupiny CV (h) = g 1 g CV k (h) min k=1

Částečná krosvalidace (PCV) Dá se nějak obejít korelace? rozdělení pozorování do g skupin tak, že vezmeme každé g-té pozorování minimalizace průměru obyčejných CV každé skupiny CV (h) = g 1 g CV k (h) min k=1 h minimalizující CV (h) ĥ CV = arg min CV (h) = ĥpcv (g) = g 1/5 h CV

Částečná krosvalidace (PCV) Dá se nějak obejít korelace? rozdělení pozorování do g skupin tak, že vezmeme každé g-té pozorování minimalizace průměru obyčejných CV každé skupiny CV (h) = g 1 g CV k (h) min k=1 h minimalizující CV (h) ĥ CV = arg min CV (h) = ĥpcv (g) = g 1/5 h CV Ale volba g závisí γ k, K, A 2

Úroková míra CB Kanda - 1980-2011 25 Interest rates in Canada 01 1980 10 2011 20 Interest rate (%) 15 10 5 0 1981 1983 1985 1988 1990 1992 1994 1997 1999 2001 2003 2006 2008 2010 Time

Prvních 200 měsíců Motivace 22 Plug in method PCV method 20 18 16 14 12 10 8 6 4 2 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Prvních 150 měsíců Motivace 22 20 Interes rates in Canada Plug in method PCV method 18 16 14 12 10 8 6 4 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

References Motivace Altman, N.S. Kernel Smoothing of Data With Correlated Errors Journal of the American Statistical Association, Vol.85, No.411 (Sep., 1990), pp.749-759 Bowman, A.W. - Azzalini, A. Applied Smoothing Techniques for Data Analysis Clarendon Press, Oxford, 1997 Chu, C.-K. - Marron, J.S. Comparison of two bandwidth selectors with dependent errors The Annals of statistics, Vol.19, No.4 (1991), pp.1906-1918 Härdle, W. - Vieu, P. Kernel Regression Smoothing of Time Series Journal of Time Series Analysis, Vol.13, No.3, (May, 1992), pp.209 232

References Motivace Herrmann, E. - Gasser, T. - Kneip, A. Choice of Bandwidth for Kernel Regression when Residuals are Correlated Biometrika, Vol.79, No.4 (Dec., 1992), pp.783-795 Koláček, J. Plug-in method for nonparametric regression Computational Statistics, Vol.23, No.1 (Jan., 2008), pp.63-78 Opsomer, J. - Wang, Y. - Yang, Y. Nonparametric Regression with Correlated Errors Statistical Science, Vol.16, No.2 (May, 2001), pp.134-153

Děkuji za pozornost