Une démonstration probabiliste du Théorème de Weierstrass qui dit que toute fonction continue sur un intervalle compact est limite uniforme d’une suite de polynomes de Bernstein est rappeler ici avec détails.
Rappelons qu’une preuve analytique du théorème de Weierstrass utilisant une convolution avec une gaussienne a déjà été faite par Weierstrass. Par contre, la preuve probabiliste de ce théorème est due à Bernstein.
Polynômes de Bernstein
Nous allons définir une famille de polynômes qui va aider a démontrer le théorème de Weierstrass.
Soit $n\in \mathbb{N}$ et pour tout $k\in \{o,1,\cdots,n\},$ on pose \begin{align*} B^n_k(x)=(\begin{smallmatrix}n\\k\end{smallmatrix})x^k (1-x)^{n-k},\quad x\in [0,1].\end{align*} Alors $B_k^n$ est appele polynome de Bernstein et il satisfait les propriétés suivantes:
- le degré du polynôme de Berntein $B^n_k$ est exatement $n$. De plus, pour tout $x\in [0,1],$ on a \begin{align*}\sum_{k=0}^n B^n_k(x)=1.\end{align*}
- $B^0_0(t)=1$ et pour tout $n\in\mathbb{N}^\ast,$ on a $B^n_k(0)=B^n_k(1)=0$ et \begin{align*} B_k^n(x)>0,\quad \forall x\in ]0,1[.\end{align*}
- La fonction $x\in [0,1]\mapsto B^n_k(x)$ atteint son maximum en $\frac{k}{n}$.
- Pour tout $x\in [0,1],$ on a\begin{align*}\frac{d}{dx}(B^n_k(x))=nl\left(B^{n-1}_{k-1}-B^{n-1}_k \right).\end{align*}
- Finalement, on a la relation suivante \begin{align*} B^{n+1}_{k+1}(x)=(1-x)B^{n}_{k+1}(x)+x B^n_k (x),\quad x\in [0,1].\end{align*}
On rappelle aussi que la famille $(B^n_k)_{0\le k\le n}$ est une base de l’espace vectoriel des polynômes a coefficient réels et de degré inferieur ou égale a $n,$ $\mathbb{R}_n[X]$.
Maintenant si $f:[0,1]\to \mathbb{R}$ est une fonction continue, alors on peut lui associe les polynômes suivants \begin{align*} \mathscr{B}_n(f,x)=\sum_{k=0}^nf\left(\frac{k}{n}\right)B^n_k(x).\end{align*}
Démonstration probabiliste des théorème de Weierstrass
Voici l’énonce du théorème Weierstrass:
Théorème: Foit $f:[0,1]\to\mathbb{R}$ une fonction continue sur $[0,1]$. Alors $\mathscr{B}_n(f,\cdot)$ converge uniformément vers $f$ sur $[0,1]$. Autrement dit \begin{align*}\|\mathscr{B}_n(f,\cdot)-f\|_\infty:=\sup_{x\in [0,1]}|B_n(f,x)-f(x)|\underset{n\to\infty} {\to}0.\end{align*}
Preuve: On constate, de manière formelle, que les éléments $B_n^k(x)$ ressemblent à la loi binomiale de paramètres $n$ et $x\in [0,1]$, d’une variable aléatoire $X$ et que les éléments $\mathscr{B}_n(f,x)$ correspondent, par le théorème de transfert, a l’espérance $\mathbb{E}(f(X))$.
Dans la suite, nous justifierons rigoureusement cette remarque. On se place dans un espace probabilisé $(\Omega,\mathscr{A},\mathbb{P})$ dans lequel on considère des variables aléatoires $\{X_1,\cdots,X_n\}$ qui suivent la loi de Bernoulli de paramètre $x\in [0,1]$. Alors la variable $S_n=X_1+\cdots+X_n$ suit une loi Binomiale de paramètre $x$ $x$. Alors $\mathbb{P}(S_n=k)=B^n_k(x)$. De plus on a \begin{align*} \mathbb{E}\left(f(\frac{S_n}{n})\right)=\sum_{k=0}^n (\begin{smallmatrix}n\\k\end{smallmatrix})x^k (1-x)^{n-k} f(\frac{k}{n})=\mathscr{B}_n(f,x).\end{align*} D’autre part, on sait que la variable aléatoire $\frac{S_n}{n}$ converge en probabilité vers $x$. D’autre part, comme $f$ est continue les image aussi, et donc $f(\frac{S_n}{n})$ converge en probabilité vers $f(x)$.
Plus précisément, puisque $\mathbb{E}(f(x))=f(x)$ (car $f(x)$ ne dépend pas de l’aléatoire), alors on a \begin{align*} f(x)-\mathscr{B}_n(f,x)=\mathbb{E}\left(f(x)-f(\frac{S_n}{n})\right).\end{align*} On passe al la valeur absolu, on trouve pour tout $x\in [0,1],$ \begin{align*} \left|f(x)-\mathscr{B}_n(f,x)\right|\le \mathbb{E}\left(\left|f(x)-f(\frac{S_n}{n})\right|\right).\end{align*} Soit le module de continuité de $f$ defini par \begin{align*} \varpi(\delta):=\sup_{|t-s|\le \delta}|f(t)-f(s)|.\end{align*} On a alors \begin{align*}\left|f(x)-f(\frac{S_n}{n})\right|\le \begin{cases}\varpi(\delta),& \left|x-\frac{S_n}{n}\right|\le \delta,\cr 2 \|f\|_\infty,& \left|x-\frac{S_n}{n}\right|\ge \delta.\end{cases}\end{align*} On utise la croissante de l’intégral pour les fonctions positives on a \begin{align*}\mathbb{E}\left(\left|f(x)-f(\frac{S_n}{n})\right|\right)&\le \varpi(\delta)+2 \|f\|_\infty \mathbb{E}\left(1_{ \left( \left|x-\frac{S_n}{n}\right|\right) }\right) \cr & \le \varpi(\delta)+2 \|f\|_\infty \mathbb{P}\left( \left|x-\frac{S_n}{n}\right|\ge \delta \right).\end{align*} Maintenanant par application du théorème de la loi faible des grands nombres on a \begin{align*} \mathbb{P}\left( \left|x-\frac{S_n}{n}\right|\ge \delta\right)\le \frac{1}{4n\delta^2}.\end{align*} En déduit, donc \begin{align*}\mathbb{E}\left(\left|f(x)-f(\frac{S_n}{n})\right|\right) \le \varpi(\delta)+\frac{\|f\|_\infty}{2n\delta^2}.\end{align*} Ainsi \begin{align*} \|f-\mathscr{B}_n(f,\cdot)\|_\infty\le \varpi(\delta)+\frac{\|f\|_\infty}{2n\delta^2}.\end{align*}Cela implique que la limite supérieure on a \begin{align*} \overline{\lim}\|f-\mathscr{B}_n(f,\cdot)\|_\infty\le \varpi(\delta).\end{align*} Mais on sait que $\varpi(\delta)\to 0$ quand $\delta\to 0,$ alors \begin{align*}\lim_{n\to\infty}\|f-\mathscr{B}_n(f,\cdot)\|_\infty=0.\end{align*}