Feeds:
Posts

## Archive for the ‘nice facts’ Category

In a recent paper, M. Andersson and C. Vasquez have introduced a new and useful estimate related to Pliss Lemma (see previous blog entry for its statement together with a proof).  One considers some real numbers $a_1,\dots,a_N$ such that for some reals $B<\alpha$ and $0\leq\kappa\leq1$:

• $a_k\geq B$;
• $|\{1\leq k\leq N:a_k\geq \alpha\}|\geq (1-\kappa)N$.

In contrast to Pliss Lemma, one assumes a lower bound (instead of an upper bound) and a high frequency of  large values (instead of just a large average). Andersson and Vasquez then show that the fraction of Pliss times can be made large by taking $\kappa$ is sufficient small.

Lemma (Andersson-Vasquez). Given $B\leq \beta<\alpha$, the fraction of Pliss times, i.e.,  $k$ such that

$\forall 1\leq\ell\leq k\quad \frac1{k-\ell+1}(a_\ell+\dots+a_k) \geq \beta\qquad (*)$

among $1,\dots,N$ is at least $1-\kappa\frac{\alpha-B}{\alpha-\beta}$.

In this situation, we say that $\beta$ is the target average.

Note that this lower bound is close to $1$ when $\kappa$ is small whereas  in Pliss Lemma this only occurs when $\alpha\approx A$.

Andersson and Vasquez provide a direct proof. Here we deduce it as a corollary of Pliss Lemma.

Proof. Obviously we can assume that

(*) $1-\kappa\frac{\alpha-B}{\alpha-\beta}>0$.

Let $a'_k=1$ if $a_k\geq\alpha$, $a'_k=0$ otherwise. We apply Pliss Lemma to this sequence with upper bound $A'=1$, average $\alpha'=1-\kappa$ and target average $\beta'=\frac{\beta-B}{\alpha-B}$. The required inequality $\beta'<\alpha'$ is equivalent to $\kappa(1-\beta')^{-1}<1$ which follows from (*). We obtain a fraction $\frac{\alpha'-\beta'}{A'-\beta'}=1-\kappa\frac{\alpha-B}{\alpha-\beta}$ of Pliss times. To conclude note that if $k$ is such a Pliss time, then the average of $a$ along all intervals $[\ell,k]$ is at least $\beta=\beta'\alpha+(1-\beta')B$. $\square$

## A proof of Pliss’ lemma

Pliss’ lemma is a simple combinatorial tool very useful for nonuniformly hyperbolic dynamics. It is about finite sequences of real numbers $a_1,\dots,a_N$ ($N\geq1$). Assume that:

$\tfrac1N(a_1+\dots+a_N) \geq \alpha$ for some $\alpha$ (the average is good).

Fix $\beta<\alpha$. Say that an (integer) interval $I\subset\{1,\dots,N\}$ is bad if $\tfrac1{|I|}\sum_{i\in I} a_i<\beta$. Otherwise the interval is called good. An index $1\leq k\leq n$ is Pliss if all subintervals $[\ell,k]$ for $1\leq \ell\leq k$ are good.

Lemma (Pliss). If $A\geq \max(a_1,\dots,a_N)$ then there are at least $\frac{\alpha-\beta}{A-\beta} N$ Pliss indices among $\{1,\dots,N\}$.

Note: the same bound holds for the trivial estimate:

$|\{1\leq k\leq N: a_k\geq\beta\}| > \frac{\alpha-\beta}{A-\beta} N$

Here is a proof, modeled after Kamae’s proof of the ergodic theorem.

For each non-Pliss index $k$ define $1\leq \ell(k)\leq k$ to be the largest integer such $[\ell,k]$ is bad. Let $B\subset\{1,\dots,N\}$ be the set of non-Pliss indices and let $\hat B:=\bigcup_{k\in B} [\ell(k),k]$. Clearly $B\subset \hat B$. We can assume that $B\ne\emptyset$ since otherwise there is nothing to show.

Claim. The intervals appearing in the above union are disjoint or nested.

Indeed, take two intersecting intervals, i.e., $k,k'\in B$ such that $k and $\ell(k)\leq \ell(k')\leq k$. Note that $[k+1,k']$ is good by maximality of $\ell(k')$. Since $[\ell(k'),k']$ is bad, this implies that $[\ell(k'),k]$ is bad. The maximality of $\ell(k)$ implies that $\ell(k)\geq \ell(k')$, proving the claim.

It follows that $\hat B$ can be written as the disjoint bad intervals. Therefore $\tfrac1{|\hat B|}\sum_{k\in \hat B} a_k<\beta$. This yields:

$\alpha N \leq \sum_{k\in \hat B} a_i+\sum_{k\in[1,N]\setminus \hat B} a_i \leq \beta|\hat B| + (N-|\hat B|)A$

A direct computation then concludes the proof of the lemma. QED

Pliss Lemma generalizes to infinite sequences, say $(\alpha_n)_{n\geq1}$. For backward Pliss indices, i.e., $k\geq1$ such that the intervals $[\ell,k]$ are good for all $1\leq\ell\leq k$,  it is enough to apply the previous, finitary version to intervals $[1,N]$.

Lemma (Pliss, backward, infinite version). Let $\alpha:=\liminf_N \frac1N(a_1+\dots+a_N)$ and let $A:=\sup_{n\geq1} A_n$. Given any $\beta<\alpha$, the lower density of backward Pliss times for parameter $\beta$ is at least $\frac{\alpha-\beta}{A-\beta}$.

Forward Pliss times are a bit more delicate since an index $1\leq k\leq N$ can be forward Pliss for $(a_1,\dots,a_N)$ but not for $(a_1,\dots,a_M)$ for some $M>N$. Given $k\geq1$ which is not forward Pliss, let $\ell(k)$ be the smallest integer $\ell\geq k$ such that $[k,\ell(k)]$ is bad. As before, the intervals $[k,\ell(k)]$ $(k\geq1)$ are disjoint or nested.  Setting $\hat N:=\sup_{k\leq N} \ell(k)$, note that for each $k\leq\hat N$, $\ell(k)\leq\hat N$. Thus, we can estimate the number of forward Pliss times in $[1,\hat N-1]$ by the finitary Pliss Lemma and obtain:

Lemma (Pliss, forward, infinite version). Let $\alpha:=\liminf_N \tfrac1N(a_1+\dots+a_N)$ and let $A:=\sup_{n\geq1} A_n$. Given any $\beta<\alpha$, the upper density of backward Pliss times for parameter $\beta$ is at least $\frac{\alpha-\beta}{A-\beta}$.

One can combine the two to obtain:

Lemma (Pliss, backward, bi-infinite version). Let $\alpha=\min(\liminf_{N} \tfrac1{N}(a_{-N}+\dots+a_{-1}), \limsup_N\tfrac1N(a_1+\dots+a_N)$ and let $A:=\sup_{n\in\mathbf Z} A_n$. Given any $\beta<\alpha$, the upper density of backward Pliss times for parameter $\beta$ is at least $\frac{\alpha-\beta}{A-\beta}$.

Note: the upper density of $S\subset \mathbf Z$ is $\limsup_{N,M\to\infty} \tfrac1{M+N+1}(a_{-M}+\dots+a_N)$.

## Pression topologique, différentiabilité et états d’équilibre

Le concept physique de “transition de phase” associe plusieurs phénomènes, notamment:

1. existence de plusieurs états d’équilibre;
2. non-différentiabilité du potentiel thermodynamique;
3. corrélations à longue portée;
4. fluctuations non gaussiennes.

L’équivalence des propriétés (1) et (2) est facilement obtenue dans le cadre du formalisme thermodynamique. C’est un résultat classique (je l’ai appris dans le livre Thermodynamical formalism de D. Ruelle – voir son théorème 6.14) et d’une grande généralité, qui devrait à mon avis être davantage connu.

Cadre abstrait. On se donne  un espace métrique compact $X$ et une fonction réelle, continue et convexe $P:C(X)\to\mathbb R$ (la pression) sur l’ensemble $C(X)$ des fonctions réelles continues. Soit $M(X)$ l’ensemble des probabilités boréliennes sur $X$ muni de la topologie * faible. L’entropie $E:M\to\mathbb R$ est définie dans ce cadre comme la transformée de Fenchel-Legendre:

$E(m)=\inf\{ P(f)-m(f): f\in C(X)\}$.

On a alors:

Théorème. Pour une mesure $m\in M$, il y a équivalence entre:

1. $m$ maximise $E(m)+m(f)$ (on dit que c’est un état d’équilibre pour $f$);
2. $m$ est une sous-différentielle de $P$ en $f$: $P(f+g)\leq P(f)+m(g)$ pour tout $g\in C(x)$.

En particulier, la pression est Gâteaux-différentiable en $f$ si et seulement la mesure d’équilibre pour $f$ est unique. On en déduit qu’une fonction $f\in C(X)$ générique au sens de Baire définit un unique état d’équilibre.

Application: toute action continue sur un espace métrique compact $X$ dont la fonction entropie de Kolmogorov-Sinaï sur l’ensemble des mesures de probabilité invariantes $h:M\to\mathbb R$ est semicontinue supérieurement pour la topologie * faible.

La pression topologique est: $P(f):=\sup\{h(m)+m(f):m\in M\}$. On vérifie qu’elle est bien convexe et continue puis le principe variationnel suivant permet d’appliquer le théorème.

Lemme. $h(m)=\inf\{ P(f)-m(f): f\in C(X)\}$.

Preuve du théorème. Elle repose sur les deux principes variationnels:

(1) $E(m)=\inf\{ P(f)-m(f): f\in C(X)\}$.

(2) $P(f)=\sup\{E(\mu)+\mu(f):\mu\in M\}$;

Ici (1) est la définition de $E$. (2) est une version du théorème de dualité  de Fenchel-Moreau. On n’utilise en fait que l’inégalité (2′) $P(f)\geq E(\mu)+\mu(f)$, conséquence triviale de (1).

Si $m$ est un état d’équilibre pour $f$, l’inégalité (2′) donne, pour tout $g\in C(x)$,

$P(f+g) \geq E(m)+m(f+g) \leq P(f)+m(g)$,

donc $m$ est une sous-différentielle. Réciproquement, si $m\in M$ est une sous-différentielle, alors, pour tout $g\in C(X)$,

$P(f) \leq P(f+g) - m(g) = P(f+g)-m(f+g)+m(f)$

donc, vu (1),

$P(f) \leq \inf\{P(k)-m(k):k\in C(X)\} + m(f) = E(m)+m(f)$.

On voit que $m$ est bien un état d’équilibre. Les deux dernières assertions découlent des propriétés des fonctions convexes.

## Décomposition ergodique pour le temps 1 d’une mesure ergodique pour le flot

On sait qu’une mesure de probabilité $\mu$ invariante et ergodique par un flot $(f^t)_{t\in\mathbb R}$ peut admettre une  décomposition ergodique $\mu=\int \mu_x\, d\mu$ non triviale par rapport à $f:=f^1$. On a cependant:

presque toutes les composantes ergodiques $\mu_x$ sont les images les unes des autres par le flot .

Voici une (esquisse de) preuve (inspirée par le lemme 2.15 du preprint suivant). Il doit s’agir d’un fait classique – je suis demandeur d’une référence, merci de me la signaler par email ou en commentaire.

La mesure $\mu$ étant invariante par le flot,

$\mu = \int_0^1 f^t_*\mu\, dt = \int_0^1 f^t_*\left(\int \mu_x\, d\mu\right) \, dt= \int \left(\int_0^1 f^t_*\mu_x\, dt\right)\, d\mu$

Or presque toute mesure $\int_0^1 f^s_*\mu_x\, dt$ est invariante par le flot donc égale à la mesure initiale $\mu$, celle-ci étant ergodique. Par conséquent, pour tout $x\in Y$, une partie de mesure $1$,  on a:

(1) $\mu = \int_0^1 f^t_*\mu_x\, dt$

Notons que chaque $f^t_*\mu_x$ est ergodique (pour $f$), cette propriété étant invariante par conjugaison. L’égalité (1) est donc une décomposition ergodique. Par unicité de celle-ci:pour tous $x,y\in Y$, $\mu_y=f^t_*\mu_x$ pour un $t\in[0,1]$. CQFD.

En particulier, presque toutes les composantes ergodiques ont la même entropie, égale à celle de la mesure initiale $\mu$.

## Uniformité de la décroissance des corrélations et théorème de Banach-Steinhaus

Soit un système dynamique probabiliste $(X,T,m)$ et deux espaces de Banach de fonctions à valeurs complexes sur $X$: $\mathcal A,\mathcal B$. Supposons que pour tous $f\in\mathcal A,g\in\mathcal B$ et tout $n\geq 0$, $c_n(f,g):=\int_X f\circ T^n\cdot \overline{g}\, dm-\int_X f\, dm\int_X \overline{g}\, dm$ est bien défini et qu’il y a décroissance exponentielle des corrélations: il existe $0<\kappa<1$ tel que, pour tous $f\in\mathcal A,g\in\mathcal B$,

(1) $\forall n\geq0\quad |c_n(f,g)|\leq C(f,g)\cdot\kappa^n$ avec  $C(f,g)<\infty$.

(énoncé souvent obtenu, voir par exemple le théorème 3 de cet article de Lai-Sang Young). Chazottes, Collet et Schmitt dans cet article ont remarqué que des hypothèses très faibles qu’ici on simplifira en:

(2) Pour tout $n\geq0$$\sup_{\|f\|,\|g\|\leq1} |c_n(f,g)|<\infty$

permettent de remplacer la majoration $C(f,g)$ par un simple produit  $C\cdot\|f\|\cdot\|g\|$.

Ceci découle presqu’immédiatement de la formulation suivante du théorème de Banach-Steinhaus qu’on applique à la famille d’opérateurs bilinéaires et continus $b_i(f,g):=\kappa^{-n}c_i(f,g)$ avec $I=\mathbb N$ et $\mathcal C:=\mathbb C$.

Proposition. Soit $\mathcal A,\mathcal B$ des espaces de Banach et $\mathcal C$ un espace vectoriel normé. Soit $b_i:\mathcal A\times\mathcal B\to\mathcal C$, $i\in I$, une famille d’opérateurs bilinéaires et continus. Supposons:

(3) $\forall f\in\mathcal A,g\in\mathcal B\; C(f,g):=\sup_{i\in I} \|b_i(f,g)\|<\infty$

Alors il existe une constante $K<\infty$ telle que

(4) $\forall i\in I\;\forall f\in\mathcal A,g\in\mathcal B\; \|b_i(f,g)\| \leq K\cdot\|f\|\cdot\|g\|$.

Cette formulation se montre en appliquant deux fois le théorème de Banach-Steinhaus standard (pour les opérateurs linéaires).

Preuve. Pour uniformiser la dépendance en  $g$, introduisons les opérateurs linéaires $b_i^f:\mathcal B\to\mathcal C$, $b_i^f(g):=b_i(f,g)$. Ils sont continus avec  $\|b_i^f\|\leq \|b_i\|\cdot\|f\|$, et, pour tout $g\in\mathcal B$, $\sup_{i\in I} \|b_i^f(g)\|\leq C(f,g)<\infty$. Une première application de Banach-Steinhaus (à $f$ fixé) donne $K(f):=\sup_{i\in I} \|b_i^f\|<\infty$.

Introduisons maintenant les opérateurs linéaires $B_i:\mathcal A\to L(\mathcal B,\mathcal C)$ définis par $B_i(f):=b_i^f$. Ils sont continus avec $\|B_i\|= \|b_i\|$ et, pour tout $f\in\mathcal A$, $\sup_{i\in I} \|B_i(f)\|\leq K(f)<\infty$. Une deuxième application de Banach-Steinhaus donne $K:=\sup_{i\in I}\|B_i\|<\infty$.

Finalement, on a obtenu: pour tous $f\in\mathcal A,g\in\mathcal B$ et $i\in I$$\|b_i(f,g)\|=\|B_i(f)(g)\|\leq K\|f\|\cdot\|g\|$. CQFD.

toral automorphism $f:\mathbb T^d\to\mathbb T^d$ is a map $x\mapsto Ax\mod\mathbb Z^d$ where $A\in GL(d,\mathbb Z)$. $f$ is hyperbolic if $A$ has no eigenvalue on the unit circle. $f$ has unstable index 1 if $A$ has a single eigenvalue $\lambda$ with modulus greater than one and if this eigenvalue has no algebraic multiplicity.
Observe that $\lambda$ must be a Pisot number: it is an algebraic integer whose algebraic conjugates (ie, the other roots of $P_\lambda$, the smallest degree non-zero integer, monic polynomial such that  $P_\lambda(\lambda)=0$) must lie inside the open unit disk.
Note that the characteristic polynomial of $A$ must satisfy: $\chi_A=P_\lambda\cdot Q$ with $Q$ another integer monic polynomial with constant coefficient 1. Hence if $Q$ is not a constant, then it would have a root of modulus at least 1, a contradiction. Hence, $\chi_A=P_\lambda$.
It is sometimes useful to know that one can ensure that all the eigenvalues of $A$ are simple and have pairwise distinct moduli. By an observation of C. Smyth (Advanced Problem 5931, Amer. Math. Monthly 82 (1975), p.86) this occurs whenever all the roots of $P_\lambda$ are real. The latter can be ensured by a theorem of Pisot (see Theorem 5.2 of this book).