More results about Ruzsa distance #

More facts about Ruzsa distance and related inequalities, for use in the m-torsion version of PFR.

Main definitions #

multiDist: An analogue of rdist for the m-torsion version of PFR.
condMultiDist: A conditional analogue of multiDist

Main results #

kvm_ineq_I, kvm_ineq_II, kvm_ineq_III: Variants of the Kaimanovich-Versik-Madiman inequality
multiDist_chainRule: A chain rule for multiDist
cor_multiDist_chainRule: The corollary of the chain rule needed for the m-torsion version of PFR
ent_sub_zsmul_sub_ent_le: Controlling H[X - aY] in terms of H[X] and d[X ; Y].

theorem rdist_of_neg_le {Ω : Type u_1} {Ω' : Type u_2} {G : Type uG} [mΩ : MeasurableSpace Ω] {μ : MeasureTheory.Measure Ω} [mΩ' : MeasurableSpace Ω'] {μ' : MeasureTheory.Measure Ω'} [hG : MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Countable G] {X : Ω → G} {Y : Ω' → G} [MeasureTheory.IsProbabilityMeasure μ] [MeasureTheory.IsProbabilityMeasure μ'] (hX : Measurable X) (hY : Measurable Y) [Fintype G] :

d[X ; μ # -Y ; μ'] ≤ 3 * d[X ; μ # Y ; μ']

If X, Y are G-valued, then d[X;-Y] ≤ 3 d[X;Y].

source

theorem kvm_ineq_I {Ω : Type u_1} {G : Type uG} [mΩ : MeasurableSpace Ω] {μ : MeasureTheory.Measure Ω} [hG : MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Countable G] {I : Type u_7} {i₀ : I} {s : Finset I} (hs : i₀ ∉ s) {Y : I → Ω → G} [∀ (i : I), FiniteRange (Y i)] (hY : ∀ (i : I), Measurable (Y i)) (h_indep : ProbabilityTheory.iIndepFun Y μ) :

H[Y i₀ + ∑ i ∈ s, Y i ; μ] - H[Y i₀ ; μ] ≤ ∑ i ∈ s, (H[Y i₀ + Y i ; μ] - H[Y i₀ ; μ])

If n ≥ 0 and X, Y₁, ..., Yₙ are jointly independent G-valued random variables, then H[Y i₀ + ∑ i ∈ s, Y i; μ] - H[Y i₀; μ] ≤ ∑ i ∈ s, (H[Y i₀ + Y i; μ] - H[Y i₀; μ]).

source

theorem kvm_ineq_II {Ω : Type u_1} {G : Type uG} [mΩ : MeasurableSpace Ω] {μ : MeasureTheory.Measure Ω} [hG : MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Countable G] {I : Type u_7} {i₀ : I} {s : Finset I} (hs : i₀ ∉ s) (hs' : s.Nonempty) {Y : I → Ω → G} [∀ (i : I), FiniteRange (Y i)] (hY : ∀ (i : I), Measurable (Y i)) (h_indep : ProbabilityTheory.iIndepFun Y μ) :

d[Y i₀ ; μ # ∑ i ∈ s, Y i ; μ] ≤ 2 * ∑ i ∈ s, d[Y i₀ ; μ # Y i ; μ]

If n ≥ 1 and X, Y₁, ..., Yₙ are jointly independent G-valued random variables, then d[Y i₀; μ # ∑ i ∈ s, Y i; μ] ≤ 2 * ∑ i ∈ s, d[Y i₀; μ # Y i; μ].

source

theorem kvm_ineq_III_aux {Ω : Type u_1} {G : Type uG} [mΩ : MeasurableSpace Ω] {μ : MeasureTheory.Measure Ω} [hG : MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Countable G] {X Y Z : Ω → G} [FiniteRange X] [FiniteRange Y] [FiniteRange Z] (hX : Measurable X) (hY : Measurable Y) (hZ : Measurable Z) (h_indep : ProbabilityTheory.iIndepFun ![X, Y, Z] μ) :

d[X ; μ # Y + Z ; μ] ≤ d[X ; μ # Y ; μ] + 2⁻¹ * (H[Y + Z ; μ] - H[Y ; μ])

source

theorem kvm_ineq_III_aux' {Ω : Type u_1} {G : Type uG} [mΩ : MeasurableSpace Ω] {μ : MeasureTheory.Measure Ω} [hG : MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Countable G] {X Y Z : Ω → G} [FiniteRange X] [FiniteRange Y] [FiniteRange Z] (hX : Measurable X) (hY : Measurable Y) (hZ : Measurable Z) (h_indep : ProbabilityTheory.IndepFun Y Z μ) [MeasureTheory.IsProbabilityMeasure μ] :

d[X ; μ # Y + Z ; μ] ≤ d[X ; μ # Y ; μ] + 2⁻¹ * (H[Y + Z ; μ] - H[Y ; μ])

strengthen the above lemma by not requiring X to be independent of Y, Z.

source

theorem kvm_ineq_III {Ω : Type u_1} {G : Type uG} [mΩ : MeasurableSpace Ω] {μ : MeasureTheory.Measure Ω} [hG : MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Countable G] {I : Type u_7} {i₀ i₁ : I} {s : Finset I} (hs₀ : i₀ ∉ s) (hs₁ : i₁ ∉ s) (h01 : i₀ ≠ i₁) (Y : I → Ω → G) [∀ (i : I), FiniteRange (Y i)] (hY : ∀ (i : I), Measurable (Y i)) (h_indep : ProbabilityTheory.iIndepFun Y μ) :

d[Y i₀ ; μ # Y i₁ + ∑ i ∈ s, Y i ; μ] ≤ d[Y i₀ ; μ # Y i₁ ; μ] + 2⁻¹ * (H[Y i₁ + ∑ i ∈ s, Y i ; μ] - H[Y i₁ ; μ])

If n ≥ 1 and X, Y₁, ..., Yₙ$ are jointly independent G-valued random variables, then d[Y i₀, ∑ i, Y i] ≤ d[Y i₀, Y i₁] + 2⁻¹ * (H[∑ i, Y i] - H[Y i₁]).

source

theorem ent_of_sum_le_ent_of_sum {Ω : Type u_1} {G : Type uG} [mΩ : MeasurableSpace Ω] {μ : MeasureTheory.Measure Ω} [hG : MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Countable G] {I : Type u_7} {s t : Finset I} (hdisj : Disjoint s t) (X : I → Ω → G) (hX : ∀ (i : I), Measurable (X i)) [∀ (i : I), FiniteRange (X i)] (hindep : ProbabilityTheory.iIndepFun X μ) (f : I → I) (hf : Finset.image f t ⊆ s) :

H[∑ i ∈ t, X i ; μ] ≤ H[∑ i ∈ s, X i ; μ] + ∑ i ∈ t, (H[X i - X (f i) ; μ] - H[X (f i) ; μ])

Let X₁, ..., Xₘ and Y₁, ..., Yₗ be tuples of jointly independent random variables (so the X's and Y's are also independent of each other), and let f: {1,..., l} → {1,... ,m} be a function, then H[∑ j, Y j] ≤ H[∑ i, X i] + ∑ j, H[Y j - X f(j)] - H[X_{f(j)}].

source

theorem ent_sub_zsmul_le {Ω : Type u_1} {G : Type uG} [mΩ : MeasurableSpace Ω] {μ : MeasureTheory.Measure Ω} [hG : MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Countable G] {X Y X' : Ω → G} [FiniteRange X] [FiniteRange Y] [FiniteRange X'] [MeasureTheory.IsProbabilityMeasure μ] (hX : Measurable X) (hY : Measurable Y) (hX' : Measurable X') (h_indep : ProbabilityTheory.iIndepFun ![X, Y, X'] μ) (hident : ProbabilityTheory.IdentDistrib X X' μ μ) {a : ℤ} :

H[X - (a + 1) • Y ; μ] ≤ H[X - a • Y ; μ] + H[X - Y - X' ; μ] - H[X ; μ]

Let X,Y,X' be independent G-valued random variables, with X' a copy of X, and let a be an integer. Then H[X - (a+1)Y] ≤ H[X - aY] + H[X - Y - X'] - H[X]

source

theorem ent_sub_nsmul_le {Ω : Type u_1} {G : Type uG} [mΩ : MeasurableSpace Ω] {μ : MeasureTheory.Measure Ω} [hG : MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Countable G] {X Y X' : Ω → G} [FiniteRange X] [FiniteRange Y] [FiniteRange X'] [MeasureTheory.IsProbabilityMeasure μ] (hX : Measurable X) (hY : Measurable Y) (hX' : Measurable X') (h_indep : ProbabilityTheory.iIndepFun ![X, Y, X'] μ) (hident : ProbabilityTheory.IdentDistrib X X' μ μ) {a : ℕ} :

H[X - (a + 1) • Y ; μ] ≤ H[X - a • Y ; μ] + H[X - Y - X' ; μ] - H[X ; μ]

Let X,Y,X' be independent G-valued random variables, with X' a copy of X, and let a be an integer. Then H[X - (a+1)Y] ≤ H[X - aY] + H[X - Y - X'] - H[X]

source

theorem ent_of_sub_smul' {Ω : Type u_1} {G : Type uG} [mΩ : MeasurableSpace Ω] {μ : MeasureTheory.Measure Ω} [hG : MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Countable G] {X Y X' : Ω → G} [FiniteRange X] [FiniteRange Y] [FiniteRange X'] [MeasureTheory.IsProbabilityMeasure μ] (hX : Measurable X) (hY : Measurable Y) (hX' : Measurable X') (h_indep : ProbabilityTheory.iIndepFun ![X, Y, X'] μ) (hident : ProbabilityTheory.IdentDistrib X X' μ μ) {a : ℤ} :

H[X - (a - 1) • Y ; μ] ≤ H[X - a • Y ; μ] + H[X - Y - X' ; μ] - H[X ; μ]

Let X,Y,X' be independent G-valued random variables, with X' a copy of X, and let a be an integer. Then H[X - (a-1)Y] ≤ H[X - aY] + H[X - Y - X'] - H[X]

source

theorem ent_sub_zsmul_sub_ent_le {Ω : Type u_1} {G : Type uG} [mΩ : MeasurableSpace Ω] {μ : MeasureTheory.Measure Ω} [hG : MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Countable G] {X Y : Ω → G} [MeasureTheory.IsProbabilityMeasure μ] [Fintype G] (hX : Measurable X) (hY : Measurable Y) (h_indep : ProbabilityTheory.IndepFun X Y μ) {a : ℤ} :

H[X - a • Y ; μ] - H[X ; μ] ≤ 4 * ↑|a| * d[X ; μ # Y ; μ]

Let X,Y be independent G-valued random variables, and let a be an integer. Then H[X - aY] - H[X] ≤ 4 |a| d[X ; Y].

source

theorem ent_sub_nsmul_sub_ent_le {Ω : Type u_1} {G : Type uG} [mΩ : MeasurableSpace Ω] {μ : MeasureTheory.Measure Ω} [hG : MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Countable G] {X Y : Ω → G} [MeasureTheory.IsProbabilityMeasure μ] [Fintype G] (hX : Measurable X) (hY : Measurable Y) (h_indep : ProbabilityTheory.IndepFun X Y μ) {a : ℕ} :

H[X - a • Y ; μ] - H[X ; μ] ≤ 4 * ↑a * d[X ; μ # Y ; μ]

Let X,Y be independent G-valued random variables, and let a be a natural number. Then H[X - aY] - H[X] ≤ 4 a d[X ; Y].

source

theorem ent_add_nsmul_sub_ent_le {Ω : Type u_1} {G : Type uG} [mΩ : MeasurableSpace Ω] {μ : MeasureTheory.Measure Ω} [hG : MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Countable G] {X Y : Ω → G} [MeasureTheory.IsProbabilityMeasure μ] [Fintype G] (hX : Measurable X) (hY : Measurable Y) (h_indep : ProbabilityTheory.IndepFun X Y μ) {a : ℕ} :

H[X + a • Y ; μ] - H[X ; μ] ≤ 4 * ↑a * d[X ; μ # Y ; μ]

Let X,Y be independent G-valued random variables, and let a be a natural number. Then H[X + aY] - H[X] ≤ 4 a d[X ; Y].

source

noncomputable def multiDist {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] {m : ℕ} {Ω : Fin m → Type u_7} (hΩ : (i : Fin m) → MeasureTheory.MeasureSpace (Ω i)) (X : (i : Fin m) → Ω i → G) :

ℝ

Let X_[m] = (X₁, ..., Xₘ) be a non-empty finite tuple of G-valued random variables X_i. Then we define D[X_[m]] = H[∑ i, X_i'] - 1/m*∑ i, H[X_i'], where the X_i' are independent copies of the X_i.

Equations

D[X ; hΩ] = H[fun (x : Fin m → G) => ∑ i : Fin m, x i ; MeasureTheory.Measure.pi fun (i : Fin m) => MeasureTheory.Measure.map (X i) MeasureTheory.volume] - (↑m)⁻¹ * ∑ i : Fin m, H[X i]

Instances For

source

def «termD[_;_]» :

Lean.ParserDescr

Equations

One or more equations did not get rendered due to their size.

Instances For

source

theorem multiDist_copy {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] {m : ℕ} {Ω : Fin m → Type u_7} {Ω' : Fin m → Type u_8} (hΩ : (i : Fin m) → MeasureTheory.MeasureSpace (Ω i)) (hΩ' : (i : Fin m) → MeasureTheory.MeasureSpace (Ω' i)) (X : (i : Fin m) → Ω i → G) (X' : (i : Fin m) → Ω' i → G) (hident : ∀ (i : Fin m), ProbabilityTheory.IdentDistrib (X i) (X' i) MeasureTheory.volume MeasureTheory.volume) :

D[X ; hΩ] = D[X' ; hΩ']

If X_i has the same distribution as Y_i for each i, then D[X_[m]] = D[Y_[m]].

source

@[simp]

theorem MeasureTheory.Measure.map_of_pi {ι : Type u_7} [Fintype ι] {α : ι → Type u_8} [(i : ι) → MeasurableSpace (α i)] {β : ι → Type u_9} [(i : ι) → MeasurableSpace (β i)] (μ : (i : ι) → Measure (α i)) [∀ (i : ι), IsProbabilityMeasure (μ i)] {f : (i : ι) → α i → β i} (hf : ∀ (i : ι), Measurable (f i)) :

map (fun (x : (i : ι) → α i) (i : ι) => f i (x i)) (Measure.pi μ) = Measure.pi fun (i : ι) => map (f i) (μ i)

Move to Mathlib?

source

theorem multiDist_indep {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] [MeasurableSingletonClass G] [Countable G] {m : ℕ} {Ω : Type u_7} (hΩ : MeasureTheory.MeasureSpace Ω) [MeasureTheory.IsProbabilityMeasure MeasureTheory.volume] {X : Fin m → Ω → G} (hX : ∀ (i : Fin m), Measurable (X i)) (h_indep : ProbabilityTheory.iIndepFun X MeasureTheory.volume) :

D[X ; fun (x : Fin m) => hΩ] = H[∑ i : Fin m, X i] - (∑ i : Fin m, H[X i]) / ↑m

If X_i are independent, then D[X_{[m]}] = H[∑_{i=1}^m X_i] - \frac{1}{m} \sum_{i=1}^m H[X_i].

source

theorem multiDist_nonneg_of_indep {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] [MeasurableSingletonClass G] [Countable G] [Fintype G] {m : ℕ} {Ω : Type u_7} (hΩ : MeasureTheory.MeasureSpace Ω) [MeasureTheory.IsProbabilityMeasure MeasureTheory.volume] (X : Fin m → Ω → G) (hX : ∀ (i : Fin m), Measurable (X i)) (h_indep : ProbabilityTheory.iIndepFun X MeasureTheory.volume) :

0 ≤ D[X ; fun (x : Fin m) => hΩ]

source

theorem multiDist_nonneg {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] [MeasurableSingletonClass G] [Countable G] [Fintype G] {m : ℕ} {Ω : Fin m → Type u_7} (hΩ : (i : Fin m) → MeasureTheory.MeasureSpace (Ω i)) (hprob : ∀ (i : Fin m), MeasureTheory.IsProbabilityMeasure MeasureTheory.volume) (X : (i : Fin m) → Ω i → G) (hX : ∀ (i : Fin m), Measurable (X i)) :

0 ≤ D[X ; hΩ]

We have D[X_[m]] ≥ 0.

source

theorem multiDist_of_perm {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] [MeasurableSingletonClass G] [Countable G] {m : ℕ} {Ω : Fin m → Type u_7} (hΩ : (i : Fin m) → MeasureTheory.MeasureSpace (Ω i)) (hΩprob : ∀ (i : Fin m), MeasureTheory.IsProbabilityMeasure MeasureTheory.volume) (X : (i : Fin m) → Ω i → G) (φ : Equiv.Perm (Fin m)) :

D[fun (i : Fin m) => X (φ i) ; fun (i : Fin m) => hΩ (φ i)] = D[X ; hΩ]

If φ : {1, ..., m} → {1, ...,m} is a bijection, then D[X_[m]] = D[(X_φ(1), ..., X_φ(m))]

source

@[reducible, inline]

abbrev offDiag_sum {m : ℕ} (f : Fin m → Fin m → ℝ) :

ℝ

The sum of f away from the diagonal.

Equations

offDiag_sum f = ∑ j : Fin m, ∑ k : Fin m, if j = k then 0 else f j k

Instances For

source

theorem offDiag_sum_left {m : ℕ} (hm : m ≥ 1) (f : Fin m → ℝ) :

(offDiag_sum fun (j x : Fin m) => f j) = (↑m - 1) * ∑ j : Fin m, f j

source

theorem offDiag_sum_right {m : ℕ} (hm : m ≥ 1) (f : Fin m → ℝ) :

(offDiag_sum fun (x k : Fin m) => f k) = (↑m - 1) * ∑ j : Fin m, f j

source

theorem offDiag_sum_const {m : ℕ} (hm : m ≥ 1) (c : ℝ) :

(offDiag_sum fun (x x_1 : Fin m) => c) = ↑m * (↑m - 1) * c

source

theorem offDiag_sum_add {m : ℕ} (f g : Fin m → Fin m → ℝ) :

(offDiag_sum fun (j k : Fin m) => f j k + g j k) = offDiag_sum f + offDiag_sum g

source

theorem offDiag_sum_sub {m : ℕ} (f g : Fin m → Fin m → ℝ) :

(offDiag_sum fun (j k : Fin m) => f j k - g j k) = offDiag_sum f - offDiag_sum g

source

theorem offDiag_sum_div {m : ℕ} (f : Fin m → Fin m → ℝ) (c : ℝ) :

(offDiag_sum fun (j k : Fin m) => f j k / c) = offDiag_sum f / c

source

theorem offDiag_mul_sum {m : ℕ} (f : Fin m → Fin m → ℝ) (c : ℝ) :

(offDiag_sum fun (j k : Fin m) => c * f j k) = c * offDiag_sum f

source

theorem offDiag_sum_le {m : ℕ} (f g : Fin m → Fin m → ℝ) (h : ∀ (j k : Fin m), j ≠ k → f j k ≤ g j k) :

offDiag_sum f ≤ offDiag_sum g

source

theorem multidist_ruzsa_I_indep {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] [MeasurableSingletonClass G] [Countable G] {m : ℕ} (hm : m ≥ 1) {Ω : Type u_7} (hΩ : MeasureTheory.MeasureSpace Ω) [MeasureTheory.IsProbabilityMeasure MeasureTheory.volume] (X : Fin m → Ω → G) (h_indep : ProbabilityTheory.iIndepFun X MeasureTheory.volume) (hmes : ∀ (j : Fin m), Measurable (X j)) (hfin : ∀ (j : Fin m), FiniteRange (X j)) :

(∑ j : Fin m, ∑ k : Fin m, if j = k then 0 else d[X j # -X k]) ≤ ↑m * (↑m - 1) * D[X ; fun (x : Fin m) => hΩ]

To prove multidist_ruzsa_I, we first establish a special case when the random variables are defined on the same space and are jointly independent.

source

theorem multidist_ruzsa_I {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] [MeasurableSingletonClass G] [Countable G] {m : ℕ} (hm : m ≥ 1) {Ω : Fin m → Type u_7} (hΩ : (i : Fin m) → MeasureTheory.MeasureSpace (Ω i)) {X : (i : Fin m) → Ω i → G} (hmes : ∀ (j : Fin m), Measurable (X j)) (hprob : ∀ (j : Fin m), MeasureTheory.IsProbabilityMeasure MeasureTheory.volume) (hfin : ∀ (j : Fin m), FiniteRange (X j)) :

(∑ j : Fin m, ∑ k : Fin m, if j = k then 0 else d[X j # -X k]) ≤ ↑m * (↑m - 1) * D[X ; hΩ]

Let m ≥ 1, and let X_[m] be a tuple of G-valued random variables. Then ∑ (1 ≤ j, k ≤ m, j ≠ k), d[X_j; -X_k] ≤ m(m - 1) D[X_[m]].

source

theorem multidist_ruzsa_II {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] [MeasurableSingletonClass G] [Countable G] {m : ℕ} (hm : m ≥ 2) {Ω : Fin m → Type u_7} (hΩ : (i : Fin m) → MeasureTheory.MeasureSpace (Ω i)) (hprob : ∀ (i : Fin m), MeasureTheory.IsProbabilityMeasure MeasureTheory.volume) (X : (i : Fin m) → Ω i → G) (hmes : ∀ (i : Fin m), Measurable (X i)) (hfin : ∀ (i : Fin m), FiniteRange (X i)) :

∑ j : Fin m, d[X j # X j] ≤ 2 * ↑m * D[X ; hΩ]

Let m ≥ 2, and let X_[m] be a tuple of G-valued random variables. Then ∑ j, d[X_j;X_j] ≤ 2 m D[X_[m]].

source

theorem multidist_ruzsa_III' {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] [MeasurableSingletonClass G] [Countable G] {m : ℕ} (hm : m ≥ 2) {Ω : Type u_7} {hΩ : MeasureTheory.MeasureSpace Ω} {X : Fin (m + 1) → Ω → G} (hmes : ∀ (i : Fin (m + 1)), Measurable (X i)) (hident : ∀ (j k : Fin (m + 1)), ProbabilityTheory.IdentDistrib (X j) (X k) MeasureTheory.volume MeasureTheory.volume) (hindep : ProbabilityTheory.iIndepFun X MeasureTheory.volume) (hfin : ∀ (i : Fin (m + 1)), FiniteRange (X i)) [MeasureTheory.IsProbabilityMeasure MeasureTheory.volume] (i₀ : Fin m) :

D[Fin.init X ; fun (x : Fin m) => hΩ] ≤ ↑m * d[X i₀.castSucc # X i₀.castSucc]

A version of multidist_ruzsa_III assuming independence.

source

theorem multidist_ruzsa_III {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] [MeasurableSingletonClass G] [Countable G] {m : ℕ} (hm : m ≥ 2) {Ω : Fin m → Type u_7} (hΩ : (i : Fin m) → MeasureTheory.MeasureSpace (Ω i)) (X : (i : Fin m) → Ω i → G) (hident : ∀ (j k : Fin m), ProbabilityTheory.IdentDistrib (X j) (X k) MeasureTheory.volume MeasureTheory.volume) (hmes : ∀ (i : Fin m), Measurable (X i)) (hprob : ∀ (i : Fin m), MeasureTheory.IsProbabilityMeasure MeasureTheory.volume) (hfin : ∀ (i : Fin m), FiniteRange (X i)) (i₀ : Fin m) :

D[X ; hΩ] ≤ ↑m * d[X i₀ # X i₀]

Let I be an indexing set of size m ≥ 2, and let X_[m] be a tuple of G-valued random variables. If the X_i all have the same distribution, then D[X_[m]] ≤ m d[X_i;X_i] for any 1 ≤ i ≤ m.

source

theorem multidist_ruzsa_IV {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] [MeasurableSingletonClass G] [Countable G] {m : ℕ} (hm : m ≥ 2) {Ω : Type u} [MeasureTheory.MeasureSpace Ω] (X : Fin m → Ω → G) (h_indep : ProbabilityTheory.iIndepFun X MeasureTheory.volume) (hmes : ∀ (i : Fin m), Measurable (X i)) [MeasureTheory.IsProbabilityMeasure MeasureTheory.volume] (hfin : ∀ (i : Fin m), FiniteRange (X i)) :

d[∑ i : Fin m, X i # -∑ i : Fin m, X i] ≤ 2 * D[X ; fun (x : Fin m) => inferInstance]

Let m ≥ 2, and let X_[m] be a tuple of G-valued random variables. Let W := ∑ X_i. Then d[W;-W] ≤ 2 D[X_i].

source

theorem multidist_eq_zero {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] [MeasurableSingletonClass G] [Countable G] [Fintype G] {m : ℕ} (hm : m ≥ 2) {Ω : Fin m → Type u_7} (hΩ : (i : Fin m) → MeasureTheory.MeasureSpace (Ω i)) (hprob : ∀ (i : Fin m), MeasureTheory.IsProbabilityMeasure MeasureTheory.volume) (X : (i : Fin m) → Ω i → G) (hvanish : D[X ; hΩ] = 0) (hmes : ∀ (i : Fin m), Measurable (X i)) (hfin : ∀ (i : Fin m), FiniteRange (X i)) (i : Fin m) :

∃ (H : AddSubgroup G) (U : Ω i → G), Measurable U ∧ ProbabilityTheory.IsUniform (↑H) U MeasureTheory.volume ∧ d[X i # U] = 0

If D[X_[m]]=0, then for each i ∈ I there is a finite subgroup H_i ≤ G such that d[X_i; U_{H_i}] = 0.

source

noncomputable def condMultiDist {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] {m : ℕ} {Ω : Fin m → Type u_7} (hΩ : (i : Fin m) → MeasureTheory.MeasureSpace (Ω i)) {S : Type u_8} [Fintype S] (X : (i : Fin m) → Ω i → G) (Y : (i : Fin m) → Ω i → S) :

ℝ

If X_[m] = (X_1, ..., X_m) and Y_[m] = (Y_1, ..., Y_m) are tuples of random variables, with the X_i being G-valued (but the Y_i need not be), then we define D[X_[m] | Y_[m]] = ∑_{(y_i)_{1 \leq i \leq m}} (∏ i, p_{Y_i}(y_i)) D[(X_i | Y_i = y_i)_{i=1}^m] where each y_i ranges over the support of p_{Y_i} for 1 ≤ i ≤ m.

Equations

One or more equations did not get rendered due to their size.

Instances For

source

def «termD[_|_;_]» :

Lean.ParserDescr

Equations

One or more equations did not get rendered due to their size.

Instances For

source

theorem condMultiDist_of_inj {G : Type u_7} [hG : MeasurableSpace G] [AddCommGroup G] {m : ℕ} {Ω : Fin m → Type u_8} (hΩ : (i : Fin m) → MeasureTheory.MeasureSpace (Ω i)) {S : Type u_9} [Fintype S] {T : Type u_10} [Fintype T] (X : (i : Fin m) → Ω i → G) (Y : (i : Fin m) → Ω i → S) {f : S → T} (hf : Function.Injective f) :

D[X | fun (i : Fin m) => f ∘ Y i ; hΩ] = D[X | fun (i : Fin m) => Y i ; hΩ]

Conditional multidistance is unchanged if we apply an injection to the conditioned variables

source

theorem condMultiDist_of_const {G : Type u_7} [hG : MeasurableSpace G] [AddCommGroup G] {m : ℕ} {Ω : Fin m → Type u_8} [hΩ : (i : Fin m) → MeasureTheory.MeasureSpace (Ω i)] [hprob : ∀ (i : Fin m), MeasureTheory.IsProbabilityMeasure MeasureTheory.volume] {S : Type u_9} [Fintype S] (c : Fin m → S) (X : (i : Fin m) → Ω i → G) :

D[X | fun (i : Fin m) (x : Ω i) => c i ; hΩ] = D[X ; hΩ]

Conditional multidistance against a constant is just multidistance

source

theorem condMultiDist_nonneg {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] [MeasurableSingletonClass G] [Countable G] [Fintype G] {m : ℕ} {Ω : Fin m → Type u_7} (hΩ : (i : Fin m) → MeasureTheory.MeasureSpace (Ω i)) (hprob : ∀ (i : Fin m), MeasureTheory.IsProbabilityMeasure MeasureTheory.volume) {S : Type u_8} [Fintype S] (X : (i : Fin m) → Ω i → G) (Y : (i : Fin m) → Ω i → S) (hX : ∀ (i : Fin m), Measurable (X i)) :

0 ≤ D[X | Y ; hΩ]

Conditional multidistance is nonnegative.

source

theorem condMultiDist_eq {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] [MeasurableSingletonClass G] [Countable G] {m : ℕ} {Ω : Type u_7} [hΩ : MeasureTheory.MeasureSpace Ω] {S : Type u_8} [Fintype S] [hS : MeasurableSpace S] [MeasurableSingletonClass S] {X : Fin m → Ω → G} (hX : ∀ (i : Fin m), Measurable (X i)) {Y : Fin m → Ω → S} (hY : ∀ (i : Fin m), Measurable (Y i)) (h_indep : ProbabilityTheory.iIndepFun (fun (i : Fin m) => ⟨X i, Y i⟩) MeasureTheory.volume) :

D[X | Y ; fun (x : Fin m) => hΩ] = H[fun (ω : Ω) => ∑ i : Fin m, X i ω | fun (ω : Ω) (i : Fin m) => Y i ω] - (∑ i : Fin m, H[X i | Y i]) / ↑m

If (X_i, Y_i), 1 ≤ i ≤ m are independent, then D[X_[m] | Y_[m]] = H[∑ i, X_i | (Y_1, ..., Y_m)] - 1/m * ∑ i, H[X_i | Y_i]

source

theorem condMultiDist_eq' {G : Type uG} [hG : MeasurableSpace G] [AddCommGroup G] [MeasurableSingletonClass G] [Countable G] {m : ℕ} {Ω : Type u_7} [hΩ : MeasureTheory.MeasureSpace Ω] {S : Type u_8} [Fintype S] [hS : MeasurableSpace S] [MeasurableSingletonClass S] {X : Fin m → Ω → G} (hX : ∀ (i : Fin m), Measurable (X i)) {Y : Fin m → Ω → S} (hY : ∀ (i : Fin m), Measurable (Y i)) (h_indep : ProbabilityTheory.iIndepFun (fun (i : Fin m) => ⟨X i, Y i⟩) MeasureTheory.volume) :

D[X | Y ; fun (x : Fin m) => hΩ] = ∑ y : Fin m → S, (MeasureTheory.volume (⋂ (i : Fin m), Y i ⁻¹' {y i})).toReal * D[X ; fun (x : Fin m) => { toMeasurableSpace := hΩ.toMeasurableSpace, volume := MeasureTheory.volume [|⋂ (i : Fin m), Y i ⁻¹' {y i}] }]

If (X_i, Y_i), 1 ≤ i ≤ m are independent, then D[X_[m] | Y_[m]] = ∑_{(y_i)_{1 ≤ i ≤ m}} P(Y_i=y_i ∀ i) D[(X_i | Y_i=y_i ∀ i)_{i=1}^m]

source

theorem multiDist_chainRule {G : Type u_7} {H : Type u_8} [hG : MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Fintype G] [hH : MeasurableSpace H] [MeasurableSingletonClass H] [AddCommGroup H] [Fintype H] (π : G →+ H) {m : ℕ} {Ω : Type u_9} (hΩ : MeasureTheory.MeasureSpace Ω) {X : Fin m → Ω → G} (hmes : ∀ (i : Fin m), Measurable (X i)) (h_indep : ProbabilityTheory.iIndepFun X MeasureTheory.volume) :

D[X ; fun (x : Fin m) => hΩ] = D[X | fun (i : Fin m) => ⇑π ∘ X i ; fun (x : Fin m) => hΩ] + D[fun (i : Fin m) => ⇑π ∘ X i ; fun (x : Fin m) => hΩ] + I[∑ i : Fin m, X i : fun (ω : Ω) (i : Fin m) => π (X i ω)|⇑π ∘ ∑ i : Fin m, X i]

Let π : G → H be a homomorphism of abelian groups and let X_[m] be a tuple of jointly independent G-valued random variables. Then D[X_[m]] is equal to D[X_[m] | π(X_[m])] + D[π(X_[m])] + I[∑ i, X_i : π(X_[m]) ; | ; π(∑ i, X_i)] where π(X_[m]) := (π(X_1), ..., π(X_m)).

source

theorem cond_multiDist_chainRule {G : Type u_7} {H : Type u_8} [hG : MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Fintype G] [hH : MeasurableSpace H] [MeasurableSingletonClass H] [AddCommGroup H] [Fintype H] (π : G →+ H) {S : Type u_9} [Fintype S] [hS : MeasurableSpace S] [MeasurableSingletonClass S] {m : ℕ} {Ω : Type u_10} [hΩ : MeasureTheory.MeasureSpace Ω] {X : Fin m → Ω → G} (hX : ∀ (i : Fin m), Measurable (X i)) {Y : Fin m → Ω → S} (hY : ∀ (i : Fin m), Measurable (Y i)) (h_indep : ProbabilityTheory.iIndepFun (fun (i : Fin m) => ⟨X i, Y i⟩) MeasureTheory.volume) :

D[X | Y ; fun (x : Fin m) => hΩ] = D[X | fun (i : Fin m) => ⟨⇑π ∘ X i, Y i⟩ ; fun (x : Fin m) => hΩ] + D[fun (i : Fin m) => ⇑π ∘ X i | Y ; fun (x : Fin m) => hΩ] + I[∑ i : Fin m, X i : fun (ω : Ω) (i : Fin m) => π (X i ω)|⟨⇑π ∘ ∑ i : Fin m, X i, fun (ω : Ω) (i : Fin m) => Y i ω⟩]

Let π : G → H be a homomorphism of abelian groups. Let I be a finite index set and let X_[m] be a tuple of G-valued random variables. Let Y_[m] be another tuple of random variables (not necessarily G-valued). Suppose that the pairs (X_i, Y_i) are jointly independent of one another (but X_i need not be independent of Y_i). Then D[X_[m] | Y_[m]] = D[X_[m] ,|, π(X_[m]), Y_[m]] + D[π(X_[m]) ,| , Y_[m]] + I[∑ i, X_i : π(X_[m]) ; | ; π(∑ i, X_i), Y_[m]].

source

theorem iter_multiDist_chainRule {m : ℕ} {G : Fin (m + 1) → Type u_7} [hG : (i : Fin (m + 1)) → MeasurableSpace (G i)] [hGs : ∀ (i : Fin (m + 1)), MeasurableSingletonClass (G i)] [(i : Fin (m + 1)) → AddCommGroup (G i)] [hGcount : (i : Fin (m + 1)) → Fintype (G i)] {φ : (i : Fin m) → G i.succ →+ G i.castSucc} {π : (d : Fin (m + 1)) → G ⊤ →+ G d} (hcomp : ∀ (i : Fin m), ⇑(π i.castSucc) = ⇑(φ i) ∘ ⇑(π i.succ)) {Ω : Type u_8} [hΩ : MeasureTheory.MeasureSpace Ω] {X : Fin m → Ω → G ⊤} (hX : ∀ (i : Fin m), Measurable (X i)) (h_indep : ProbabilityTheory.iIndepFun X MeasureTheory.volume) (n : Fin (m + 1)) :

D[X | fun (i : Fin m) => ⇑(π 0) ∘ X i ; fun (x : Fin m) => hΩ] = D[X | fun (i : Fin m) => ⇑(π n) ∘ X i ; fun (x : Fin m) => hΩ] + ∑ d ∈ Finset.Iio n, (D[fun (i : Fin m) => ⇑(π (d + 1)) ∘ X i | fun (i : Fin m) => ⇑(π d) ∘ X i ; fun (x : Fin m) => hΩ] + I[∑ i : Fin m, X i : fun (ω : Ω) (i : Fin m) => (π (d + 1)) (X i ω)|⟨⇑(π (d + 1)) ∘ ∑ i : Fin m, X i, fun (ω : Ω) (i : Fin m) => (π d) (X i ω)⟩])

Let m be a positive integer. Suppose one has a sequence G_m → G_{m - 1} → ... → G_1 → G_0 = {0} of homomorphisms between abelian groups G_0, ...,G_m, and for each d=0, ...,m, let π_d : G_m → G_d be the homomorphism from G_m to G_d arising from this sequence by composition (so for instance π_m is the identity homomorphism and π_0 is the zero homomorphism). Let X_[m] = (X_1, ..., X_m) be a jointly independent tuple of G_m-valued random variables. Then D[X_[m]] = ∑ d, D[π_d(X_[m]) ,| , π_(d-1)(X_[m])] + ∑_{d=1}^{m - 1}, I[∑ i, X_i : π_d(X_[m]) | π_d(∑ i, X_i), π_(d-1})(X_[m])].

source

theorem iter_multiDist_chainRule' {m : ℕ} (hm : m > 0) {G : Fin (m + 1) → Type u_7} [hG : (i : Fin (m + 1)) → MeasurableSpace (G i)] [hGs : ∀ (i : Fin (m + 1)), MeasurableSingletonClass (G i)] [hGa : (i : Fin (m + 1)) → AddCommGroup (G i)] [hGcount : (i : Fin (m + 1)) → Fintype (G i)] {φ : (i : Fin m) → G i.succ →+ G i.castSucc} {π : (d : Fin (m + 1)) → G ⊤ →+ G d} (hπ0 : π 0 = 0) (hcomp : ∀ (i : Fin m), ⇑(π i.castSucc) = ⇑(φ i) ∘ ⇑(π i.succ)) {Ω : Type u_8} [hΩ : MeasureTheory.MeasureSpace Ω] {X : Fin m → Ω → G ⊤} (hX : ∀ (i : Fin m), Measurable (X i)) (h_indep : ProbabilityTheory.iIndepFun X MeasureTheory.volume) :

D[X ; fun (x : Fin m) => hΩ] ≥ ∑ d : Fin m, D[fun (i : Fin m) => ⇑(π d.succ) ∘ X i | fun (i : Fin m) => ⇑(π d.castSucc) ∘ X i ; fun (x : Fin m) => hΩ] + I[∑ i : Fin m, X i : fun (ω : Ω) (i : Fin m) => (π 1) (X i ω)|⇑(π 1) ∘ ∑ i : Fin m, X i]

Under the preceding hypotheses, D[X_[m]] ≥ ∑ d, D[π_d(X_[m])| π_(d-1})(X_[m])] + I[∑ i, X_i : π_1(X_[m]) | π_1(∑ i, X_i)].

source

theorem multiDist_of_hom' {G : Type u_7} {G' : Type u_8} [MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Fintype G] [MeasurableSpace G'] [MeasurableSingletonClass G'] [AddCommGroup G'] [Fintype G'] {ι : G →+ G'} (hι : Function.Injective ⇑ι) {m : ℕ} {Ω : Fin m → Type u_9} (hΩ : (i : Fin m) → MeasureTheory.MeasureSpace (Ω i)) [∀ (i : Fin m), MeasureTheory.IsProbabilityMeasure MeasureTheory.volume] {X : (i : Fin m) → Ω i → G} (hX : ∀ (i : Fin m), Measurable (X i)) (a : Fin m → G') :

D[fun (i : Fin m) (ω : Ω i) => ι (X i ω) + a i ; hΩ] = D[X ; hΩ]

source

theorem multiDist_of_hom {G : Type u_7} {G' : Type u_8} [MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Fintype G] [MeasurableSpace G'] [MeasurableSingletonClass G'] [AddCommGroup G'] [Fintype G'] {ι : G →+ G'} (hι : Function.Injective ⇑ι) {Ω : Type u_9} (hΩ : MeasureTheory.MeasureSpace Ω) [MeasureTheory.IsProbabilityMeasure MeasureTheory.volume] {m : ℕ} {X : Fin m → Ω → G} (hX : ∀ (i : Fin m), Measurable (X i)) :

D[fun (i : Fin m) (ω : Ω) => ι (X i ω) ; fun (x : Fin m) => hΩ] = D[X ; fun (x : Fin m) => hΩ]

source

theorem multiDist_congr {G : Type u_7} [MeasurableSpace G] [AddCommGroup G] {m : ℕ} {Ω : Fin m → Type u_8} (hΩ : (i : Fin m) → MeasureTheory.MeasureSpace (Ω i)) {X X' : (i : Fin m) → Ω i → G} (hae : ∀ (i : Fin m), X i =ᵐ[MeasureTheory.volume ] X' i) :

D[X ; hΩ] = D[X' ; hΩ]

source

theorem condMultiDist_of_hom {G : Type u_7} {G' : Type u_8} {S : Type u_9} [Fintype S] [MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Fintype G] [MeasurableSpace G'] [MeasurableSingletonClass G'] [AddCommGroup G'] [Fintype G'] [MeasurableSpace S] [MeasurableSingletonClass S] {ι : G →+ G'} (hι : Function.Injective ⇑ι) {Ω : Type u_10} (hΩ : MeasureTheory.MeasureSpace Ω) [MeasureTheory.IsProbabilityMeasure MeasureTheory.volume] {m : ℕ} {X : Fin m → Ω → G} (hX : ∀ (i : Fin m), Measurable (X i)) {Y : Fin m → Ω → S} (hY : ∀ (i : Fin m), Measurable (Y i)) (a : Fin m → S → G') :

D[fun (i : Fin m) (ω : Ω) => ι (X i ω) + a i (Y i ω) | Y ; fun (x : Fin m) => hΩ] = D[X | Y ; fun (x : Fin m) => hΩ]

source

theorem cond_entropy_indep {Ω : Type u_7} [hΩ : MeasureTheory.MeasureSpace Ω] {S : Type u_8} {T : Type u_9} {U : Type u_10} {X : Ω → S} {Y : Ω → T} {Z : Ω → U} [MeasurableSpace S] [MeasurableSingletonClass S] [Fintype S] [MeasurableSpace T] [MeasurableSingletonClass T] [Fintype T] [MeasurableSpace U] [MeasurableSingletonClass U] [Fintype U] (hX : Measurable X) (hY : Measurable Y) (hZ : Measurable Z) [MeasureTheory.IsZeroOrProbabilityMeasure MeasureTheory.volume] (hindep : ProbabilityTheory.IndepFun (⟨X, Y⟩) Z MeasureTheory.volume) :

H[X | ⟨Y, Z⟩] = H[X | Y]

source

theorem cor_multiDist_chainRule {G : Type uG} [hG : MeasurableSpace G] [MeasurableSingletonClass G] [AddCommGroup G] [Countable G] [Fintype G] {m : ℕ} {Ω : Type u_7} (hΩ : MeasureTheory.MeasureSpace Ω) (X : Fin (m + 1) × Fin (m + 1) → Ω → G) (hmes : ∀ (i : Fin (m + 1) × Fin (m + 1)), Measurable (X i)) (h_indep : ProbabilityTheory.iIndepFun X MeasureTheory.volume) [MeasureTheory.IsProbabilityMeasure MeasureTheory.volume] :

I[fun (ω : Ω) (j : Fin (m + 1)) => ∑ i : Fin (m + 1), X (i, j) ω : fun (ω : Ω) (i : Fin (m + 1)) => ∑ j : Fin (m + 1), X (i, j) ω|∑ p : Fin (m + 1) × Fin (m + 1), X p] ≤ ∑ j : Fin m, (D[fun (i : Fin (m + 1)) => X (i, j.castSucc) ; fun (x : Fin (m + 1)) => hΩ] - D[fun (i : Fin (m + 1)) => X (i, j.castSucc) | fun (i : Fin (m + 1)) => ∑ k ∈ Finset.Ici j.castSucc, X (i, k) ; fun (x : Fin (m + 1)) => hΩ]) + D[fun (i : Fin (m + 1)) => X (i, ⊤) ; fun (x : Fin (m + 1)) => hΩ] - D[fun (i : Fin (m + 1)) => ∑ j : Fin (m + 1), X (i, j) ; fun (x : Fin (m + 1)) => hΩ]

Let G be an abelian group and let m ≥ 2. Suppose that X_{i,j}, 1 ≤ i, j ≤ m, are independent G-valued random variables. Then I[(∑ i, X_{i,j})_{j=1}^m : (∑ j, X_{i,j})_{i=1}^m | ∑ i j, X_{i,j}] is less than ∑_{j=1}^{m - 1} (D[(X_{i, j})_{i=1}^m] - D[(X_{i, j})_{i = 1}^m | (X_{i,j} + ... + X_{i,m})_{i=1}^m]) + D[(X_{i,m})_{i=1}^m] - D[(∑ j, X_{i,j})_{i=1}^m], where all the multidistances here involve the indexing set {1, ..., m}.

Documentation

PFR.MoreRuzsaDist

More results about Ruzsa distance #

Main definitions #

Main results #