Astronomie

Corrélations croisées entre synthèse de Lagrange et de Fourier

Corrélations croisées entre synthèse de Lagrange et de Fourier


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Dans le cadre de la prévision de grands levés, je dois faire des corrélations croisées entre 2D (avec coordonnées angulaires de transformation de Lagrange pour GC photométrique et Weak Lensing) et 3D (transformée de Fourier avec coordonnées radiales pour GC spectroscopique).

Pour le moment, seule la corrélation croisée pour la 2D est réalisée (GCph+WL+XC), ou ce que nous appelons 3x2 points (avec XC représentant les corrélations croisées).

Par exemple, un élément de matrice Fisher pour 3x2pt est exprimé comme :

$epsilon$ gammes sur G (Galaxy), L (objectif faible) et GL (Galaxy, objectif faible)

Quelqu'un pourrait-il me dire ou donner des liens sur les corrélations croisées complètes entre la 2D et la 3D, c'est-à-dire GCsp+GCph+WL+XC (4x2 points) dans la littérature ?

Au-delà d'une formule théorique compliquée, je préfère en savoir plus sur l'état de l'art.

Je veux dire, j'aimerais savoir ce qui a déjà été fait dans cette tentative de corrélation croisée 2D+3D.

On m'a dit qu'il y avait eu des travaux de Bessel-Fourier ou des trucs similaires mais j'aimerais avoir plus d'informations à ce sujet.

Toute aide est la bienvenue


Corrélations croisées : quelle taille choisir pour la matrice ?

Je travaille sur le formalisme de Fisher afin d'obtenir des contraintes sur les paramètres cosmologiques.

J'essaie de faire une corrélation croisée entre 2 types de populations de galaxies (LRG/ELG) dans un ensemble total de 3 types de population (BGS,LRG,ELG).

De l'article suivant https://arxiv.org/pdf/0909.4544.pdf page 14, il y a l'équation suivante (63) :

Comme vous pouvez le voir, dans eq(63), il y a une somme sur chaque paire de types de population. Dans mon cas, j'ai 3 populations (BGS/LRG/ELG), donc le terme ##C^<-1>_## devrait avoir une taille de 4x4 (avec ##aa=BGSquad##, ##bb=LRGquad##, ##cc=ELGquad## et ##bc=LRGxELG##) comme ceci :

##0quad LRGquad LRG/ELGquad LRG/LRGxELG##

##0quad LRG/ELGquad ELGquad ELG/LRGxELG##

Mais si je prends eq(64), eq(65) et que je le compare avec la formule eq(63), je ne trouve pas l'expression du quatrième élément pour le facteur de spectre de puissance P_A, c'est-à-dire lorsque l'indice A=4.

En effet, si je suis ce qui est dit dans Paper, "où A,B étiquettent différentes paires de populations de traceurs"

Enfin, de votre point de vue, quelle est la taille de ##C^<-1>_##, c'est-à-dire 3x3 ou 4x4 ?

D'un autre côté, je pense que les termes non diagonaux sur une matrice de covariance 4x4 vont transférer des informations lorsque j'inverse celle-ci, et je ne peux donc additionner que ##C^<-1>_## sur 3 populations pour le couple (A,B). Je veux dire que leur contribution restera après l'inversion.

J'espère que vous comprendrez mon problème sur cette somme. Salutations

Pièces jointes


Introduction

En astronomie optique, la résolution angulaire la plus élevée est actuellement offerte par les interféromètres phase/amplitude combinant la lumière des télescopes séparés par des lignes de base jusqu'à quelques centaines de mètres. Des résultats alléchants montrent comment les disques stellaires commencent à se résoudre, révélant les étoiles comme une diversité d'objets individuels, bien que jusqu'à présent possible uniquement pour un petit nombre des plus grands. Des concepts ont été proposés pour étendre ces installations à des échelles d'un kilomètre ou plus, comme requis pour l'imagerie de surface d'étoiles brillantes avec des tailles typiques de quelques millisecondes d'arc. Cependant, leur réalisation reste difficile, à la fois en raison des stabilités optiques et atmosphériques requises dans une fraction d'une longueur d'onde optique, et de la nécessité de couvrir de nombreuses lignes de base interférométriques (étant donné que la lumière optique ne peut pas être copiée avec une phase retenue, mais doit être divisée et diluée par séparateurs de faisceaux pour obtenir des interférences entre plusieurs paires de télescopes). Alors que les problèmes atmosphériques pourraient être évités par les réseaux de télescopes dans l'espace, ils sont entravés par leur complexité et leur coût. Cependant, les problèmes atmosphériques peuvent être contournés en mesurant la cohérence d'ordre supérieur de la lumière par interférométrie d'intensité.

Dans ce qui suit, nous présentons une démonstration en laboratoire d'un réseau multi-télescopes pour vérifier la séquence de fonctionnement de bout en bout, de l'observation des sources en forme d'étoile à la reconstruction de leurs images.


2. Matrice de corrélation croisée du bruit

[9] La corrélation croisée du bruit dans les échantillons de visibilité (5) peut être arrangée dans la matrice de corrélation croisée CV = [σpσqρpq] = [〈ΔVkl ΔVmn*〉] de taille NR 2 × NR 2 où NR est le nombre de récepteurs. Pour évaluer cette matrice, la connaissance de la configuration (Y ou U) du capteur particulier est nécessaire : la corrélation croisée entre les visibilités mesurées par le kl et le mn les paires de récepteurs peuvent être trouvées si les visibilités des paires de récepteurs km et dans sont connus.

[10] Sur la base du résultat précédent, la variance dans l'estimation de la température de luminosité peut être calculée. Les visibilités mesurées sont liées à la température de brillance par la transformée de Fourier discrète à deux dimensions où F est l'opérateur de transformée de Fourier. Dans les calculs réels, le g-matrice [ Ruf et al., 1988 ] peut être utilisé à la place de F et de manière similaire aux procédures utilisées dans l'estimation des spectres, les résultats sont améliorés en diminuant les visibilités avant la transformation. Pour les cibles variant lentement comme l'humidité du sol ou la salinité des océans, l'effilement avec la fonction de Blackman est susceptible d'apporter les meilleurs résultats. Dans Bara et al. [1998] d'autres cônes ont également été étudiés.

[11] L'ordre des visibilités dans le C matrice est dictée par la configuration du tableau, tandis que l'ordre dans le F matrice est dictée par les échantillons dans le plan de fréquence spatiale. Néanmoins, les colonnes de F peuvent être interchangés pour qu'ils soient conformes à ceux de C. Soit ces permutations représentées par un T. Étant donné que les deux configurations (Y et U) sont redondantes, le T la matrice n'est pas carrée et les lignes de base redondantes mesurées doivent être moyennées : les colonnes de la matrice correspondant à la ligne de base redondante sont multipliées par 1/rr est le niveau de redondance (figures 1b et 1d). Sinon, chaque rangée de T en contient. Ces valeurs seront remplacées par les coefficients de réduction appropriés et la matrice sera marquée comme W.

[12] Si un vecteur de bruit de visibilité est une réalisation de bruit gaussien circulaire complexe indépendant unité-variance, il peut être transformé en vecteur de bruit intercorrélé par la factorisation de Cholesky de la matrice d'intercorrélation R H R = C de sorte que


2. Émergence de la fonction verte et diffusion multiple

[5] L'expression (3) ne diffère que par un facteur d'amplitude F à partir d'une fonction verte réelle entre les points X et oui. Une implication très importante de ce résultat est que la fonction de Green entre deux emplacements (ou au moins, les temps d'arrivée des différents trains d'ondes) peut être extraite du champ diffus avec une simple corrélation champ à champ moyennée soit sur une durée suffisamment longue durée ou une distribution de source suffisamment étendue.

[6] Tisserand et Lobkis [2001a] ont exposé les arguments ci-dessus et montré dans des expériences de laboratoire que la corrélation croisée moyenne filtrée de manière appropriée des champs à deux positions est la fonction de Green entre les deux points. Les mêmes arguments valent également pour un média ouvert [ Tisserand et Lobkis, 2004 ]. Sous l'hypothèse d'un caractère complètement aléatoire du champ d'onde, Snieder [2004] ont donné une interprétation géométrique des rayons de la reconstruction.

[7] Les arguments tels que ceux ci-dessus qui dépendent des hypothèses de champs diffus bien développés sont peut-être problématiques pour l'application à la sismologie parce que la distribution des tremblements de terre est discrète et inégale. De plus, la durée des séries temporelles disponibles est limitée par la dissipation et le bruit ambiant. On s'attend à des fluctuations de champ qui apparaissent dans la fonction de corrélation sous la forme d'un bruit superposé au signal déterministe attendu. Les petites arrivées d'énergie n'apparaîtront qu'après une très longue moyenne. Dans les applications pratiques avec le type de données disponibles, on s'attend donc à ne reconstruire que les parties les plus énergétiques de la fonction de Green.

[8] Des expériences de laboratoire avec des ultrasons et des simulations numériques permettent d'étudier la possibilité de reconstruire la fonction de Green dans des conditions proches de celles rencontrées en sismologie. Derode et al. [2003a , 2003b] ont proposé une interprétation de l'émergence de la fonction de Green exacte à partir de la corrélation croisée des champs reçus par deux capteurs passifs dans un milieu hétérogène. Leur argumentation repose sur une analogie du moyennage d'une fonction d'intercorrélation sur une série de sources avec une opération physique de retournement temporel réalisable en laboratoire [ Mouchard, 1992 Wu et al., 1992 ]. L'opération de corrélation croisée du signal produit par une source en S chez les récepteurs dans UNE et B est formellement équivalent à avoir une source dans UNE produisant des ondes enregistrées dans S, inversé dans le temps et réémis de S à enregistrer dans B [ Derode et al., 2003a ]. Cette dernière opération est exactement ce qui est réalisé dans un miroir à retournement temporel. Cette analogie montre comment la corrélation croisée est liée à la propagation des ondes physiques.

[9] Nous illustrons ce point par des simulations numériques réalisées dans un milieu acoustique bidimensionnel (2-D). Cette configuration est choisie car c'est une manière simple de décrire la propagation des ondes à la surface de la Terre. Nous résolvons l'équation d'onde en utilisant un code aux différences finies [ Tanter, 1999 Derode et al., 2001 ]. Le champ produit par chacune de plusieurs sources S est calculé en chaque point du milieu. On considère un milieu faiblement diffusant, où la distance de propagation est inférieure au libre parcours moyen de transport des ondes. Rappelons que le libre parcours moyen de transport je* est la distance typique après laquelle l'énergie diffusée d'une onde dans une direction particulière est répartie dans toutes les directions. La diffusion est causée par une distribution de petits diffuseurs rigides de rayon une. La vitesse de fond est de 3,3 km.s -1 . Le produit du nombre d'onde k par le rayon une est égal à 1. En suivant l'analogie de retournement du temps développée par Derode et al. [2003a] , nous choisissons de placer les sources S tout autour UNE (le point de référence au centre de la grille marqué d'une croix sur la figure 1a) afin de former l'équivalent d'un miroir parfait à retournement temporel. Cette configuration est représentée sur la figure 1a. Chaque source S envoie une impulsion large bande avec une fréquence centrale de 0,1 Hz. Les corrélations sont calculées entre le champ hSA(t) au point de référence UNE et le terrain hRS(t) à tout autre endroit R(X, oui) de la grille. La corrélation est moyennée sur l'ensemble des sources S. Le champ d'onde reconstruit par corrélations est affiché sur la figure 1 pour les temps de corrélation -30, 0 et 30 s. Temps t = 0 est le temps central des corrélations, lorsque toute l'énergie est focalisée dans UNE comme si UNE était une source. Aux temps négatifs, on observe un front d'onde convergent et un front d'onde divergent aux temps positifs. Ces fronts d'onde correspondent aux parties causale (temps positifs) et anticausale (temps négatifs) de la fonction de Green entre UNE et n'importe quel point R dans le milieu. La reconstruction presque parfaite de la fonction de Green (y compris les fronts d'onde convergents et divergents) est due à la distribution quasi idéale des sources autour de UNE, la longueur de la coda (aussi longue que le permettent les schémas numériques : 200 oscillations) et l'absence d'absorption. Cette expérience numérique montre que la corrélation croisée correspond à un processus physique et n'est pas un artifice de traitement du signal.

[10] Derode et al. [2003b] et Larose et al. [2004] ont montré le rôle de la diffusion multiple dans l'amélioration de l'efficacité de la reconstruction de la fonction de Green avec un nombre limité de sources et des durées d'enregistrement finies, dans des conditions plus proches de la sismologie. Comme en sismologie, la durée des enregistrements est limitée par la présence de bruit et par l'absorption, il faut faire une moyenne sur un ensemble de sources différentes pour espérer l'émergence de la fonction de Green. Les limites de la reconstruction seront discutées dans la section 3 après une application de ce principe simple à un ensemble de données de sismogrammes réels.


Contenu

La convolution de f et g s'écrit Fg , désignant l'opérateur avec le symbole ∗ . [B] Il est défini comme l'intégrale du produit des deux fonctions après que l'une a été inversée et décalée. En tant que tel, il s'agit d'un type particulier de transformée intégrale :

Une définition équivalente est (voir commutativité) :

Bien que le symbole t soit utilisé ci-dessus, il n'a pas besoin de représenter le domaine temporel. Mais dans ce contexte, la formule de convolution peut être décrite comme l'aire sous la fonction F(vous) pondéré par la fonction g(–vous) décalé du montant t . Lorsque t change, la fonction de pondération g(tvous) met l'accent sur différentes parties de la fonction d'entrée F(vous) .

Pour les fonctions f , g supportées uniquement sur [0, ∞) (c'est-à-dire zéro pour les arguments négatifs), les limites d'intégration peuvent être tronquées, ce qui donne :

Pour la formulation multidimensionnelle de la convolution, voir domaine de définition (au dessous de).

Notation Modifier

Une convention de notation d'ingénierie commune est : [2]

qui doit être interprété avec prudence pour éviter toute confusion. Par exemple, F(t)∗g(tt0) est équivalent à (Fg)(tt0) , mais F(tt0)∗g(tt0) est en fait équivalent à (Fg)(t − 2t0) . [3]

Dérivations Modifier

La convolution décrit la sortie (en termes d'entrée) d'une classe importante d'opérations appelées linéaire invariant dans le temps (LTI). Voir la théorie du système LTI pour une dérivation de la convolution résultant des contraintes LTI. En ce qui concerne les transformées de Fourier de l'entrée et de la sortie d'une opération LTI, aucune nouvelle composante de fréquence n'est créée. Les existants sont uniquement modifiés (amplitude et/ou phase). En d'autres termes, la transformée de sortie est le produit ponctuel de la transformée d'entrée avec une troisième transformée (appelée fonction de transfert). Voir le théorème de convolution pour une dérivation de cette propriété de convolution. Inversement, la convolution peut être dérivée comme la transformée de Fourier inverse du produit ponctuel de deux transformées de Fourier.

L'une des premières utilisations de l'intégrale de convolution est apparue dans la dérivation de D'Alembert du théorème de Taylor dans Recherches sur différents points importants du système du monde, publié en 1754. [4]

Aussi, une expression du type :

est utilisé par Sylvestre François Lacroix à la page 505 de son livre intitulé Traité des différences et des séries, qui est le dernier des 3 tomes de la série encyclopédique : Traité du calcul différentiel et du calcul intégral, Chez Courcier, Paris, 1797-1800. [5] Peu de temps après, des opérations de convolution apparaissent dans les œuvres de Pierre Simon Laplace, Jean-Baptiste Joseph Fourier, Siméon Denis Poisson, et d'autres. Le terme lui-même n'a pas été largement utilisé avant les années 1950 ou 1960. Avant cela, on l'appelait parfois Faltung (ce qui signifie pliant en allemand), produit de composition, intégrale de superposition, et Intégrale de Carson. [6] Pourtant, il apparaît dès 1903, bien que la définition soit assez peu familière dans les usages plus anciens. [7] [8]

est un cas particulier de produits de composition envisagés par le mathématicien italien Vito Volterra en 1913. [9]

Lorsqu'une fonction gT est périodique, de période T , alors pour les fonctions, f , telles que FgT existe, la convolution est aussi périodique et identique à :

t0 est un choix arbitraire. La sommation est appelée sommation périodique de la fonction f .

Lorsque gT est une sommation périodique d'une autre fonction, g , alors FgT est connu comme un circulaire ou alors cyclique convolution de f et g .

Et si la sommation périodique ci-dessus est remplacée par FT , l'opération est appelée périodique circonvolution de FT et gT .

Pour les fonctions à valeurs complexes F, g défini sur le plateau Z des nombres entiers, le circonvolution discrète de f et g est donnée par : [10]

La convolution de deux séquences finies est définie en étendant les séquences aux fonctions à support fini sur l'ensemble des entiers. Lorsque les séquences sont les coefficients de deux polynômes, alors les coefficients du produit ordinaire des deux polynômes sont la convolution des deux séquences d'origine. C'est ce qu'on appelle le produit de Cauchy des coefficients des suites.

Convolution discrète circulaire Modifier

Lorsqu'une fonction gN est périodique, avec une période N , alors pour les fonctions, f , telles que FgN existe, la convolution est aussi périodique et identique à :

La sommation sur k est appelée sommation périodique de la fonction f .

Si gN est une sommation périodique d'une autre fonction, g , alors FgN est connu comme une convolution circulaire de f et g .

Lorsque les durées non nulles de f et de g sont limitées à l'intervalle [0, N−1] , FgN se réduit à ces formes communes :

La notation ( FN g ) pour convolution cyclique désigne la convolution sur le groupe cyclique d'entiers modulo N .

La convolution circulaire survient le plus souvent dans le contexte d'une convolution rapide avec un algorithme de transformée de Fourier rapide (FFT).

Algorithmes de convolution rapide Modifier

Dans de nombreuses situations, les convolutions discrètes peuvent être converties en convolutions circulaires afin que des transformations rapides avec une propriété de convolution puissent être utilisées pour implémenter le calcul. Par exemple, la convolution de séquences de chiffres est l'opération du noyau dans la multiplication de nombres à plusieurs chiffres, qui peut donc être efficacement implémentée avec des techniques de transformation (Knuth 1997, §4.3.3.C von zur Gathen & Gerhard 2003, §8.2).

Éq.1 nécessite N opérations arithmétiques par valeur de sortie et N 2 opérations pour N sorties. Cela peut être considérablement réduit avec l'un des nombreux algorithmes rapides. Le traitement du signal numérique et d'autres applications utilisent généralement des algorithmes de convolution rapides pour réduire le coût de la convolution à une complexité O(Nlog N).

Les algorithmes de convolution rapide les plus courants utilisent des algorithmes de transformée de Fourier rapide (FFT) via le théorème de convolution circulaire. Plus précisément, la convolution circulaire de deux séquences de longueur finie est trouvée en prenant une FFT de chaque séquence, en multipliant par points, puis en effectuant une FFT inverse. Des convolutions du type défini ci-dessus sont ensuite efficacement mises en œuvre en utilisant cette technique en conjonction avec une extension nulle et/ou l'élimination de parties de la sortie. D'autres algorithmes de convolution rapides, tels que l'algorithme de Schönhage-Strassen ou la transformée de Mersenne, [12] utilisent des transformées de Fourier rapides dans d'autres anneaux.

Si une séquence est beaucoup plus longue que l'autre, l'extension nulle de la séquence la plus courte et la convolution circulaire rapide ne sont pas la méthode la plus efficace en termes de calcul disponible. [13] Au lieu de cela, la décomposition de la séquence plus longue en blocs et la convolution de chaque bloc permettent des algorithmes plus rapides tels que la méthode Overlap–save et la méthode Overlap–add. [14] Une méthode de convolution hybride qui combine des algorithmes de bloc et FIR permet une latence d'entrée-sortie nulle qui est utile pour les calculs de convolution en temps réel. [15]

La convolution de deux fonctions à valeurs complexes sur R est elle-même une fonction à valeurs complexes sur R , Défini par:

et n'est bien défini que si f et g décroissent suffisamment rapidement à l'infini pour que l'intégrale existe. Les conditions d'existence de la convolution peuvent être délicates, car une explosion de g à l'infini peut être facilement compensée par une décroissance suffisamment rapide de f . La question de l'existence peut donc impliquer différentes conditions sur f et g :

Fonctions supportées de manière compacte

Si f et g sont des fonctions continues à support compact, alors leur convolution existe, et est également à support compact et continue (Hörmander 1983, chapitre 1). Plus généralement, si l'une des fonctions (disons f ) est supportée de manière compacte et l'autre est localement intégrable, alors la convolution Fg est bien défini et continu.

La convolution de f et g est également bien définie lorsque les deux fonctions sont localement carrées intégrables sur R et appuyé sur un intervalle de la forme [une, +∞) (ou les deux supportés sur [−∞, une] ).

Fonctions intégrables Modifier

La convolution de f et g existe si f et g sont toutes deux des fonctions intégrables de Lebesgue dans L 1 ( R ), et dans ce cas Fg est également intégrable (Stein & Weiss 1971, Théorème 1.3). Ceci est une conséquence du théorème de Tonelli. Ceci est également vrai pour les fonctions de L 1 , sous la convolution discrète, ou plus généralement pour la convolution sur n'importe quel groupe.

De même, si FL 1 ( R ) et gL p ( R ) où 1 p ∞ , alors FgL p ( R ), et

Dans le cas particulier p = 1 , cela montre que L 1 est une algèbre de Banach sous la convolution (et l'égalité des deux côtés est vérifiée si f et g sont non négatifs presque partout).

Plus généralement, l'inégalité de Young implique que la convolution est une application bilinéaire continue entre L p les espaces. Plus précisément, si 1 p, q, r ∞ satisfaire :

de sorte que la convolution est une application bilinéaire continue de L p ×L q à L r . L'inégalité de Young pour la convolution est également vraie dans d'autres contextes (groupe de cercles, convolution sur Z ). L'inégalité précédente n'est pas nette sur la droite réelle : quand 1 < p, q, r < ∞ , il existe une constante Bp,q < 1 tel que :

La valeur optimale de Bp,q a été découvert en 1975 [16] et indépendamment en 1976, [17] voir l'inégalité de Brascamp-Lieb.

Une estimation plus forte est vraie à condition 1 < p, q, r < :

Fonctions de décroissance rapide Modifier

En plus des fonctions supportées de manière compacte et des fonctions intégrables, les fonctions qui ont une décroissance suffisamment rapide à l'infini peuvent également être convoluées. Une caractéristique importante de la convolution est que si F et g les deux se désintègrent rapidement, puis Fg décroît également rapidement. En particulier, si F et g sont des fonctions décroissantes rapidement, alors la convolution l'est aussi Fg. Combiné au fait que la convolution commute avec la différenciation (voir #Propriétés), il s'ensuit que la classe des fonctions de Schwartz est fermée par convolution (Stein & Weiss 1971, théorème 3.3).

Distributions Modifier

Dans certaines circonstances, il est possible de définir la convolution d'une fonction avec une distribution, ou de deux distributions. Si F est une fonction prise en charge de manière compacte et g est une distribution, alors Fg est une fonction lisse définie par une formule de distribution analogue à

Plus généralement, il est possible d'étendre la définition de la convolution d'une manière unique pour que la loi associative

reste valable dans le cas où F est une distribution, et g une distribution à support compact (Hörmander 1983, §4.2).

Mesures Modifier

La convolution de deux mesures de Borel μ et ν de variation bornée est la mesure μ ∗ ν définie par (Rudin 1962)

Ceci est en accord avec la convolution définie ci-dessus lorsque μ et sont considérés comme des distributions, ainsi qu'avec la convolution des fonctions L 1 lorsque μ et sont absolument continues par rapport à la mesure de Lebesgue.

La convolution des mesures satisfait également la version suivante de l'inégalité de Young

où la norme est la variation totale d'une mesure. Étant donné que l'espace des mesures de variation bornée est un espace de Banach, la convolution des mesures peut être traitée avec des méthodes standard d'analyse fonctionnelle qui peuvent ne pas s'appliquer à la convolution des distributions.

Propriétés algébriques Modifier

La convolution définit un produit sur l'espace linéaire des fonctions intégrables. Ce produit satisfait les propriétés algébriques suivantes, qui signifient formellement que l'espace des fonctions intégrables avec le produit donné par convolution est une algèbre associative commutative sans identité (Strichartz 1994, §3.3). D'autres espaces linéaires de fonctions, tels que l'espace des fonctions continues de support compact, sont fermés sous la convolution, et forment ainsi également des algèbres associatives commutatives.

En changeant la variable d'intégration en u = t − u le résultat suit.

Preuve : Cela découle de l'utilisation du théorème de Fubini (c'est-à-dire que les intégrales doubles peuvent être évaluées comme des intégrales itérées dans n'importe quel ordre).

Preuve : Cela découle de la linéarité de l'intégrale.

Associativité avec multiplication scalaire a ( f ∗ g ) = ( a f ) ∗ g

pour tout nombre réel (ou complexe) a .

Aucune algèbre de fonctions ne possède une identité pour la convolution. Le manque d'identité n'est généralement pas un inconvénient majeur, puisque la plupart des ensembles de fonctions sur lesquelles la convolution est effectuée peuvent être convolués avec une distribution delta (une impulsion unitaire, centrée à zéro) ou, à tout le moins (comme c'est le cas de L 1 ) admettent des approximations de l'identité. L'espace linéaire des distributions à support compact admet cependant une identité sous la convolution. Spécifiquement,

δ est la distribution delta.

Quelques répartitions S avoir un élément inverse S -1 pour la convolution qui doit alors satisfaire

à partir de laquelle une formule explicite pour S -1 peut être obtenu. L'ensemble des distributions inversibles forme un groupe abélien sous la convolution.

Intégration Modifier

Si F et g sont des fonctions intégrables, alors l'intégrale de leur convolution sur tout l'espace s'obtient simplement comme le produit de leurs intégrales :

Cela découle du théorème de Fubini. Le même résultat est valable si F et g sont seulement supposées être des fonctions mesurables non négatives, par le théorème de Tonelli.

Différenciation Modifier

/dx est la dérivée. Plus généralement, dans le cas de fonctions à plusieurs variables, une formule analogue vaut avec la dérivée partielle :

Une conséquence particulière de ceci est que la convolution peut être considérée comme une opération de « lissage » : la convolution de F et g est dérivable autant de fois que F et g sont au total.

Ces identités tiennent à la condition précise que F et g sont absolument intégrables et au moins l'un d'entre eux a une dérivée faible absolument intégrable (L 1 ), par suite de l'inégalité de convolution de Young. Par exemple, quand F est différentiable en continu avec un support compact, et g est une fonction arbitraire localement intégrable,

Ces identités tiennent aussi beaucoup plus largement au sens de distributions tempérées si l'une des F ou alors g est une distribution tempérée décroissante rapidement, une distribution tempérée à support compact ou une fonction de Schwartz et l'autre est une distribution tempérée. D'autre part, deux fonctions positives intégrables et infiniment différentiables peuvent avoir une convolution nulle part continue.

Dans le cas discret, l'opérateur de différence F(m) = F(m + 1) − F(m) satisfait une relation analogue :

D ( f g ) = ( D f ) ∗ g = f ∗ ( D ​​g ) .

Théorème de convolution Modifier

Équivariance translationnelle Modifier

La convolution commute avec les traductions, ce qui signifie que

où es-tuXf est la traduction de la fonction F par X Défini par

Si F est une fonction de Schwartz, alors vousXF est la convolution avec une fonction delta de Dirac traduite vousXF = FvousX δ. Ainsi, l'invariance par translation de la convolution des fonctions de Schwartz est une conséquence de l'associativité de la convolution.

De plus, sous certaines conditions, la convolution est l'opération invariante de traduction la plus générale. De manière informelle, ce qui suit tient

  • Supposer que S est un opérateur linéaire borné agissant sur des fonctions qui commutent avec des translations : S(vousXF) = vousX(Sf) pour tous X. Puis S est donné comme convolution avec une fonction (ou distribution) gS C'est Sf = gSF.

Ainsi, certaines opérations invariantes de traduction peuvent être représentées comme une convolution. Les convolutions jouent un rôle important dans l'étude des systèmes invariants dans le temps, et en particulier la théorie des systèmes LTI. La fonction de représentation gS est la réponse impulsionnelle de la transformation S.

Une version plus précise du théorème cité ci-dessus nécessite de spécifier la classe de fonctions sur laquelle la convolution est définie, et nécessite également de supposer en plus que S doit être un opérateur linéaire continu par rapport à la topologie appropriée. On sait, par exemple, que tout opérateur linéaire continu invariant à translation continue sur L 1 est la convolution avec une mesure de Borel finie. Plus généralement, tout opérateur linéaire continu invariant à translation continue sur L p pour 1 p < ∞ est la convolution à distribution tempérée dont la transformée de Fourier est bornée. A savoir, ils sont tous donnés par des multiplicateurs de Fourier bornés.

Si g est un groupe convenable doté d'une mesure , et si F et g sont des fonctions intégrables à valeurs réelles ou complexes sur g, alors nous pouvons définir leur convolution par

Il n'est pas commutatif en général. Dans les cas typiques d'intérêt g est un groupe topologique de Hausdorff localement compact et est une mesure de Haar (gauche). Dans ce cas, à moins que g est unimodulaire, la convolution ainsi définie n'est pas la même que ∫ f ( xy − 1 ) g ( y ) d ( y ) )g(y ),dlambda (y)>> . La préférence de l'un sur l'autre est faite pour que la convolution à fonction fixe g fait la navette avec traduction à gauche dans le groupe :

L h ( f g ) = ( L h f ) g .