Article de cette rubrique en cours de rédaction!
∴
Page publiée depuis la ville de Bénodet, dans le Finistère. © « Tous droits réservés » – 2019 par Cédric Christian Bernard Gagneux né le 19/07/64.
∴
III) UNE APPLICATION DES NOUVELLES EXPRESSIONS DE FONCTIONS CARACTÉRISTIQUES DES FONCTIONS LINÉAIRES PAR MORCEAUX
∴
« Les quantiles sont en statistiques et en théorie des probabilités les valeurs qui divisent un jeu de données en intervalles contenant le même nombre de données. Il y a donc un quantile de moins que le nombre de groupes créés. Ainsi les quartiles sont les trois quantiles qui divisent un ensemble de données en quatre groupes de taille égale. La médiane quant à elle est le quantile qui sépare le jeu de données en deux groupes de taille égale. » Extrait de « Quantile » de « Wikipédia » l’encyclopédie libre.
« Le quartile est calculé en tant que 4-quartiles.
le 1er quartile est la donnée de la série qui sépare les 25 % inférieurs des données (notation Q1) ;
le 2e quartile est la donnée de la série qui sépare les 50 % inférieurs des données (notation Q2) ; il est également appelé médiane ;
le 3e quartile est la donnée de la série qui sépare les 75 % inférieurs des données (notation Q3) ;
Par extension : le 0e quartile est la donnée de la série qui sépare les 0 % inférieurs des données (notation Q0, c’est le minimum) et le 4e quartile est la donnée de la série qui sépare les 0 % supérieurs des inférieurs des données (notation Q4, c’est le maximum).
Dans le cas discret, on range les données par ordre croissant : s’il y a N valeurs :
- « le quartile zéro (minimum) est celui qui a le rang 1
- le premier quartile est celui qui a le rang (N)/4
- la deuxième quartile (médiane) est celui qui a le rang (2N+2)/4 que l’on simplifie en (N+1)/2
- le troisième quartile est celui qui a le rang (3N)/4
- le quatrième quartile est celui qui a le rang N. »
» Extrait de « Quartile » de « Wikipédia » l’encyclopédie libre.
∴
3.1) Les fonctions des plus grands ou des plus petits éléments d’une suite de nombres
∴
Une application du processus élaboré précédemment de systématisation de l’expression de la fonction linéaire par morceaux à toutes fonctions linéaires par morceaux dont l’expression générale est le résultat d’une opération arithmétique entre une ou plusieurs des expressions numérotées de (1) à (14 »’), est l’expression de la fonction des plus grands éléments au maximum de toutes suites de nombres, ou bien la fonction des plus petits éléments au maximum de toutes suites de nombres, c’est-à-dire la liste des plus grands ou des plus petits éléments avec répétition de cette suite et dont le nombre de ces éléments est inférieure à une valeur que nous préciserons ultérieurement lors du processus de l’élaboration de l’expression de ces fonctions, et les deux fonctions du plus grand ou du plus petit élément de toutes suites de nombres, soit éventuellement, mais plus restrictivement, la liste du plus grand ou du plus petit élément avec répétition de cette suite de nombres, donc quatre fonctions notées respectivement, Pgeltsmax(SeqA), Ppeltsmax(SeqA), Pgelt(SeqA) et Ppelt(SeqA) que nous définirons ultérieurement en écrivant la formule de leurs expressions respectives, car il nous faut d’abord exposer une sous application de ce même processus élaboré précédemment de systématisation de l’expression de la fonction linéaire par morceaux à toutes fonctions linéaires par morceaux, soit, l’application à toutes suites de nombres des « quantiles » qui sont définies « en statistiques et en théorie des probabilités les valeurs qui divisent un jeu de données en intervalles contenant le même nombre de données« , et plus particulièrement si « les quartiles sont les trois quantiles qui divisent un ensemble de données en quatre groupes de taille égale dont la médiane quant à elle est le quantile qui sépare le jeu de données en deux groupes de taille égale« , et que nous définirons donc par extension à toutes suites de nombres comme étant les valeurs des moyennes arithmétiques qui divisent une suite de nombres en intervalles contenant les éléments inférieurs ou égaux à ces valeurs de moyennes que nous considérerons être au nombre de quantité de 3, soit un concept similaire, car par extension à celui de ce nombre particulier encore définie en statistique et et en théorie des probabilités comme le « quartile » qui est « chacune des trois valeurs qui divisent les données triées en quatre parts égales, de sorte que chaque partie représente 1/4 de l’échantillon de population ». Mais si dans le cas discret de la méthode de calcul des quartiles, les données sont rangées par ordre croissant, comme nous ne donnerons pas dans cette rubrique, mais dans une rubrique dédiée ultérieurement l’expression générale de cette nouvelle fonction de tri par ordre croissant des éléments de toutes suites de nombres, donc nous n’utiliserons pas les formules des expressions conventionnelles copiées au début de notre rubrique, mais nous utiliserons les expressions définies comme suit:
Soit la moyenne arithmétique d’une liste de nombres réels, c’est-à-dire la suite de nombres réels xₙ qui sont les éléments de la suite notée en général SeqA, cette moyenne arithmétique étant la somme des valeurs de la suite de nombres SeqA divisée par le nombre de valeurs de cette suite de nombres, notée μ et soit la fonction caractéristique définie comme suit:
1A: E→ {0,1}
- 1A(xₙ<=μ)=0, si xₙ>μ
- 1A(xₙ<=μ)=1, si xₙ<=μ
L’expression de cette fonction caractéristique 1A(xₙ<=μ)=μ(xₙ), est définie comme suit:
∀ xₙ ∈ SeqA ⊂ R, ∀ μ ∈ R, avec μ=(∑n=1→n=∞: xₙ)/(∑n=1→n=∞: ₙ): μ(xₙ)=1A(xₙ<=μ)=1-⌈(⌈(xₙ-μ)/(|xₙ-μ|+1)⌉)+⌈(-xₙ+μ)/(|-xₙ+μ|+1)⌉)⌉+⌈(-xₙ+μ)/(|-xₙ+μ|+1)⌉ (5).
Nous multiplierons ensuite l’expression (5), donc la formule de la fonction caractéristique 1A(xₙ<=μ), par les valeurs de la suite de nombre SeqA, soit 1A(xₙ<=μ)*xₙ, dont l'expression est définie comme suit:
∀ xₙ ∈ SeqA ⊂ R, ∀ μ ∈ R, μ(xₙ)*xₙ=1A(xₙ<=μ)*xₙ=(1-⌈(⌈(xₙ-μ)/(|xₙ-μ|+1)⌉)+⌈(-xₙ+μ)/(|-xₙ+μ|+1)⌉)⌉+⌈(-xₙ+μ)/(|-xₙ+μ|+1)⌉)*xₙ (6).
Nous considérons maintenant l’expression inverse de la fonction caractéristique précédente, soit 1-1A(xₙμ)=1-μ(xₙ), donc soit l’expression de la nouvelle fonction caractéristique définie comme suit:
1A: E→ {0,1}
- 1A(xₙ>μ)=0, si xₙ<=μ
- 1A(xₙ>μ)=1, si xₙ>μ
L’expression de cette fonction caractéristique 1-1A(xₙ<=μ)=1A(xₙ>μ)=1-μ(xₙ), est définie comme suit:
∀ xₙ ∈ SeqA ⊂ R, ∀ μ ∈ R, 1-μ(xₙ)=1-1A(xₙ<=μ)=1A(xₙ>μ)=⌈(⌈(xₙ-μ)/(|xₙ-μ|+1)⌉)+⌈(-xₙ+μ)/(|-xₙ+μ|+1)⌉)⌉-⌈(-xₙ+μ)/(|-xₙ+μ|+1)⌉ (7).
Comme précédemment nous multiplierons ensuite l’expression (7), donc la formule de la fonction caractéristique 1A(xₙ>μ), par les valeurs de la suite de nombre SeqA, soit 1A(xₙ>μ)*xₙ, dont l’expression est définie comme suit:
∀ xₙ ∈ SeqA ⊂ R, ∀ μ ∈ R, 1-μ(xₙ)=(1-1A(xₙ<=μ))*xₙ=1A(xₙ>μ)*xₙ=(⌈(⌈(xₙ-μ)/(|xₙ-μ|+1)⌉)+⌈(-xₙ+μ)/(|-xₙ+μ|+1)⌉)⌉-⌈(-xₙ+μ)/(|-xₙ+μ|+1)⌉)*xₙ (8).
∴
Ensuite, soit les deux nouvelles moyennes arithmétiques μ₁=(∑n=1→n=∞: 1A(xₙ<=μ)*xₙ)/(∑n=1→n=∞: 1A(xₙ<=μ)) et μ₂=(∑n=1→n=∞: (1-1A(xₙ<=μ))*xₙ )/(∑n=1→n=∞: 1-1A(xₙ<=μ)) et soit la première fonction caractéristique définie comme suit:
1A: E→ {0,1}
- 1A(xₙ<μ₁)=0, si xₙ>=μ₁
- 1A(xₙ<μ₁)=1, si xₙ<μ₁
L’expression de cette fonction caractéristique 1A(xₙ<μ₁)=μ₁(xₙ), est définie comme suit:
∀ xₙ ∈ SeqA ⊂ R, ∀ μ₁ ∈ R, avec μ₁=(∑n=1→n=∞: 1A(xₙ<=μ)*xₙ)/(∑n=1→n=∞: 1A(xₙ<=μ)):
μ₁(xₙ)=1A(xₙ<μ₁)=⌈(-xₙ+μ₁)/(|-xₙ+μ₁|+1)⌉ (9).
Nous multiplierons ensuite l’expression (9), donc la formule de la fonction caractéristique 1A(xₙ<μ₁), par les valeurs de la suite de nombre SeqA, soit 1A(xₙ<μ₁)*xₙ, dont l’expression est définie comme suit:
∀ xₙ ∈ SeqA ⊂ R, ∀ μ₁ ∈ R, avec μ₁=(∑n=1→n=∞: 1A(xₙ<=μ)*xₙ)/(∑n=1→n=∞: 1A(xₙ<=μ)):
μ₁(xₙ)*xₙ=1A(xₙ<μ₁)*xₙ=(⌈(-xₙ+μ₁)/(|-xₙ+μ₁|+1)⌉)*xₙ (10), dont la représentation de cette expression est la sous suite de nombres notée Q₄ conceptuellement correspondant à notre définition précédente du dernier « quartile » d’une suite de nombres, un concept similaire à celui défini en statistique et et en théorie des probabilités comme le « quartile » qui est « chacune des trois valeurs qui divisent les données triées en quatre parts égales, de sorte que chaque partie représente 1/4 de l’échantillon de population », et cette dernière définition transposée à une sous suite de nombres devient chacune des quatre moyennes arithmétiques particulières qui divisent les données d’une suite de nombre en quatre parts autour de la première moyenne arithmétique.
∴
Nous considérons maintenant l’expression de la deuxième fonction caractéristique précédente, soit 1A(xₙ>=μ₂) donc soit l’expression de la nouvelle fonction caractéristique définie comme suit:
1A: E→ {0,1}
- 1A(xₙ>=μ₂)=0, si xₙ<μ₂
- 1A(xₙ>=μ₂)=1, si xₙ>=μ₂
L’expression de cette fonction caractéristique 1A(xₙ>=μ₂)=μ₂(xₙ), est définie comme suit:
∀ xₙ ∈ SeqA ⊂ R, ∀ μ₂ ∈ R, avec μ₂=(∑n=1→n=∞: (1-1A(xₙ<=μ))*xₙ )/(∑n=1→n=∞: 1-1A(xₙ<=μ)):
μ₂(xₙ)=1A(xₙ>=μ₂)=1-⌈(-xₙ+μ₂)/(|-xₙ+μ₂|+1)⌉ (11).
Comme précédemment nous multiplierons ensuite l’expression (11), donc la formule de la fonction caractéristique 1A(xₙ>=μ₂), par les valeurs de la suite de nombre SeqA, soit 1A(xₙ>=μ₂)*xₙ, dont l’expression est définie comme suit:
∀ xₙ ∈ SeqA ⊂ R, ∀ μ₂ ∈ R, avec μ₂=(∑n=1→n=∞: (1-1A(xₙ<=μ))*xₙ )/(∑n=1→n=∞: 1-1A(xₙ<=μ)):
(μ₂(xₙ))*xₙ=(1A(xₙ>=μ₂))*xₙ=1A(xₙ>=μ₂)*xₙ=(1-⌈(-xₙ+μ₂)/(|-xₙ+μ₂|+1)⌉)*xₙ (12), dont la représentation de cette expression est la sous suite de nombres notée Q₁ conceptuellement correspondant à notre définition précédente du premier « quartile » d’une suite de nombres, un concept similaire à celui défini en statistique et et en théorie des probabilités comme le « quartile » qui est « chacune des trois valeurs qui divisent les données triées en quatre parts égales, de sorte que chaque partie représente 1/4 de l’échantillon de population », et cette dernière définition transposée à une sous suite de nombres devient chacune des quatre moyennes arithmétiques particulières qui divisent les données d’une suite de nombres en quatre parts autour de la première moyenne arithmétique.
∴
Soit la fonction caractéristique définie comme suit:
1A’: E→ {0,1}
- 1A'(xₙ<=μ)=0, si xₙ>μ
- 1A'(xₙ<=μ)=1, si xₙ<=μ
L’expression de cette fonction caractéristique 1A'(xₙ<=μ)=μ(xₙ), est définie comme suit:
∀ xₙ ∈ SeqA ⊂ R, ∀ μ ∈ R avec μ=(∑n=1→n=∞: xₙ)/(∑n=1→n=∞: ₙ); ∀ μ₁ ∈ R, avec μ₁=(∑n=1→n=∞: 1A(xₙ<=μ)*xₙ)/(∑n=1→n=∞: 1A(xₙ<=μ)):
μ'(xₙ)=1A'(xₙ<=μ)=1-⌈(⌈(xₙ–μ)/(|xₙ–μ|+1)⌉)+⌈(-xₙ+μ)/(|-xₙ+μ|+1)⌉)⌉+⌈(-xₙ+μ)/(|-xₙ+μ|+1)⌉-⌈(-xₙ+μ₁)/(|-xₙ+μ₁|+1)⌉ (13).
Nous multiplierons ensuite l’expression (13), donc la formule de la fonction caractéristique 1A'(xₙ<=μ), par les valeurs de la suite de nombre SeqA, soit 1A'(xₙ<=μ)*xₙ, dont l'expression est définie comme suit:
∀ xₙ ∈ SeqA ⊂ R, ∀ μ ∈ R, avec μ=(∑n=1→n=∞: xₙ)/(∑n=1→n=∞: ₙ); ∀ μ₁ ∈ R, avec μ₁=(∑n=1→n=∞: 1A(xₙ<=μ)*xₙ)/(∑n=1→n=∞: 1A(xₙ<=μ)):
μ'(xₙ)*xₙ=1A'(xₙ<=μ)*xₙ=(1-⌈(⌈(xₙ–μ)/(|xₙ–μ|+1)⌉)+⌈(-xₙ+μ)/(|-xₙ+μ|+1)⌉)⌉+⌈(-xₙ+μ)/(|-xₙ+μ|+1)⌉-⌈(-xₙ+μ₁)/(|-xₙ+μ₁|+1)⌉)*xₙ (14), dont la représentation de cette expression est la sous suite de nombres notée Q₃, conceptuellement correspondant à notre définition précédente du troisième « quartile » d’une suite de nombres, un concept similaire à celui défini en statistique et et en théorie des probabilités comme le « quartile » qui est « chacune des trois valeurs qui divisent les données triées en quatre parts égales, de sorte que chaque partie représente 1/4 de l’échantillon de population », et cette dernière définition transposée à une sous suite de nombres devient chacune des quatre moyennes arithmétiques particulières qui divisent les données d’une suite de nombre en quatre parts autour de la première moyenne arithmétique.
∴
Soit la fonction caractéristique définie comme suit:
1A’: E→ {0,1}
- 1A'(xₙ<=μ₂)=0, si xₙ>μ₂
- 1A'(xₙ<=μ₂)=1, si xₙ<=μ₂
L’expression de cette fonction caractéristique 1A'(xₙ<=μ₂)=μ’₂(xₙ), est définie comme suit:
∀ xₙ ∈ SeqA ⊂ R, ∀ μ ∈ R avec μ=(∑n=1→n=∞: xₙ)/(∑n=1→n=∞: ₙ); ∀ μ₁ ∈ R, avec μ₁=(∑n=1→n=∞: 1A(xₙ<=μ)*xₙ)/(∑n=1→n=∞: 1A(xₙ<=μ)); ∀ μ₂ ∈ R, avec μ₂=(∑n=1→n=∞: (1-1A(xₙ<=μ))*xₙ )/(∑n=1→n=∞: 1-1A(xₙ<=μ)):
μ’₂(xₙ)=1A'(xₙ<=μ₂)=1-(1A(xₙ>=μ₂)+1A(xₙ<μ₁)+1A'(xₙ<=μ)) =⌈(|xₙ|+1)/(|xₙ|+1)⌉ – ( (1-⌈(⌈(xₙ–μ)/(|xₙ–μ|+1)⌉)+⌈(-xₙ+μ)/(|-xₙ+μ|+1)⌉)⌉+⌈(-xₙ+μ)/(|-xₙ+μ|+1)⌉-⌈(-xₙ+μ₁)/(|-xₙ+μ₁|+1)⌉) + ⌈(-xₙ+μ₁)/(|-xₙ+μ₁|+1)⌉ + 1-⌈(-xₙ+μ₂)/(|-xₙ+μ₂|+1)⌉ ) (15).
Nous multiplierons ensuite l’expression (15), donc la formule de la fonction caractéristique 1A'(xₙ<=μ₂), par les valeurs de la suite de nombre SeqA, soit 1A'(xₙ<=μ₂)*xₙ, dont l’expression est définie comme suit:
∀ xₙ ∈ SeqA ⊂ R, ∀ Sn ∈ N, avec le nombre de valeurs de SeqA, Sn=(∑n=1→n=∞: ₙ); ∀ μ ∈ R, avec μ=(∑n=1→n=∞: xₙ)/(∑n=1→n=∞: ₙ); ∀ μ₁ ∈ R, avec μ₁=(∑n=1→n=∞: 1A(xₙ<=μ)*xₙ)/(∑n=1→n=∞: 1A(xₙ<=μ)); ∀ μ₂ ∈ R, avec μ₂=(∑n=1→n=∞: (1-1A(xₙ<=μ))*xₙ )/(∑n=1→n=∞: 1-1A(xₙ<=μ)):
μ’₂(xₙ)*xₙ=1A'(xₙ<=μ₂)*xₙ=(1-(1A(xₙ>=μ₂)+1A(xₙ<μ₁)+1A'(xₙ<=μ)))*xₙ=(⌈(|xₙ|+1)/(|xₙ|+1)⌉ –( (1-⌈(⌈(xₙ–μ)/(|xₙ–μ|+1)⌉)+⌈(-xₙ+μ)/(|-xₙ+μ|+1)⌉)⌉+⌈(-xₙ+μ)/(|-xₙ+μ|+1)⌉-⌈(-xₙ+μ₁)/(|-xₙ+μ₁|+1)⌉) + ⌈(-xₙ+μ₁)/(|-xₙ+μ₁|+1)⌉ + 1-⌈(-xₙ+μ₂)/(|-xₙ+μ₂|+1)⌉ ))*xₙ (16), dont la représentation de cette expression est la sous suite de nombres notée Q2, conceptuellement correspondant à notre définition précédente du deuxième « quartile » d’une suite de nombres, un concept similaire à celui défini en statistique et et en théorie des probabilités comme le « quartile » qui est « chacune des trois valeurs qui divisent les données triées en quatre parts égales, de sorte que chaque partie représente 1/4 de l’échantillon de population », et cette dernière définition transposée à une sous suite de nombres devient chacune des quatre moyennes arithmétiques particulières qui divisent les données d’une suite de nombre en quatre parts autour de la première moyenne arithmétique.
∴
Finalement, nous obtenons la formule de l’expression des fonctions notées respectivement, Pgeltsmax(SeqA), Ppeltsmax(SeqA), par un processus d’itération de l’ensemble des fonctions caractéristiques utilisées précédemment pour obtenir les sous suites Q₁>Q₂>Q₃>Q₄, un processus d’itération étant définie en mathématiques comme se référant au processus d’itération d’une fonction, c’est-à-dire, appliquer une fonction à plusieurs reprises, en utilisant la même itération à la sortie qu’à l’entrée, mais que nous n’appliquerons plus sur le domaine de l’ensemble des éléments appartenant à la suite de nombres notée en général SeqA symbolisant toutes suites de nombres, mais sur le domaine de l’ensemble des éléments appartenant à la sous suite de nombres de SeqA notée Q1 qui devient donc comme SeqA précédemment subdivisée en 4 quartiles correspondants aux sous suites de nombres de SeqA Q’₁>Q’₂>Q’₃>Q’₄, avec Q’₁ la sous suite de nombres de SeqA correspondant au résultat de l’ensemble des éléments de la fonction Pgeltsmax(SeqA), et sur le domaine de l’ensemble des éléments appartenant à la sous suite de nombres de SeqA notée Q₄, qui devient donc aussi comme SeqA précédemment subdivisée en 4 quartiles correspondants aux sous suites de nombres de SeqA Q »₄<Q »₃<Q »₂<Q »₁, avec Q »₄ la sous suite de nombres de SeqA correspondant au résultat de l’ensemble des éléments de la fonction Ppeltsmax(SeqA).
∴
Enfin, ayant maintenant élaboré le processus général de l’expression de ces deux fonctions Pgeltsmax(SeqA) et Ppeltsmax(SeqA), nous pouvons comme nous l’avions précédemment écrit au tout début de cette rubrique, préciser quel est le nombre minimal des éléments de cette liste des plus grands ou des plus petits éléments avec répétition de cette suite de nombres résultants de l’application des ces deux fonctions à la suite de nombres notée SeqA dont le nombre de leurs éléments respectif est inférieur à une valeur égale au nombre d’éléments de la sous suite résultante de l’avant-dernière itération du processus décrit ci-dessus avant l’obtention d’une sous suite de nombres « quartile » dont l’unique élément éventuellement avec répétition correspond au plus grand ou au plus petit élément de la suite de nombre SeqA, soit le résultat des fonctions Pgelt(SeqA) et Ppelt(SeqA).
∴
3.2) Les fonctions du plus grand ou du plus petit élément d’une suite de nombres
∴
« Un z-score est le nombre d’écarts types par rapport à la moyenne d’un point d’information. Quoi qu’il en soit, il s’agit en fait d’une proportion du nombre d’écarts-types en dessous ou au-dessus de la population que représente un score brut. Un score z est autrement appelé un score standard et peut très bien être placé sur un coude de dispersion ordinaire. Les scores Z s’étendent de – 3 écarts types (qui tomberaient à l’extrême gauche du coude d’appropriation ordinaire) jusqu’à + 3 écarts types (qui tomberaient à la droite la plus éloignée du coude de dispersion ordinaire). Pour utiliser un score z, il faut connaître la moyenne μ et en outre l’écart-type de la population σ. » Extrait de « Qu’est-ce qu’un Z-Score ? » de « l’équipe de La Science Des Données » .