À propos de Georg Cantor et des nombres transfinis Jérôme Delangue, 12 décembre 20079 août 2023 Le monde moderne — ou plutôt « postmoderne », pardon ! — est un monde qui invite à se poser la question [comme l’eut formulée Arthur Koestler] du « zéro et de l’infini » : Les nombres transfinis. Georg Cantor. 1) Comment construire les irrationnels (à partir des rationnels) ? Deux méthodes : Dedekind définit les réels par la notion de « coupure » entre deux ensembles. Exemple : Soit l’ensemble A qui contient tout x tel que > 2 ;Soit l’ensemble B qui contient tout y tel que y < 2La « coupure » entre les ensembles A et B correspond au réel Cantor définit les réels comme autant de limites de suites de Cauchy [1] non convergentes dans Q. Exemple : La suite définie par [u(0) = 1] et [u(n+1) =1+ 1/u(n)] Les premiers termes sont donc 1, 2, , , etc …Sa limite dans R est le nombre d’or : La définition de Dedekind est intéressante dans la mesure où elle permet d’échapper aux questions relatives aux développement décimaux infinis. Elle pose toutefois une difficulté : il est très difficile de soumettre ces « coupures » aux opérations arithmétiques élémentaires ; problème qui ne se rencontre pas avec les suites de Cauchy. Cependant, la définition cantorienne implique qu’on se penche sur la notion d’infini : si l’infini actuel n’existe pas en mathématiques, l’idée d’une limite qui ne se rencontre qu’à l’infini s’en trouve plus que fragilisée et l’on peut alors se demander si les irrationnels existent vraiment et s’ils méritent d’appartenir aux nombres « réels ». 2) Existe t’il un infini en acte ? Aristote refusait l’idée d’un infini en acte : il est vrai que l’idée d’un corps infini soulève la question de savoir dans quoi ce trouve ce corps. S’il se trouve dans un espace qui le contient, alors cet espace en constitue la limite, ce qui est contraire à l’idée d ‘infini. Cependant, il n’y a aucune raison pour que la construction des objets mathématiques soit subordonnée aux possibilités ou impossibilités du monde matériel. D’autres objections surgissent de ce que les propriétés des nombres finis ne se retrouvent pas dans les nombres infinis.Ainsi, les nombres infinis ne sont ils ni pairs ni impairs : ils ne peuvent s’écrire sous la forme (ω = 2x) ni sous la forme (ω = 2x +1) Par ailleurs, l’idée d’un ensemble infini en acte fait surgir un paradoxe apparent au regard des propriétés des nombres finis :En effet, pour tout ensemble finis le « Tout est plus grand que la partie ».Or, l’ensemble des entiers pairs, ou des carrés ou des cubes, etc.., est aussi grand que l’ensemble des entiers. La démonstration passe par la mise en évidence d’une bijection entre ces divers ensembles.Pour tout entier n, il existe un entier pair égal à 2n et inversement, pour tout nombre pair m, il existe un entier p tel que p = Pour tout entier n, il existe , ou , etc… et inversement… Cependant, ce n’est là qu’un faux paradoxe et Dedekind s’appuiera justement sur cette caractéristique pour définir les ensembles infinis : « Est infini tout ensemble susceptible d’être mis en bijection avec au moins une de ses parties ». En définitive, rien n’empêche de construire une nouvelle catégorie de nombres, les nombres transfinis, dans la mesure où :1) Leur construction respecte le principe de non contradiction.2) Ils sont rigoureusement définis. 3 – La construction des ordinaux transfinis. Comme ce qui précède le suggère, les nombres sont des ensembles. Nous n’avons besoin pour commencer la suite des entiers naturels que de l’ensemble vide, auquel est associé le nombre zéro. Cet ensemble vide est ensuite considéré comme élément d’un ensemble auquel est associé le nombre un ; le zéro et le un ainsi obtenus permettent de construire un nouvel ensemble auquel est associé le nombre deux et ainsi de suite : : 0* : 1 : 2 : 3Etc… On remarque donc que : 1 2 3 etc… *Le premier principe d’engendrement consiste donc simplement dans l’ajout d’une unité à l’ensemble précédent. * REMARQUE (1) : 0 n’est pas considéré par Cantor comme un vrai nombre (cf Jean-Pierre Belna, Cantor, Paris, Les Belles Lettres,. (Coll. Figures du savoir) 2000, 238 p.). Voir la remarque suivante pour une explication possible. Qu’est-ce qu’un nombre ordinal ? Sans trop entrer dans les détails, rappelons que les mots « premier », « deuxième », « troisième », etc. s’appellent des adjectifs numéraux ordinaux. La notion d’ordinal fait donc intervenir la notion d’ordre.Pour tout ensemble fini, l’ordinal correspondant coïncide avec son cardinal, c’est à dire son nombre d’éléments.C’est pour les nombres infinis qu’une distinction s’impose (voir remarque suivante).Le deuxième principe d’engendrement consiste en un « passage à la limite » : il autorise à considérer l’ensemble des entiers naturels comme une totalité achevée, pour poser ensuite l’existence du premier ordinal immédiatement supérieur à tous les autres.On le note : ω .On remarquera qu’à l’instar de 0, ω n’a pas de prédécesseur immédiat, c’est à dire que quelque soit n, entier naturel, il existe une infinité d’entiers naturels entre lui et ω ; on le nomme « ordinal limite ». Les nombres construits par la seule application du premier principe d’engendrement forment la Classe I, ce sont les entiers finis. ω est l’ordinal des nombres de Classe I et est le premier ordinal de Classe II.Par application alternée du premier et du deuxième principes d’engendrement, on construit les ordinaux transfinis de Classe II : ω, ω + 1, ω + 2, …, ω + n, … REMARQUE (2) : ω et ω + 1 contiennent le même nombre d’éléments : ils ont le même cardinal. Cependant ils ne désignent pas le même type d’ordre ; en effet ω n’a pas de prédécesseur alors que ω + 1 en a un (qui est ω).L’ordinal ω + 1 est donc l’ordinal de l’ensemble obtenu en ajoutant l’ensemble 1 à la suite de l’ensemble ω : si Cantor avait considéré 0 comme un vrai nombre (ce que fait Frege), l’ordinal de l’ensemble ainsi obtenu serait égal à ω+2.En effet :ω +1= 1,2,3,4……,n,…., ω, 1 : l’ordinal correspondant est bien ω + 1Si 0 avait été considéré comme un nombre, l’ensemble désigné par 1 contiendrait deux éléments : 0,1On auraitω + 1= 0,1,2,3,4……,n,…., ω,0,1 : l’ordinal correspondant serait alors ω+ 2 Puis, nouveau passage à la limite par application du deuxième principe : ω + ω = ω.2 Par application du premier principe on obtient : ω.2 + 1, ω.2 + 2,…, ω.2 + n,… On obtient de la sorte : ω.3,…,ω.4,…,ω.ω = ,…,ω3,…,..,..Cantor invoque ensuite un troisième principe, appelé principe de limitation permettant de considérer l’ensemble des ordinaux de Classe II comme une totalité achevée, et d’ouvrir une possibilité pour les ordinaux de Classe III. Quelques remarques sur les propriétés des ordinaux transfinis de Classe II. L’addition et la multiplication des ordinaux sont associatives mais non commutatives.Par exemple : 1 + ω = 1, 1, 2, 3, …, ω. Le nombre ordinal de l’ensemble obtenu en additionnant à l’ensemble (1) l’ensemble (ω) est donc ω En revanche : ω + 1 = 1, 2, 3, …, ω, ω + 1. De même :ω 2 = ω + ω = 1, 2, 3, …, ω, ω + 1, ω + 2, ω + 3, …, ω + ω.Alors que :2ω = 1,2,1,2,1,2,1,2 … = ω. Le paradoxe de Burali-Forti Soit Ω l’ordinal de tous les ordinaux, c’est à dire que Ω est plus grand que tout ordinal. Mais si Ω est un ordinal, alors (Ω + 1) l’est aussi. On a donc Ω (Ω + 1) ; mais également (Ω + 1) Ω, puisque Ω est l’ordinal de TOUS les ordinaux.Autre formulation : L’ensemble de tous les ordinaux ne possède pas lui-même d’ordinal du fait que cet ordinal doit être nécessairement plus grand que chacun des membres de cet ensemble qui, par là même et en dépit de sa définition, ne contient pas cet ordinal. Autre formulation : « » exprime une relation d’ordre strict, c’est à dire que si R(a,b) alors ¬R(b, a).D’où : xx Ainsi, [∀α θ(α) → ¬ (α∈α)] où θ exprime la propriété « être un cardinal » Si Ω = ∀α θ(α) , alors ¬θ(Ω)En effet, si θ(Ω) alors ΩΩ mais comme « » exprime une relation d’ordre strict alors : ΩΩ 4) Les nombres cardinaux Tous les ordinaux de la Classe II, s’ils désignent des types d’ordre différents, contiennent néanmoins le même nombre d’éléments : ils possèdent le même cardinal.Cantor nomme le cardinal des ensembles dénombrables : Or, si l’ensemble des entiers naturels a la puissance du dénombrable, on peut démontrer que l’ensemble des réels est strictement plus grand. En effet, supposons d’abord qu’il existe une bijection entre et : [L’indice en bas indique avec quel entier naturel le réel est en bijection. L’indice du haut indique la position du chiffre après la virgule. Remarque : Quelques précautions doivent être prises pour éviter qu’un nombre de n’ait la forme 0, 9999999… qui est égal à 1.En effet, si x = 0,99999… alors 10x = 9,99999 … et (10x – x) = 9x = 9, d’où x = 1.Autre démonstration : 1 = 3× et = 0,3333… d’où : 3× = 3 × 0,3333… = 0,9999…] La liste étant supposée achevée, on peut construire un nouveau réel, compris entre 0 et 1, qui ne s’y trouve pas : 0, …, où :≠ ≠ ≠ L’ensemble des réels est donc strictement plus grand que l’ensemble il a la puissance du continu dont Cantor suppose que le cardinal est . Cette supposition selon laquelle est le cardinal de et est immédiatement supérieur à , appelée « hypothèse du continu », a été démontrée « indécidable » en 1966 par Cohen : elle et sa contradictoire son compatibles avec les autres axiomes de l’arithmétique. Le paradoxe du plus grand cardinal. Dès lors qu’à partir d’un ensemble donné on peut construire un ensemble plus grand qui correspondra à l’ensemble de ses parties, on peut supposer une suite infinie d’alephs : , , …, , etc… Le fait que l’ensemble des parties d’un ensemble ait un plus grand cardinal que cet ensemble lui même peut sembler évident pour les ensembles finis ; il l’est peut être moins pour les ensembles infinis. Voici donc une démonstration valable (?) pour tout ensemble : Supposons que l’ensemble E possède autant d’éléments que l’ensemble P(E) de ses parties : à chaque élément x de E correspond un élément X de P(E) et à chaque élément Y de P(E) correspond un élément y de E. X et Y sont donc des parties de E à partir desquels on a défini les éléments X et Y de P(E) ). Appelons ces x, y, … les indices respectifs de X, Y, …Comme les X, Y, … sont construits à partir des parties X , Y , … de l’ensemble E, on peut imaginer que ces x, y, … appartiennent aux parties X, Y, … qui permettent de former les X, Y, … dont ils sont les indices : On a donc :x Xy Y… … Est il alors possible qu’un élément de P(E) n’ait pas d’antécédent dans E ?Si c’est le cas, alors P(E) est strictement plus grand que E. Supposons que la liste qui fait correspondre à chaque élément de E un élément de P(E) soit dressée : peut-on encore construire un nouvel élément de P(E) dont on soit certain qu’il ne peut avoir d’antécédent ( et donc d’indice ) dans E ?On construit alors l’élément Z de P(E), formé à partir de la sous-partie Z de E, telle que Z contienne tous les éléments de E qui n’appartiennent pas à la sous-partie de E d’où est tiré l’élément de P(E) dont ils sont l’indice.On peut simplifier les choses ainsi :si x X , alors x Zsi x X , alors x Z Cette condition pour qu’un élément entre dans Z rend impossible l’indice z de Z , puisque , en procédant par substitution :si z Z, alors z Zet si z Z, alors z Z. Subsiste la question de savoir s’il existe bien un tel x qui n’appartienne pas à X, car il est juste que, sans cela , nous ne pourrions engendrer ni Z, ni Z .Or, si l’ensemble vide est bien une sous partie de E, alors est bien un élément de P(E) ; donc doit avoir un antécédent dans E qui en est aussi l’indice. Nommons a cet indice. Mais a ne peut pas être élément d’un ensemble qui est vide… : on a donc a , c’est à dire que a A. Le paradoxe est donc le suivant : il n’y a pas de plus grand cardinal, parce qu’il n’y a pas d’ensemble de tous les ensembles. Supposons en effet que E soit l’ensemble de tous les ensembles : alors il existe P(E) strictement plus puissant que lui. E devrait à la fois être plus grand que tout ensemble et en même temps plus petit que P(E). Ce paradoxe est en fait intimement lié au paradoxe de Burali-Forti qui affecte les ordinaux : en effet, les alephs sont ordonnés par ceux ci : , , …, , etc… ; le paradoxe du plus grand cardinal est donc en fait le paradoxe du cardinal indexé du nombre ordinal qui répond à la définition de l’ordinal de tous les ordinaux. [1] Critère de Cauchy : Ce qui signifie que pour tout n au moins aussi « grand » qu’un certain nombre N, la différence entre u(n) et n’importe lequel de ses successeurs, noté ici U(n+p), est plus petite que epsilon qui est un nombre infiniment petit (plus grand que 0 mais plus petit que tout réel). Un exemple de suite de Cauchy est celle définie par u(0)=1 et u(n+1)=1+ 1/u(n) (les premiers termes sont donc 1 ; 2 ; 3/2 ; 5/3 …)C’est une suite de Cauchy qui ne converge pas dans Q puisque sa limite dans R est le nombre d’or : À la Saint Charlemagne (nos coups de cœur)