INTRODUZIONE AI NUMERI TRANSFINITI |
indice
▸ simboli
▸ Notizie storiche sulla teoria degli insiemi
▸ Il lavoro sulle serie convergenti di Fourier
▸ La storia dell'infinito attuale nel pensiero matematico
▸ gli
assiomi della teoria degli insiemi
▸ AC:
formulazioni equivalenti
▸ AC: ciò che può essere provato senza AC e ciò che può essere
provato solo con AC
▸ Il metodo di astrazione e i suoi paradossi
▸ Come viene evitato il paradosso di Russell in ZFC
▸ Le definizioni mediante astrazione in ZFC
▸ Elenco di collezioni che non sono insiemi ma classi
▸ annotazioni varie di teoria degli insiemi
▸ L'intersezione
di un insieme vuoto
▸ Cumulative
Hierarchy of Sets (la gerarchia cumulativa degli insiemi)
▸ rassegna delle operazioni aritmetiche tra insiemi
▸ La definizione rigorosa dei vari sistemi di numeri, dai reali
(sezioni di Dedekind) ai naturali (Peano e Cantor)
▸ Nel caso di un insieme infinito, ad una stessa cardinalità
corrispondono più ordini possibili
▸ La
creazione dei numeri ordinali
▸ Le
proprietà degli ordinali. Gli insiemi transitivi. Gli insiemi induttivi.
Definizione generale di numero ordinale
▸ La
definizione della successione degli ordinali. Il superamento di omega. Le tre
operazioni che consentono di arrivare ad infiniti di cardinalità superiore
▸ La "numerazione" mediante ordinali degli insiemi ben
ordinati. La definizione di numero cardinale di Frege. L'assioma di astrazione
e i suoi paradossi. La definizione di Cantor (in realtà di von Neumann).
L'ordinamento degli ordinali mediante inclusione o appartenenza. La definizione
di cardinale come il minimo ordinale equipotente. Gli aleph. La numerazione
mediante cardinale degli ordinali
▸ Se in omega è possibile porre sia la relazione
"<" sia la relazione "≤", non abbiamo due ordini
anziché uno? In base a quale dei due si definisce un ordinale?
▸ Il buon ordine della classe degli ordinali
▸ L'insieme
∪X di ordinali e cardinali
▸ Rapporti degli ordinali con gli altri insiemi
▸ La
successione degli ordinali
▸ Il
paradosso di Burali-Forti
▸ Le varie forme dell'assioma di scelta. Prova che AC implica WO
▸ Cosa
si può provare con AC e cosa non si può provare senza AC. Risultati che si è
scoperto derivare dall'assioma di scelta. Paradossi che derivano dall'assioma
di scelta e perplessità al suo riguardo
▸ AC, sotto forma di funzione
di scelta, consente di dare ad ogni insieme un buon ordinamento
▸ Nozioni da leggere prima di studiare i cardinali
▸ Le relazioni di equipotenza tra insiemi e l'esplorazione delle
dimensioni dei principali insiemi
▸ Gli
infiniti di cardinalità superiore a quella dei reali e l'ipotesi
(generalizzata) del continuo
▸ I numeri cardinali. La definizione di numero cardinale di
Frege. L'assioma di astrazione e i suoi paradossi. La definizione di Cantor (in
realtà di von Neumann). L'ordinamento degli ordinali mediante inclusione o
appartenenza. La definizione di cardinale come il minimo ordinale equipotente.
Gli aleph. La numerazione mediante cardinale degli ordinali
▸ La
numerazione mediante cardinali degli ordinali. La numerazione mediante
cardinali degli insiemi ben ordinati. La numerazione mediante cardinali degli
insiemi non ben ordinati. Il ruolo dell'assioma di scelta. Come si può creare
una choice function in un insieme ordinato con WO
▸ Il
buon ordine dei cardinali
▸ La successione degli aleph.
L'indicizzazione mediante ordinali
▸ I paradossi dell'insieme di tutti i cardinali e dell'insieme
di tutti gli ordinali
▸ L'ipotesi del continuo CH e l'ipotesi generalizzata del
continuo GCH
bibliografia
e note sulle opere di principale consultazione.
Lista dei riferimenti bibliografici abbreviati:
[Be] Bernays, Axiomatic Set Theory, Dover, 1968
[Co] Borowski-Borwein,
Dizionario Collins della matematica,
Gremese Editore, 1995
[En] Enderton, Elements of Set Theory, Academic Press, 1977
[Go] Goldrei, Classic Set Theory, Chapman & Hall, 1996
[Gö] Gödel, Opere, vol. I, Boringhieri, 1999
[Ha] Halmos, Naïve Set Theory, Springer Verlag, 1974
[Ho] Holz-Steffens-Weitz, Introduction to Cardinal Arithmetic, Birkhauser, 1999
[JW] Just-Weese, Discovering Modern Set Theory, vol I, American Mathematical
Association, 1991
[Kl] Kline,
Storia del pensiero matematico,
Einaudi, 1996
[Lo] Lolli,
Dagli insiemi ai numeri, Boringhieri,
1994
[Lo74] Lolli,
Teoria assiomatica degli insiemi,
Boringhieri, 1974
[MB] Mangione-Bozzi,
Storia della logica, Garzanti, 1993
[Su] Suppes, Axiomatic Set Theory, Dover, 1960
[TZ] Takeuti-Zaring, Introduction to Axiomatic Set Theory, Springer Verlag, 1971
Lista delle opere:
▸ Bernays, Axiomatic
Set Theory, Dover, 1968
▸ Borowski-Borwein, Dizionario Collins della matematica, Gremese Editore, 1995
▸ Enderton, Elements
of Set Theory, Academic Press, 1977
[En 10]
Questo libro espone ZFC, ma, quando è utile farlo, menziona anche le classi.
Le classi sono indicate con lettere maiuscole: A, B, C, …,
mentre gli insiemi da lettere minuscole: a, b, c, …
I passaggi riguardanti gli assiomi e gli aspetti assiomatici
sono contrassegnati da una riga verticale a sinistra
▸ Gödel, Opere, vol.
I, Boringhieri, 1999
▸ Goldrei, Classic
Set Theory, Chapman & Hall, 1996
▸ Halmos, Naïve
Set Theory, Springer Verlag, 1974
▸ Holz-Steffens-Weitz, Introduction to Cardinal Arithmetic, Birkhauser, 1999
▸ Just-Weese, Discovering
Modern Set Theory, vol I, American Mathematical Association, 1991
▸ Kline, Storia
del pensiero matematico, Einaudi, 1996
▸ Lolli, Teoria
assiomatica degli insiemi, Boringhieri, 1974
▸ Lolli, Dagli
insiemi ai numeri, Boringhieri, 1994
▸ Mangione-Bozzi, Storia della logica, Garzanti, 1993
▸ Suppes, Axiomatic
Set Theory, Dover, 1960
▸ Takeuti-Zaring, Introduction to Axiomatic Set Theory, Springer Verlag, 1971
▸ alephs
Gli alephs non sono altro che i cardinali indicizzati dagli
ordinali, da tutti gli ordinali, non solo da quelli che costituiscono i
cardinali.
[Go 257]
Gli aleph sono:
ℵ(0) = ω
ℵ(γ+) = il minimo ordinale iniziale α
tale che ℵ(γ) ≺ α
ℵ(λ) = ∪{ℵ(γ)
: γ ∈
λ} per un ordinale limite λ
▸ buon
ordine: [Go
188] Un buon ordine è un ordine lineare (strict o weak) tale che
any non-empty contains a least element
▸ contabile,
insieme: un ordinale finito o numerabile
▸ Dedekind
infinito, insieme: [Go
150] è un insieme che può essere messo in
corrispondenza bijettiva con un suo sottoinsieme proprio
▸ iniziale,
ordinale: [Go
254] Un ordinale infinito è detto ordinale iniziale se per tutti
gli ordinali b < a, abbiamo anche b ≺ a
▸ limite,
cardinale: [Lo
158] un cardinale non successore si dice
cardinale limite
▸ limite,
ordinale: [Go
209] Gli ordinali possono essere ben ordinati
da ∈, che è un ordine stretto lineare ([Go 165, 207]).
In un ordine stretto lineare vengono definiti i punti-limite nel seguente modo
([Go 169]):
l'elemento c di X è un punto limite dell'insieme ordinato se c'è un elemento x
di X con x < c, e per ogni elemento x ∈
X con x < c c'è qualche y ∈
X con x < y e y < c. Un ordinale limite non è altro che un punto limite
nel buon ordine della classe degli ordinali.
▸ lineare,
ordine (stretto o debole): [Go 164,165] Dati a,b, si ha a R
b oppure b R a oppure a = b
▸ non-contabile,
insieme: [Go 148]
an infinite set which is not countable is said to be uncountable or uncountably
infinite
▸ ordine
lineare stretto: [Go
165] E' un ordine irriflessivo,
transitivo e tale che dati a,b si ha a < b oppure a > b oppure a = b
▸ ordine
lineare debole: [Go
164] E' un ordine riflessivo,
transitivo, antisimmetrico e lineare (dati a,b, si ha a ≤
b oppure b ≤ a oppure a = b)
▸ ordine
parziale stretto: [Go
165] E' un ordine riflessivo, transitivo
ma non lineare (i.e. dati a,b, si ha a ≤ b oppure b
≤ a oppure a = b)
▸ somma
generalizzata di cardinali: [Lo 162] Se {ki}i∈I
è un insieme di cardinali, I un insieme anche infinito, la somma ∑I
ki è definita come la cardinalità dell'insieme ∪{ai
| i ∈ I} dove {ai}i∈I
è un insieme di insiemi due a due disgiunti aventi ciascuno la cardinalità
corrispondente ki. Non è richiesto che i ki siano
distinti; se ad esempio ki = 1 per ogni i ∈
k, allora ∑k 1 = k. Se ki = k per ogni i ∈
I, allora ∑i ki = Card(Ixk); infatti per ogni i ∈
I gli insiemi {<i,α>
| α ∈
k} hanno la stessa cardinalità k, sono disgiunti per indici i diversi e I x k è l'unione di questi
insiemi
▸ successore,
cardinale: [Lo
158] Dato l'ordine tra cardinali definito da ∈,
h+ indica il primo cardinale maggiore di h, che è detto cardinale
successore (per il concetto di maggiore vedi la trattazione dell'ordine tra
cardinali, con riguardo alla esposizione di Lolli).
▸ successore,
ordinale: [Go
209] Gli ordinali possono essere ben ordinati da ∈,
che è un ordine lineare stretto ([Go 165,207]). In un ordine
lineare stretto vengono definiti i punti
successori ([Go
170]): siano x, c, elementi di X. Allora c è il successore di X
se x < c e per tutti gli y, se x < y allora c = y oppure c < y. Un
ordinale successore è un punto successore nel buon ordine della classe degli
ordinali.
▸ transitivo,
insieme : Un insieme S è detto transitivo se e solo se ogni membro di un
membro di S è esso stesso un membro di S.
Condizioni equivalenti:
∪S ⊆ S
a ∈ S ➙ a ⊆ S
S ⊆ P(S)
A ≼
B
C'è una funzione
iniettiva A ➙ B, che potrebbe anche essere bijettiva
A
≺
B
C'è una funzione
iniettiva ma non bijettiva A ➙ B, cioè A ≼
B ma A ≉
B (A non è equinumeroso con B)
α ⊕
β
[Go 219]
somma tra ordinali:
α ⊕
0 = 0
α ⊕
β+ = (α ⊕
β)+
α ⊕
β 0 ∪{α
⊕ λ | λ ∈
β} per un ordinale limite β
notizie storiche sulla teoria degli
insiemi
La
teoria degli insiemi come oggetti astratti, studiati per le loro proprietà
intrinseche, nacque in gran parte ad opera del matematico tedesco Georg Cantor
(1845-1918). I suoi lavori sull'argomento apparvero nel periodo 1874-1897.
Cantor
nel 1871 si rese conto che l'operazione di formare l'insieme dei punti limite
di insiemi geometrici di punti può essere ripetuta un numero non-finito di
volte.
Nel
dicembre del 1873 Cantor provò che l'insieme dei numeri reali non può essere
posto in corrispondenza biunivoca con quello degli interi. Questo risultato fu
pubblicato nel 1874. Nel 1879 e negli anni successivi Cantor pubblicò una serie
di lavori incentrati sui concetti generali di insieme astratto e di
"numeri transfiniti".
Il
lavoro di Cantor fu accolto con favore da alcuni dei maggiori matematici del
tempo, come Dedekind e Hilbert. Altri, come Kronecker, attaccarono il concetto
di infinito attuale.
[En 14]
Verso la fine dell'800 fu fatto uno sforzo per presentare i principi della
teoria degli insiemi come principi di logica, leggi autoevidenti del pensiero
deduttivo. Il principale lavoro fu quello del matematico e logico tedesco
Gottlob Frege. Nel 1893 e nel 1903 pubblicò un lavoro in due volumi in cui si
proponeva di dimostrare che la matematica può venir dedotta da principi logici.
Ma poco prima della pubblicazione del secondo volume, Bertrand Russell informò
Frege di una contraddizione derivabile dal suo sistema (il cosiddetto paradosso
di Russell, che fu notato indipendentemente da Ernst Zermelo).
[En 14]
Nel 1897 Cesare Burali-Forti scoprì l'omonimo paradosso sugli ordinali.
[En 14]
La prima assiomatizzazione della teoria degli insiemi fu pubblicata da Ernst
Zermelo nel 1908. Il suo Aussonderungsaxiom
aveva qualche imprecisione che fu emendata da Thoralf Skolem e altri.
[En 14]
Nel 1922 Abraham Fraenkel e altri proposero di aggiungere l'assioma di
rimpiazzamento. La lista di assiomi così arricchita prende il nome di
"assiomi ZF" o "teoria ZF" o "sistema ZF".
[En 14]
L'assioma di regolarità o fondazione, implicitamente stabilito in un lavoro di
Dmitry Mirimanoff del 1917 e fu aggiunto da von Neumann nel 1925.
[En 14]
Nel 1925 von Neumann propose un sistema di assiomi che ammetteva classi proprie
come oggetti legittimi. Paul Bernays migliorò il sistema di von Neumann in una
serie di lavori del 1937 e degli anni successivi. Kurt Gödel utilizzò tale sistema,
modificato, in una sua monografia del 1940. Il sistema che alla fine ne risultò
è noto come "sistema NBG" o "teoria NBG".
Come
cominciò l'avventura di Cantor con i numeri infiniti? Per puro caso. Ad un
certo punto della sua vita un matematico si imbatte in un problema che per lui
riveste uno straordinario fascino, vi scorge ciò che gli altri non sono in
grado di scorgere. A quel punto, la sua strada è tracciata.
Evariste
Galois era affascinato dal problema delle equazioni algebriche di grado
superiore al terzo. Augustin Louis Cauchy studiò per tutta la vita la
definizione di limite. Ne era così preso che quando il giovanissimo genio
danese Niels Henrik Abel gli inviò i suoi lavori sulle equazioni, non ebbe il
tempo di leggerli. Abel morì disperato a ventisei anni, due giorni prima di
ricevere la nomina a professore all'università di Berlino, che avrebbe potuto
ottenere molto prima, se Cauchy avesse gettato uno sguardo sul suo lavoro.
Così
è la mente di un matematico. Riemann studiò l'elettromagnetismo e i numeri
complessi, ma dedicò gli sforzi più grandi ad elaborare il concetto di varietà,
che portò frutto solo settant'anni dopo la sua morte. Gregorio Ricci Curbastro
e il suo brillante allievo, Tullio Levi-Civita, furono affascinati dalla
bellezza dei tensori(1) e ne esposero le leggi, incuranti del fatto
che molti all'epoca li giudicassero null'altro che sterile formalismo.
Vent'anni
più tardi Albert Einstein, che aveva utilizzato il linguaggio geometrico
multidimensionale di Hermann Minkowski per esporre la teoria della relatività
speciale, ed era alla ricerca di un simbolismo più adeguato per la sua teoria
della relatività generale, si imbatté nei lavori dei due italiani e, trovandoli
straordinariamente difficili, se li fece spiegare dall'amico Marcel Grossmann.
La descrizione del modo in cui la gravità incurva lo spazio fu scritta nel
linguaggio dei tensori. E' una delle ragioni per cui viene considerata una
delle più belle creazioni dell'ingegno umano.
Alcuni
matematici si cimentano con problemi troppo difficili per le conoscenze del
loro tempo, sono destinati all'amarezza del fallimento. L'ultimo teorema di
Fermat tra gli altri, con la sua ingannevole semplicità, ha attirato gli
studiosi come la luce attira le falene, ma è tutt'oggi indimostrato.
Cantor,
al confronto, è stato eccezionalmente fortunato. I problemi che studiò
cominciavano appena allora ad essere sollevati nei lavori degli analisti più
valenti, da Weierstrass a Bolzano a Dirichlet. Non aveva punti di riferimento,
ma nondimeno, le conoscenze della sua epoca erano mature per le sue scoperte.
Cantor
fu uno dei matematici più geniali del XIX secolo. Al di fuori della cerchia dei
matematici, il suo nome viene fatto unicamente in connessione con la
"teoria degli infiniti". In realtà i suoi contributi furono
straordinari e molteplici.
Cantor
iniziò la teoria degli insiemi, quella degli infiniti e quella degli insiemi di
punti. La sua definizione di punto limite e di insieme derivato diede origine
ad una classificazione dei punti di un insieme del tutto nuova e alternativa a
quella semplice di appartenenza-non appartenenza. Felix Hausdorff nel suo Grundzüge der Mengenlehre (I fondamenti della teoria degli insiemi)
del 1914 sviluppò questa classificazione e sulla base di essa diede vita ad una
nuova disciplina, la topologia(12), destinata ad avere una
importanza fondamentale fino ai giorni nostri.
Lo
studio delle relazioni tra punti, che aveva consentito a Cantor di proporre la
sua definizione condussero Hausdorff a quella di punto interno, punto esterno,
punto di confine, punto di accumulazione(13), che sono alla base di
questa disciplina, anche se raramente il nome di Cantor viene accostato alla
sua nascita.
Ma
oltre a quelli più innovativi, Cantor dette contributi notevoli anche nelle
aree più tradizionali della matematica, quando se ne occupò (come ad esempio
nei lavori sulla serie di Fourier). Di qualsiasi cosa si interessasse otteneva
invariabilmente risultati originali e profondi.
Georg
Cantor (1845-1918) nacque in Russia da una famiglia di ebrei danesi che si
trasferì poi in Germania poco dopo la sua nascita. Il padre lo spinse a
studiare ingegneria ed egli si iscrisse nel 1863 all'università di Berlino con
questa intenzione, ma, caduto sotto l'influenza di Weierstrass, passò ben
presto alla matematica pura. Nel 1869 diventò Privatdozent a Halle e nel 1879
fu promosso professore. Quando aveva ventun anni pubblicò nel "Journal für
Mathematik" il suo primo lavoro rivoluzionario sulla teoria degli insiemi
infiniti. Benché alcune delle sue proposizioni fossero considerate false dai
matematici più anziani, la sua grande originalità e brillantezza attirarono
l'attenzione di tutti. In seguito continuò a pubblicare lavori sulla teoria
degli insiemi e sui numeri transfiniti fino al 1897.
Non
ci si poteva certo aspettare che l'opera di Cantor, che risolse problemi vecchi
di secoli e che rivoltò completamente molte precedenti credenze, venisse
accettata immediatamente. Le sue idee sui numeri cardinali e ordinali
transfiniti suscitarono l'ostilità del potente Leopold Kronecker, che attaccò
selvaggiamente le idee di Cantor per
oltre un decennio. Ad un certo momento Cantor ebbe un esaurimento nervoso, ma
nel 1887 riprese a lavorare. Tuttavia, anche se Kronecker morì nel 1891, i suoi
attacchi lasciarono i matematici sospettosi circa i risultati di Cantor.
La
teoria degli insiemi come oggetti astratti, studiati per le loro proprietà intrinseche,
nacque in gran parte ad opera di Cantor. I suoi lavori sull'argomento apparvero
nel periodo 1874-1897.
La
teoria cantoriana degli insiemi è sparsa in molti lavori. I suoi concetti e
teoremi sono contenuti nei "Mathematische Annalen" e nel "Journal
für Mathematik" a partire dal 1874.
La
teoria cantoriana degli insiemi costituì un audace passo innanzi in un campo
che era stato preso intermittentemente in considerazione fin dal tempo dei
Greci. Essa richiedeva l'applicazione rigorosa di ragionamenti puramente
razionali e affermava l'esistenza di insiemi infiniti di potenza sempre
maggiore che sono del tutto al di fuori delle capacità di comprensione della
intuizione umana. Sarebbe stato davvero strano se queste idee, molto più
rivoluzionarie della maggior parte di quelle introdotte in precedenza, non
avessero incontrato opposizione.
Nel
dicembre del 1873 Cantor provò che l'insieme dei numeri reali non può essere
posto in corrispondenza biunivoca con quello degli interi. Questo risultato fu
pubblicato nel 1874. Nel 1879 e negli anni successivi Cantor pubblicò una serie
di lavori incentrati sui concetti generali di insieme astratto e di
"numeri transfiniti".
I
dubbi circa la fondatezza di questa teoria furono rinforzati da alcuni problemi
sollevati dallo stesso Cantor e da altri. In due lettere a Dedekind del 28
luglio e del 28 agosto 1899, Cantor si chiese se l'insieme di tutti i numeri
cardinali sia esso stesso un insieme perché, se lo fosse, avrebbe dovuto avere
un numero cardinale maggiore di ogni altro numero cardinale. Egli pensava di
dover rispondere in senso negativo distinguendo tra insiemi coerenti e insiemi
non coerenti. In seguito, nel 1897, Cesare Burali-Forti osservò che la
successione di tutti i numeri ordinali, che è bene ordinata, dovrebbe avere
come numero ordinale il più grande di tutti i numeri ordinali (questa
difficoltà era già stata notata da Cantor nel 1895). Questi e altri problemi
non risolti, chiamati paradossi, incominciarono a essere notati alla fine
dell'Ottocento.
Come
conseguenza, l'opposizione si fece essa stessa più dura. Kronecker, come si è
già osservato, attaccò il concetto di infinito attuale e si oppose alle idee di
Cantor quasi fin dall'inizio. Felix Klein non era affatto tenero con esse.
Henri Poincaré osservò criticamente: "E' però accaduto che abbiamo
incontrato certi paradossi, certe apparenti contraddizioni che sarebbero
piaciute a Zenone di Elea e alla Scuola di Megara… Per parte mia io penso, e
non sono il solo, che il punto importante sta nel non introdurre mai oggetti
che non possono essere definiti completamente con un numero finito di
parole". In seguito si riferisce alla teoria degli insiemi come a un
interessante "caso patologico". Predisse anche (nello stesso
articolo) che "le generazioni che verranno considereranno la Mengenlehre di Cantor come una malattia
da cui si è guariti". Hermann Weyl parlò della gerarchia cantoriana degli
aleph come di "nebbia stesa sopra una nebbia".
Tuttavia,
il lavoro di Cantor fu accolto con favore da alcuni dei maggiori matematici del
tempo, come Dedekind e Hilbert. Molti eminenti matematici furono profondamente
colpiti dalle applicazioni che la nuova teoria aveva già trovato. Nel primo
Congresso internazionale dei matematici di Zurigo del 1897 Hurwitz e Hadamard
indicarono importanti applicazioni della teoria dei numeri transfiniti
all'analisi. Altre applicazioni vennero presto fatte nella teoria della misura
e in topologia. David Hilbert diffuse in Germania le idee di Cantor e nel 1926
disse: "Nessuno riuscirà mai ad espellerci dal paradiso che Cantor ha
creato per noi". Egli lodò l'aritmetica transfinita di Cantor come
"il prodotto più sbalorditivo del pensiero matematico, una delle più belle
realizzazioni dell'attività umana nel campo dell'intelletto puro". Bertrand
Russell descrisse l'opera di Cantor come "la più grande, probabilmente, di
cui il nostro tempo può vantarsi".
il
lavoro sulle serie convergenti di fourier
[Go 127, 202, 244] Intorno al 1870 Cantor stava
studiando le serie convergenti di Fourier(2). Una serie convergente
di Fourier è una somma di termini trigonometrici in grado di approssimare
pressoché qualsiasi funzione che presenti minimi requisiti di regolarità nell'intervallo
(–π, +π). La serie di Fourier, rispetto allo sviluppo di Taylor, ha
il triplice vantaggio di poter approssimare anche funzioni discontinue,
funzioni che non possiedono una espressione analitica e di convergere non solo
nell'intorno di un punto, ma in un ampio intervallo trigonometrico. Ma
l'aspetto più interessante è che una serie di Fourier è una serie infinita. Da questo, Cantor fu indotto
ad occuparsi del concetto stesso di infinito.
la
storia dell'infinito attuale nel pensiero matematico
A questo punto va fatta una
digressione. Cantor, utilizzando insiemi con infiniti elementi, a cominciare da
omega, aveva introdotto un concetto
sino ad allora severamente bandito dalla matematica: l'infinito attuale.
I suoi ragionamenti andavano contro
duemilacinquecento anni di pregiudizi, risalendo indietro all'antica Grecia. Il
pensiero ellenico considerava in modo negativo l'infinito, l'apeiron, considerato l'antitesi di ciò
che è finito, delimitato, dotato di forma.
Nulla può esistere senza avere una forma. Ma essere dotato di forma vuol dire
essere delimitato, avere un limite. L'infinito era l'informe, l'imperfetto, il
caos, il non essere.
Già Aristotele aveva tracciato la
distinzione tra infinito attuale e infinito potenziale. Gli interi positivi,
ammonisce, sono potenzialmente infiniti in quanto è sempre possibile aggiungere
1 a un qualsiasi numero per ottenerne uno nuovo, ma il loro insieme infinito,
in quanto tale, non esiste, perché non può essere ottenuto con questo
procedimento.
Gli insiemi infiniti erano sempre
stati visti con diffidenza e paura, perché generano inquietanti paradossi. Il
paradosso di Zenone mostra che i greci avevano già capito che l'ipotesi
dell'infinito rende problematica la descrizione del moto.
Se un punto percorre in un tempo
finito una porzione di linea, il tempo impiegato a percorrere ciascun
intervallo della porzione diminuisce all'aumentare del numero di intervalli in
cui è frazionata la linea. Un intervallo di un ventesimo viene percorso in un
tempo che è la metà di quello impiegato a percorrere un intervallo di un
decimo. Se il numero dei punti della porzione è infinito, ciascun punto,
essendo inesteso, viene superato in un tempo eguale a zero. Diversamente si originerebbe il paradosso di Zenone: il tempo
di percorrenza sarebbe infinito. Ma
questa conclusione è inaccettabile, perché la somma di infiniti zeri dà zero, e
il tempo in cui verrebbe percorsa la porzione di linea sarebbe esso stesso
nullo.
Proclo, il commentatore di Euclide,
osserva che un diametro divide un cerchio in due metà e poiché esistono un
numero infinito di diametri, devono esistere il doppio di quel numero di metà:
una contraddizione che impedisce di parlare di infinità attuale di parti di un
cerchio.
Gli Scolastici notarono che due
cerchi concentrici hanno i punti esattamente collegati dagli infiniti raggi del
cerchio maggiore, cosicché devono averne lo stesso numero di punti, ciò che
tuttavia è impossibile, perché la lunghezza delle due circonferenze è diversa.
Galileo combatté contro gli
infiniti e li respinse perché non erano riconducibili alla ragione. Nei Discorsi e dimostrazioni matematiche intorno
a due nuove scienze osserva che i punti di due lati corrispondenti di
triangoli simili possono essere posti in corrispondenza biunivoca fra loro
mediante linee rette che partono dal vertice opposto, cosicché le due lunghezze
contengono presumibilmente lo stesso numero di punti. Egli osserva anche che i
numeri interi possono essere messi in corrispondenza biunivoca con i loro
quadrati assegnando semplicemente ad ogni numero il suo quadrato. Ciò conduce a
diversi "gradi" di infinito che, secondo Galileo, non possono
esistere. Tutte le quantità infinite sono le stesse e non possono essere
comparate egli diceva.
Persino Karl Friedrich Gauss, forse
il più grande matematico puro di tutti i tempi, insignito dai contemporanei col
titolo di Princeps Mathematicorum, in una lettera a Schumacher del 1831,
protesta contro l'uso di una quantità infinita come quantità attuale nelle
operazioni matematiche. Tutti gli studenti di liceo hanno imparato a proprie
spese che non si deve mai scrivere 1/∞ = 0.
L'atteggiamento che tendeva ad
evitare questi problemi spinosi era ipocrita, e io ho sempre detestato
l'ipocrisia. La teoria degli insiemi, una importante branca della matematica,
non poteva svilupparsi senza risolvere questi problemi, perché molti insiemi –
alcuni dei più importanti, in verità – sono insiemi infiniti. Qualcuno doveva
compiere il primo passo.
Già nel Seicento, con la creazione
dell'analisi infinitesimale ad opera contemporaneamente ed indipendentemente di
Isaac Newton e di Gottfried Wilhelm Leibniz, i paradossi dell'infinito si erano
infiltrati nei ragionamenti matematici.
Consideriamo
un bicchiere d'acqua di 5 cm. di diametro che abbia solo due dimensioni, in cui
possiamo osservare il profilo della superficie del liquido come una linea.
Supponiamo di dare un colpo al bicchiere in modo che la linea del profilo non
sia più orizzontale. Supponiamo che segua un andamento ascendente da sinistra a
destra, fin quasi in prossimità del bordo, secondo la funzione:
y
= x2
dove
y è l'altezza del liquido, e x è la distanza del punto del profilo dalla parete
sinistra del bicchiere (il tutto misurato in centimetri). Vogliamo calcolare
mediante l'analisi infinitesimale il volume (in realtà nel nostro caso area)
del liquido.
Per
ottenere una misura approssimata, suddividiamo la larghezza x del bicchiere in
5 intervalli di 1 cm. Moltiplichiamo l'estensione dell'intervallo (1 cm.) per
l'altezza che ha il liquido nel punto finale dell'intervallo. Otteniamo una
sommatoria del tipo seguente:
dove
X maiuscolo è la larghezza del bicchiere. Se sostituiamo m a 5 come numero di
intervalli arbitrario, otteniamo:
Facendo
aumentare il numero degli intervalli l'accuratezza della nostra misura aumenta
col valore di m: m = 5, m = 10, m = 20, ecc. Ma la stima esatta dell'area posta
sotto il profilo del liquido la otteniamo solo se poniamo m = ∞ ovvero,
più rigorosamente, se facciamo tendere m ad infinito:
Area sotto la linea del liquido =
In termini matematici rigorosi, il
limite di cui sopra è l'integrale della funzione y = x2,
e cioè f(x) = x2:
Area sotto la linea del liquido =
Il
valore di questo integrale o sommatoria infinita è agevolmente calcolabile una
volta trovata la funzione primitiva della funzione f(x) = x2:
y
= x3/3 + C
con
C costante di integrazione.
La
funzione primitiva di una funzione
f(x) è la funzione g(x) di cui f(x) rappresenta la derivata: f(x) = D[g(x)].
Nel
nostro caso f(x) = x2 rappresenta la derivata della funzione g(x) =
x3/3 + C.
Se
x2 è la derivata di x3/3 + C, questo vuol dire che x2
rappresenta il limite del rapporto incrementale della funzione x3/3
+ C relativo ad ogni punto del suo dominio. Pertanto, per esprimersi nei
termini impropri degli infinitesimi, la differenza tra il valore della funzione
f(x) = x3/3 + C in un punto x0 + r e il valore in un
punto x0 è il limite della sommatoria dei valori delle derivate in
ciascuno dei punti dell'intervallo [x0, x0+r]
moltiplicate per l'estensione dell'intervallo infinitesimo che contiene il
punto. Con simbolismo che lascia alquanto a desiderare sotto il punto di vista
del rigore formale possiamo scrivere:
dove
Df(x) è la derivata x2 della funzione f(x) = x3/3 + C.
Si
noti che la sommatoria a secondo membro è proprio l'integrale della funzione
Df(x) = x2:
Possiamo
pertanto scrivere:
Sostituendo
i valori relativi al nostro problema otteniamo:
e
cioè:
In
base ai calcoli, dunque, l'area del liquido nel bicchiere bidimensionale di
larghezza X è pari a 41,666… cm2.
A tutti gli studenti viene spiegato
che il simbolo di integrazione proposto da Leibniz e oggi in uso:" ∫
", non è altro che una deformazione dell'ordinario simbolo di sommatoria
" ∑ ", a significare che la somma si riferisce non ad
intervalli finiti, ma ad intervalli risultanti da una infinita suddivisione del
segmento dell'asse x in riferimento al quale si vogliono sommare i valori della
funzione. L'espressione tipica del calcolo integrale " ∫ f(x) dx
"starebbe insomma per " ∑ f(x) ⋅ ∆x " dove invece di
"∆x" si mette "dx"
per indicare intervalli infinitesimi.
Questo procedimento non si concilia
molto bene con l'idea, che risale ai greci, che un segmento materiale non può
essere infinitamente indivisibile, idea che dette origine all'atomismo di
Democrito. Di fatto, abbiamo supposto che il segmento orizzontale che rappresenta
la base del bicchiere sia infinitamente divisibile e che a ciascun punto
inesteso corrisponda una data altezza del liquido: come è possibile che abbiamo
ottenuto un risultato che coincide con le nostre misurazioni di un oggetto
materiale?
E non si pensi che le nostre
misurazioni non possano essere così accurate da non rilevare discrepanze. Le
formule dell'elettromagnetismo, che calcolano i valori dei campi
elettromagnetici relativi ad aree e volumi, utilizzano pure esse l'analisi
infinitesimale, e i risultati dei calcoli possono venir verificati con
precisione altissima. Quantomeno, nessuna misurazione ha sinora contraddetto
l'ipotesi dell'infinita divisibilità.
A riprova del fatto che la
sommatoria su infiniti intervalli è un concetto paradossale, si può portare la
storia del concetto di infinitesimo,
un concetto errato che oggi viene
utilizzato dagli insegnanti di matematica solo in casi disperati, per far
capire ad alunni completamente refrattari ai concetti matematici la nozione di
derivata.
La derivata di una funzione si
ottiene considerando variazioni Δx sempre più piccole della x, a cui
corrispondono variazioni Δy sempre più piccole della y. La derivata è il
limite del rapporto Δy/Δx quando il valore di Δx tende a zero.
Leibniz, in una lettera a Wallis del 1690, diceva che la derivata era il
rapporto tra quantità infinitesime, "minori di qualsiasi quantità
finita" e tuttavia non nulle. Per rimarcare questa distinzione,
utilizzava, per il rapporto che costituiva la derivata il simbolo dy/dx anziché
quello Δy/Δx, e chiamava dx e dy differenziali,
per distinguerli dalle variazioni finite costituite da Δx e Δy. I
differenziali o infinitesimi erano queste misteriose quantità che venivano
concepiti come quasi inestese.
Solo la definizione e l'impiego del
concetto di limite, oltre un secolo più tardi, portò finalmente chiarezza e
consentì ai matematici tirare un sospiro di sollievo: il valore
dell'integrazione può essere definito come il valore limite a cui tende una
sommatoria di intervalli sempre più piccoli. Oggi un matematico spiegherebbe il
concetto di infinitesimo come frutto di un fraintendimento: non si usano
quantità più piccole di qualsiasi
numero ma tuttavia non-nulle: si è
semplicemente compiuta una operazione di passaggio al limite.
Ma in realtà il problema del
bicchiere, a ben vedere, rimane: perché qualsiasi
valore della sommatoria diverso dal valore limite è inesatto? L'infinito e i suoi paradossi erano irrimediabilmente
penetrati nella matematica del Settecento con oggetti come le serie infinite e
i limiti.
La definizione di limite di una
successione di numeri è una delle più grandi scoperte della matematica, il
pilastro di tutta l'analisi infinitesimale, e uno dei più bei concetti che
l'ingegno umano abbia mai concepito:
Una successione di numeri reali è una funzione f : ℕ ➙ ℝ dall'insieme dei numeri naturali
nell'insieme dei numeri reali. Di solito si scrive x1 al posto di
f(1), x2 al posto di f(2), e così via.
Si dice che un numero x è il limite di una successione x1,
x2, … se dato un qualsiasi numero reale ε > 0 esiste un
numero naturale I tale che il valore assoluto di (x – xn) è
inferiore ad ε per ogni n > I
Una serie è la somma dei termini di una
successione, finita o infinita, di numeri. Una serie infinita ha una somma
calcolabile se e solo se la successione delle somme parziali dei suoi segmenti iniziali converge ad un limite.
Già Eulero, nel Settecento, aveva
mostrato che si poteva calcolare, con una operazione di passaggio al limite, il
valore di serie infinite convergenti.
Consideriamo il caso di un uomo che
spende una somma S di 1000 fiorini per acquistare dei beni da un secondo uomo
(il panettiere); supponiamo che il secondo uomo spenda una percentuale dell'80%
di questa somma per acquistare beni presso un terzo uomo (il lattaio); il terzo
uomo spende a sua volta l'80% di ciò che ha ricevuto presso un quarto uomo (il
macellaio). Supponiamo di proseguire all'infinito questa serie:
1000 + 1000 · 0,8 + (1000 · 0,8) ·
0,8 + ((1000 · 0,8) · 0,8) · 0,8 +…
e cioè:
1000 · (0,8)0 + 1000 ·
(0,8)1 + 1000 · (0,8)2 + 1000 · (0,8)3 + …
e cioè, chiamando la somma iniziale
"S", la somma finale "∑" e la percentuale
"c":
∑ = S
· c0 + S · c1 + S · c2 + S · c3 + …
e cioè:
Come si può calcolare il valore di
∑, cioè il valore di una somma infinita?
A questo scopo, definiamo una nuova
somma ∑1:
∑1 = ∑ · c
scriviamo, accanto a questa, una
seconda, evidente, eguaglianza:
∑ – ∑1 = S
mettiamo a sistema le due
eguaglianze, considerando ∑ come incognita. Sostituiamo l'espressione per
∑1 della prima, nella seconda, ottenendo:
∑ – (∑ ⋅ c) = S
e cioè:
∑ ⋅ (1 – c) = S
e cioè:
e cioè:
Notate che tutte le espressioni
sono in realtà passaggi al limite.
Con simili metodi, Eulero mostrò
che il numero e = 2,71828…, che da lui prende il nome, è il limite di una serie
infinita di somme:
Generalizzando simili scoperte e
definendo rigorosamente il concetto di limite, Augustin Louis Cauchy, agli
inizi dell'Ottocento, mostrò che ci sono serie infinite che convergono ad un
limite, e che tale limite è perfettamente calcolabile. I matematici successivi
diedero le condizioni necessarie e sufficienti, valide per la maggior parte
delle serie, per stabilire se esse siano convergenti o no.
Ma nonostante i matematici si
stessero lentamente familiarizzando col concetto di infinito, esistevano ancora
dei paradossi che li spaventavano. Alcuni però erano solo apparenti. Il compito
di chiarire quali fossero apparenti e quali reali, di sondare l'effettiva
estensione del dominio conquistabile, toccò a me.
[En 10]
Oggetti matematici come le funzioni differenziabili e i numeri possono essere definiti
come particolari tipi di insiemi. I teoremi della matematica, come ad esempio
il teorema fondamentale del calcolo, possono essere espressi come proposizioni
su insiemi, e provabili in base agli assiomi. Gli assiomi di ZFC forniscono una
collezione sufficiente per lo sviluppo di tutta la matematica.
L'approccio non-assiomatico alla
teoria degli insiemi è chiamato "naive set theory". Storicamente,
questa è la forma in cui si originò la teoria degli insiemi. Ma ben presto i
paradossi fecero orientare verso una trattazione assiomatica.
Le nozioni primitive sono
"insieme" e "appartenenza".
Le conseguenze logiche degli
assiomi sono chiamate teoremi.
[En 12]
Un metateorema afferma che dato un sistema assiomatico, una qualsiasi
conseguenza logica dei suoi assiomi ha una prova di lunghezza finita.
Una Teoria formale è creata a
partire da un insieme contabile di simboli. Ecco i simboli della teoria degli
insiemi:
∀x : per ogni insieme x
∃x : esiste un x tale
che
∼
oppure ⌉ : non
& oppure ∧ : et
∨
: oppure (nel senso uno o l'altro o entrambi)
⇒
: implicazione (se… allora)
⇔
: biimplicazione (se e solo se)
∈
: appartiene a
= : è lo stesso oggetto
simboli per gli insiemi
: normalmente lettere latine minuscole
(a, b, c, …)
simboli per le classi
: normalmente lettere latine maiuscole (A, B, C, …)
[En 22]
In un sistema assiomatico esistono delle regole per stabilire quale successione
di simboli sia dotata di significato ("formula ben formata" o
"fbf") e quale no, come ad esempio: ")) ⇒
A"
Queste
regole consistono in una definizione ricorsiva di fbf come segue:
"a
∈ B" e "a = b" sono fbf
Se
φ e ψ
sono fbf allora sono fbf anche "∀x φ", "∃x
φ", "∼φ",
"φ & ψ",
"φ ∨
ψ",
"φ ⇒
ψ",
"φ ⇔
ψ"
Nessun'altra è una fbf all'infuori
di queste (formula di chiusura)
[En 19]
La maggior parte degli assiomi sono di forma esistenziale, e asseriscono
l'esistenza di determinati insiemi: ∃B
∀x (x ∈
B ⇔ …) o, in forma più completa: ∀y1 ∀y2 … ∀yk ∃B
∀x (x ∈
B ⇔ …)
gli
assiomi della teoria degli insiemi
Una
trattazione degli assiomi è in [Go 75], [En 17]
Cantor individuò dei paradossi, di
alcuni dei quali accenneremo più avanti, ma non se ne curò particolarmente.
Ernst Zermelo, Abraham Fraenkel,
Paul Bernays, Janos von Neumann, Alfred Tarski, Kurt Gödel, crearono
contemporaneamente la teoria assiomatica degli insiemi e la logica matematica.
L'idea originaria di Zermelo era di individuare un piccolo numero di assiomi da
cui tutta la teoria degli insiemi potesse essere dedotta logicamente senza
contraddizioni. Entro tale teoria si sarebbe potuta costruire con sicurezza la
nozione di numero.
Elenco degli assiomi:
Assioma di estensionalità
Assioma dell'insieme vuoto
Assioma della coppia (pairing axiom)
Assioma di separazione ([En 18] Subset axiom;
Aussonderungsaxiom)
Assioma dell'insieme potenza (power set axiom)
Assioma dell'unione
Assioma dell'infinito
Assioma di rimpiazzamento
Assioma di regolarità (fundierungsaxiom; assioma di
fondazione)
Assioma di scelta
[Go 75 ss.]
Ecco una breve definizione per ciascun assioma:
▸ Assioma
di estensionalità: Due insiemi sono
uguali se e solo se contengono gli stessi elementi. In simboli:
∀x ∀y (x = y ⇔ ∀z (z ∈ x ⇔ z ∈ y))
▸ Assioma
dell'insieme vuoto: Esiste un insieme
che non contiene alcun elemento. In simboli:
∃x ∀y (y ∉ x)
▸ Assioma
delle coppie: Dati due qualsiasi
insiemi, esiste un insieme i cui elementi sono precisamente questi insiemi.
In simboli:
∀x ∀y ∃z ∀w (w ∈ z ⇔ (w = x ∨ w = y))
▸ Assioma
di separazione: Dato un qualsiasi
insieme x esiste un insieme che consiste di tutti gli elementi z di x per i
quali vale la proprietà predicata dalla proposizione o formula logica φ(z).
In simboli:
∀x ∃x ∀z (z ∈ y ⇔ (z ∈ x & φ(z)))
▸ Assioma
dell'insieme potenza: Dato un
qualsiasi insieme, esiste l'insieme che ha come elementi tutti i sottoinsiemi
di x. In simboli:
∀x ∃y ∀z (x ∈ y ⇔ z ⊆ x)
▸ Assioma
dell'unione: Dato un qualsiasi
insieme x, esiste un insieme che è l'unione degli elementi di x. In
simboli:
∀x ∃y ∀z (z ∈ y ⇔ ∃w (z ∈ w & w ∈ x))
▸ Assioma
dell'infinito: Esiste un insieme
induttivo. In simboli:
∃x (∅ ∈ x & ∀y (y ∈ x ➙ y ∪ {y} ∈ x))
▸ Assioma
di rimpiazzamento: Se φ(s,t) è
una funzione-classe, allora quando il suo dominio è ristretto ad x l'immagine
risultante forma un insieme y. In simboli:
∀x ∃y ∀y' (y' ∈ y ⇔ ∃x' (x' ∈ x & φ(x', y')))
∀s ∃t (φ(s, t) & ∀t' (φ(s,t') ➙ t = t'))
▸ Assioma
di fondazione: [Go 92, 95] Ogni
insieme è ben-fondato, cioè contiene un elemento minimo nell'ordine dato
dall'appartenenza ∈ (∈-minimal element) In simboli:
∀x ∃y (y ∈ x & x ∩ y = ∅)
Un
minimal element y nella relazione ∈
è tale che non esiste un altro elemento dell'insieme x che sia con y in
relazione di appartenenza. Per escludere questo è necessario appunto postulare
che x e y non abbiano elementi in comune, altrimenti esisterebbero degli
elementi di x inclusi in y
▸ Assioma
di scelta: Si supponga che F è una
famiglia di insiemi non-vuoti. Allora esiste una funzione f da F a ∪F
(unione di F: insieme degli elementi degli elementi di F) tale che per ogni A
che appartiene ad F, l'immagine f(A) appartiene ad A.
Ecco
ora una trattazione approfondita di singoli assiomi:
[Go 93]
L'assioma di rimpiazzamento:
∀x ∃y
∀y' (y' ∈
y ⇔ ∃x'
(x' ∈ x & ϕ(x',y')))
dove
ϕ(s,t) è una formula tale che
∀s ∃t (ϕ(s,t) & ∀t' (ϕ(s,t') ➙ t' = t))
Se
ϕ(s,t) è una class function,allora quando
il suo dominio è ristretto ad x l'immagine forma un insieme.
[Go 94]
Ora, restringiamo l'elemento s ad un insieme x come dominio:
{〈s,t〉
| s ∈ x & ϕ(s,t)}
L'assioma
di rimpiazzamento ci dice che esiste un insieme y a cui appartengono le
immagini, anzi ci dice che esiste un insieme y consistente esclusivamente di queste immagini. Quando ϕ(s,t)
ha queste caratteristiche, l'insieme sopra indicato definisce una funzione in ZF.
L'assioma
di rimpiazzamento garantisce l'esistenza di un insieme
{ℕ,
P(ℕ),
P(P(ℕ))…}
che
è importante
per
la teoria degli infiniti di Cantor. L'assioma garantisce che è un insieme.
Inoltre garantisce che possiamo
definire funzioni su ℕ
in modo ricorsivo.
Vedi intestazione "Il metodo di
astrazione e i suoi paradossi"
[En 24]
Notare che non si tratta dell'affermazione che dati due insiemi ne esiste
l'insieme unione, ma che dato un insieme, esiste il suo insieme unione, che non
è altro che l'insieme risultante dalla "rottura dei sacchi", come si
è espresso un autore (Lolli), cioè ottenuto prendendo gli elementi degli
insiemi che compongono l'insieme.
In
ZFC, come conseguenza dell'assioma di fondazione, un insieme non può appartenere
a se stesso, l'insieme di tutti gli insiemi non è un insieme, non esistono
infinite descending ∈-chains,
non si può avere x ∈
y e y ∈ x
[Go 112]
Zermelo voleva provare il principio del buon ordinamento per tutti gli insiemi,
e introdusse AC. I matematici non erano interessati ad un principio generale,
ma solo al buon ordinamento di ℝ. Essi dubitavano che si potesse formulare un principio
generale. La prova di Zermelo attraverso AC fu guardata con sospetto,
soprattutto perché collegava la funzione di scelta, che non era molto
controversa (si riteneva plausibile che potesse essere derivata dagli altri
assiomi della teoria degli insiemi) con un principio controverso come WO. Ma la
cosa importante fu che vennero individuate con precisione le prove che facevano
uso in modo surrettizio di qualche forma di AC, e il lavoro di Zermelo mostrò
che AC equivale in realtà a WO.
[Go 112]
Per risolvere la questione se accettare o no AC i matematici speravano di poter
mostarre che AC era provabile oppure dimostrare falso a partire dagli altri
assiomi di ZF. Nel 1940 Gödel
mostrò che AC era coerente con il resto degli assiomi di ZF, cosicché non era
dimostrabile come falso in ZF. Nel 1963 Cohen provò che AC era indipendente da
ZF, e quindi non poteva nemmeno essere provato a partire dagli assiomi di tale
teoria. A questo punto, accettare o meno AC rimane una scelta del singolo
matematico.
Vedi intestazione nella sezione sui
numeri transfiniti: "Le varie forme dell'assioma di scelta. Prova che AC
implica WO"
ac: ciò che può
essere provato senza ac e ciò che può essere provato solo con ac
[Ho 53]
Senza AC non si può dimostrare che ogni
insieme infinito ha un sottoinsieme contabilmente infinito.
[En 48]
Senza AC non si può dimostrare che ogni
funzione possiede una inversa destra. Data una funzione f : A ➙
B, una funzione inversa destra di f è
una funzione h tale che h ∘ f = IA (funzione identità di A) e una funzione inversa sinistra è una funzione
g tale che g ∘ f = IB (identità di B). L'inversa f–1,
se fosse una funzione sarebbe precisamente l'inversa destra, ma non è detto che
lo sia, perché f potrebbe non essere iniettiva. Nel caso non sia iniettiva,
possono esistere elementi b di B che sono immagini di più elementi di A, e senza una struttura entro f–1(b)
non si ha modo di selezionare un solo
elemento.
il
metodo di astrazione e i suoi paradossi
L'obiettivo di Frege era di ridurre
la matematica all'insiemistica e l'insiemistica alla logica. Questo indirizzo
di pensiero viene chiamato logicismo.
Per ridurre la teoria degli insiemi alla logica, Frege stabilì una
corrispondenza tra ciascuna delle proprietà predicabili di un qualsiasi oggetto
e un insieme. Se la proprietà P è predicabile degli oggetti a, b, c, d e di
nessun altro, allora essa corrisponde all'insieme {a,b,c,d}. Viceversa,
possiamo descrivere un insieme fornendo la proprietà che hanno i suoi elementi
e nessun altro. Questo metodo di descrivere insiemi è molto potente, e viene
detto principio di astrazione:
{x | x è rosso}
è l'insieme degli oggetti rossi
{x | x è umano e x è nato in
Inghilterra}
definisce l'insieme di tutti gli
inglesi (secondo una possibile definizione di questo popolo). E così via.
E' proprio questo metodo che è
stato usato da Frege per costruire i suoi numeri naturali: uno è l'insieme i
cui elementi hanno la proprietà di essere insiemi e di avere un solo elemento:
{x | x è un insieme e x possiede un
solo elemento}
due è l'insieme i cui elementi
hanno la proprietà di essere insiemi e di possedere due elementi:
{x | x è un insieme e x possiede
due elementi}
e così via.
Il "paradosso" degli insiemi che
appartengono a se stessi. Ma proprio questo modo di definire insiemi nasconde
paradossi. Prendiamo ad esempio l'insieme V di tutti gli insiemi. Allora V deve
appartenere a se stesso: V ∈ V. Questo contraddice la nostra
idea intuitiva di un insieme come collezione di oggetti materiali che, in
quanto tale, non può appartenere a se stessa.
Il paradosso di Russell.
Ma il paradosso
più grave, noto come paradosso di Russell,
(fu indipendentemente scoperto da Zermelo) è il seguente. Consideriamo
l'insieme S di tutti gli insiemi che non
appartengono a se stessi. Chiediamoci: S appartiene a se stesso? Se diciamo che
S appartiene a se stesso, allora S non
può appartenere a se stesso, perché gli appartengono solo gli insiemi che
non appartengono a se stessi. Se diciamo che S non appartiene a se stesso,
allora S appartiene a se stesso,
perché in tale insieme sono compresi proprio gli insiemi che non appartengono a
se stessi. Quale che sia l'affermazione su S, essa genera una contraddizione
con altre affermazioni che abbiamo fatto su S.
Pertanto, non può essere
utilizzato, per fondare la teoria degli insiemi, un assioma del tipo:
∃y ∀x (x ∈ y ⇔ φ(x))
dove φ(x) è una qualsiasi
proposizione che enuncia che x ha una o più proprietà. E' detto assioma di astrazione. E' il quinto
assioma del sistema logico esposto da Gottlob Frege nel suo Grundgesetze der Arithmetik del 1893.
Senza di esso l'intero sistema – e in particolare la nozione di numero – crolla
come un castello di carte. Bertrand Russell comunicò a Frege questo paradosso
in una sua famosa lettera del 1902: Frege cadde in una crisi depressiva e non
pubblicò più nulla per molti anni.
Il paradosso di Berry.
[En 5]
Consideriamo l'insieme:
{x
| x è un intero positivo definibile in una sola riga di testo}
Poiché
esiste solo un numero finito di tipi di caratteri e un numero finito di posti
in una riga l'insieme di cui sopra è un insieme finito di numeri interi. Ora
consideriamo la seguente definizione:
"il
più piccolo intero positivo non definibile con una sola riga di testo"
Tale
intero è definito in una riga di testo, quindi dovrebbe essere compreso
nell'insieme, ma, per sua definizione, non vi è compreso. Questo mostra che
[En 22]
L'approccio assiomatico rende il paradosso di Berry impossibile, perché la
formula:
∃B
∀x (x ∈
B ⇔ x ∈
ω & x è un intero definibile in una riga di testo)
non
è una fbf in ZF, in quanto "definibile in una riga di testo" non è
una espressione rappresentabile con i simboli a nostra disposizione.
come viene evitato il paradosso
di russell in zfc
Il paradosso di Russell, come è
noto, deriva dall'assioma di astrazione,
il quinto assioma del sistema logico esposto dal matematico Gottlob Frege nel
suo Grundgesetze der Arithmetik del
1893:
∃y ∀x (x ∈ y ⇔ φ(x))
dove φ(x) è una proprietà
espressa da una formula ben formata (fbf) del linguaggio del secondo ordine.
Scegliendo come proprietà:
φ(x) = x ∉ x
avremo:
∃y ∀x (x ∈ y ⇔ x ∉ x)
Ponendo x = y per l'arbitrarietà di
x otteniamo:
∃y (y ∈ y ⇔ y ∉ y)
che è il paradosso che Bertrand
Russell comunicò con una celebre lettera del 1901 a Gottlob Frege
annunciandogli in tal modo il fatale difetto del suo intero sistema logico.
Come l'assioma di separazione elimina il
paradosso di Russell
Per evitare questa difficoltà, un
brillante allievo di David Hilbert, Ernst Zermelo, che Hilbert aveva
indirizzato allo studio delle opere di Cantor, Frege e Russell, aveva
introdotto nella sua assiomatizzazione della teoria degli insiemi, il
cosiddetto "assioma di separazione" (Aussonderungsaxiom nell'originale tedesco), che può essere
formulato in questo modo:
∀z ∃y ∀x (x ∈ y ⇔ x ∈ z ∧ φ(x))
dove φ(x) è definito come
sopra (notare che in tale assioma z deve essere un insieme)
Secondo
questo principio è ammessa la
comprensione
delle proprietà solo
nell'ambito di insiemi già precostituiti,
nel senso che la loro esistenza o è stata postulata o può essere dimostrata nel sistema.
Con l'assioma di separazione non è
più possibile derivare una contraddizione introducendovi la proprietà:
φ(x) = x ∉ x
Avremo infatti:
∀z ∃y ∀x (x ∈ y ⇔ x ∈ z ∧ x ∉ x)
Per l'arbitrarietà di x poniamo x =
y e scriviamo:
∀z ∃y (y ∈ y ⇔ y ∈ z ∧ y ∉ y)
la
biimplicazione:
y ∈ y ⇔ y ∈ z ∧ y ∉ y
non può essere vera in virtù della
verità di entrambi i membri. Pertanto, per essere vera (e la formula deve essere vera, perché è un assioma),
entrambi i membri devono essere falsi (vedi la tavola di verità della
biimplicazione):
∼( y ∈ y ⇔ y ∈ z ∧ y ∉ y)
ma se il primo membro è falso
allora deve essere:
∼( y ∈ z ∧ y ∉ y)
ma la falsità del primo membro ci
dice che y ∉ y è vero;
l'unica possibilità di falsificazione della formula è quindi:
∀z ∃y ∼(y ∈ z)
e cioè:
∀z ∃y (y ∉ z)
che non è contraddittoria, e ci
dice semplicemente che non esiste un insieme "universale" che
comprende tutti gli insiemi, perché per qualsiasi
insieme z esisterà sempre un elemento y che non
gli appartiene.
L'assioma di separazione implica
l'inesistenza di un insieme universale
Possiamo sviluppare ulteriormente
la formula di cui sopra:
∀z ∃y (y ∈ y ⇔ y ∈ z ∧ y ∉ y)
per trarne un'altra proposizione
non-contraddittoria: quella sulla inesistenza di un insieme che contiene tutti gli insiemi. Esporremo tre diverse
dimostrazioni, dovute, rispettivamente a Patrick Suppes (Axiomatic Set Theory), a Paul Halmos (Naive Set Theory) e ad Herbert Enderton (Elements of Set Theory)
dimostrazione di
suppes:
Sostituiamo
nella formula y a z ottenendo:
∃y (y ∈ y ⇔ y ∈ y ∧ y ∉ y)
questa biimplicazione è vera solo
alla condizione che i due membri siano falsi, e cioè a condizione che sia:
∃y (y ∉ y)
che è l'asserzione che esiste
almeno un insieme che non include se stesso.
dimostrazione di halmos:
La dimostrazione di Halmos parte
dalla formula più generale ottenuta sostituendo nell'assioma y ad x:
∀z ∃y (y ∈ y ⇔ y ∈ z ∧ y ∉ y)
Chiediamoci se y appartenga a z: è
possibile provare che in realtà y ∉ z. Osserviamo a questo scopo la
biimplicazione di cui sopra:
y ∈ y ⇔ y ∈ z ∧ y ∉ y
Si può avere y ∉ z nel membro di destra con il
membro di sinistra vero o con il membro di sinistra falso. Nel primo caso deve
essere vero y ∉ y, il che conduce ad una contraddizione. Nel secondo caso
deve essere y ∉ z, perché solo questa condizione può determinare la
falsità del secondo membro. Abbiamo così dimostrato, data l'arbitrarietà di z,
che esiste comunque un y che non appartiene a z.
Questa proposizione, a prescindere
dal fatto che è assiomaticamente derivata, può essere provata anche con un
semplice esempio. Consideriamo l'insieme
A = {{1},{2}}
E' chiaro che A non appartiene a se
stesso:
A ∉ A
Viene in tal modo confermata
l'esistenza di un y tale che y ∉ y.
dimostrazione di enderton:
[En 22]
Dato un insieme A, costruiamo, con l'assioma di separazione, un insieme B che
non appartiene ad A:
B
= {x ∈
A | x ∉ x}
Si
ha:
B
∈ B ⇔
B ∈ A & B ∉
B
Se
B ∈ A la formula si ridurrebbe a:
B
∈ B ⇔
B ∉ B
che
è contraddittoria: se ne conclude che B ∉
A
[En 22]
Se combiniamo l'assioma di separazione con l'assioma di fondazione, che implica
che nessun set appartiene a se stesso, ne concludiamo che questo insieme B non
è altro che l'insieme A.
L'insieme di tutti gli insiemi è in
effetti un insieme ingombrante e non necessario. Esistono tuttavia sistemi in
cui ne è ammessa l'esistenza, come ad esempio NBG ([Suppes 29]).
Anche il meno noto sistema di Quine ammette l'insieme universale.
Dalla
inesistenza di un insieme di tutti gli insiemi, si può derivare
facilmente l'inesistenza del "complemento assoluto", cioè l'insieme
che contiene tutti gli elementi che non appartengono ad un dato insieme S.
L'assioma di separazione è necessario per
stabilire l'esistenza dell'insieme intersezione
[En 21]
L'assioma di separazione, tra l'altro, è necessario per stabilire l'esistenza
di insiemi importanti, come l'insieme intersezione, l'insieme dei naturali pari
Una diversa dimostrazione
dell'inesistenza del paradosso di Russell in ZFC (Takeuti-Zaring)
G.
Takeuti e W.M. Zaring espongono
una diversa dimostrazione di come gli assiomi di ZFC impediscano il paradosso di
Russell, che, per
completezza,
esporremo
qui di seguito.
Accanto
ai termini primitivi,
che sono lettere minuscole, introduciamo come altro termine la classe denotata
con
{x
| φ(x)}
mediante
la definizione:
a
∈ {x | φ(x)} ≡ φ(a)
Il
simbolo {x | φ(x)} non denota altro che "tutti
gli x che hanno la proprietà
φ".
Utilizzeremo
ora, accanto alle lettere minuscole x, y, ecc., anche lettere maiuscole A, B,
ecc. per
indicare termini del primo
o del secondo tipo.
Consideriamo
la definizione:
A
= B ≡ ∀x (x ∈
A ⇔ x ∈
B)
Utilizziamo
lettere maiuscole A, B, ecc. per
indicare un termine generico, del primo o del secondo tipo, e due predicati per tale
termine, quello di essere una classe propria e quello di essere un insieme:
M(A)
≡ ∃x
(x = A)
che
si legge: "gli insiemi sono tutti e soli quelli denotati da variabili
individuali o quelli denotati da termini che si può mostrare equivalenti (applicando la
decostruzione delle definizioni) a oggetti denotati da variabili
individuali"
Pr(A) ≡ ∼M(A)
che
si legge: "i termini che non denotano insiemi sono classi proprie"
Si
ricava facilmente il seguente teorema:
∀x M(x)
Dato l'insieme Ru definito come:
Ru = {x | x ∉
x}
si
ha il teorema:
Pr(Ru)
perché
diversamente si avrebbe:
∃y (y = Ru)
∃y ∀x (x ∈ y ⇔ x ∉ x)
∃y (y ∈ y ⇔ y ∉ y)
e cioè:
M(Ru) ➙ (Ru ∈ Ru ⇔ Ru ∉ Ru)
che
è una contraddizione.
Quindi
è:
∼M(Ru)
e cioè
∼∃x (x = Ru)
Una
volta dimostrato che non esiste l'insieme degli insiemi che non appartengono a se
stessi il paradosso
di Russell è risolto.
le
definizioni mediante astrazione in zfc
[En 27]
Nella naive set theory si incontrano in ogni momento definizioni per
astrazione:
A
∪ B = {x | x ∈
A ∨ x ∈
B}
A
∩ B = {x | x ∈
A & x ∈ B}
A
– B = { x ∈ A | x ∉
B}
Questo
pone due ordini di problemi: a) garantire mediante definizione la traducibilità
in una fbf di ZFC; b) provare che l'oggetto esiste ed è un insieme
In
alcuni casi (ad esempio nel sistema NBG) la definizione per astrazione può
legittimamente dare luogo a classi.
elenco
di collezioni che non sono insiemi ma classi
Il
complemento assoluto. [En 27] Non possiamo formare
il complemento assoluto B di un insieme A come insieme perché l'unione di A e B
darebbe un insieme che comprende tutti gli insiemi, perché dagli assiomi ZFC si
ricava che l'unione di due insiemi è un insieme.
La
classe degli insiemi che non appartengono a se stessi.
(vedi la trattazione del paradosso di Russell)
L'insieme
universale. L'assioma di separazione implica che
non esista (vedi trattazione paradosso di Russell)
annotazioni
varie di teoria degli insiemi
La
definizione di coppia ordinata. Il matematico
Kazimierz Kuratowski, nel 1921, ha trovato la definizione di coppia ordinata in
uso ancora oggi:
<x,y>
≡ {{x},
{x,y}}
Le
relazioni. Le relazioni non sono necessariamente
binarie, ma normalmente sono n-arie
Terminologia delle funzioni estendibile
alle relazioni. [En 40] Dominio di una relazione. Range di una relazione. Relazione single rooted corrispondente al concetto di iniettività (relazioni
binarie).
l'intersezione
di un insieme vuoto
[En 25]
Se definiamo l'intersezione di un insieme secondo la formula:
x
∈ ∩A ⇔
x appartiene a ogni elemento di A
allora
è vero in senso vuoto ("vacuously true") che x appartiene a ogni
elemento di ∅, e quindi
parrebbe che ∩∅
sia la classe V di tutti gli insiemi. Ma come sappiamo, questo non è un
insieme, ma una classe, tra l'altro perché, per l'assioma di separazione, dato
un insieme, esiste sempre un insieme che non gli appartiene. Ma noi vogliamo
definire ∩∅ come un insieme. Una opzione è di lasciare
∩∅ indefinito,
dato che non esiste un modo soddisfacente di definirlo. Questa scelta funziona
bene, ma ad alcuni logici non piace. L'altra opzione è trovare un "capro
espiatorio", ad es. ∅
stesso, e definire ∩∅
= ∅. In qualsiasi modo ci si orienti, quando
si costruisce l'intersezione ∩A di un insieme, occorre stare attenti alla
possibilità che A = ∅.
Enderton suggerisce che, dal momento che non fa nessuna differenza quale delle
due opzioni abbracciamo, possiamo non curarci di fare una scelta.
cumulative
hierarchy of sets (la gerarchia cumulativa degli insiemi)
[Go 96]
La gerarchia cumulativa degli insiemi è un processo iterativo che alterna
l'operazione di passaggio all'insieme potenza a quella di unione generalizzata,
a partire dal minimo numero di oggetti necessario. Ad ogni passo viene generata
una collezione di nuovi insiemi Vi, con gli indici i che sono numeri ordinali, indicizzata
in base al numero dei passi che sono stati necessari a crearla. La chiameremo
CHS.
Una
CHS può essere generata sia in un sistema assiomatico che ammette urelemente, sia in un sistema
assiomatico che non li ammette, come ZF. Una delle costruzioni possibili nel
caso di ZF è la costruzione a partire dal solo insieme vuoto.
[q]
Gli elementi di CHS sono ordinati per inclusione. Questo non contraddice il
teorema (derivato dal Fundierungsaxiom)
secondo cui non esistono catene di
appartenenza discendenti infinite (infinite
descending ∈-chains): infatti, nel
caso di CHS si tratta di catene di
appartenenza ascendenti infinite (infinite
ascending ∈-chains), e poi si
tratta di sequenze entro insiemi,
mentre V non è un insieme.
Costruzione di CHS in un sistema con urelemente (Enderton)
[En 7]
V0 è l'insieme degli atomi
V1
= V0 ∪ P(V0)
V2
= V1 ∪ P(V1)
Per
Vω prendiamo l'unione infinita: Vω = V0
∪ V1 ∪
V2, …
Vω+1
= Vω ∪
P(Vω)
Costruzione di CHS a partire dall'insieme
vuoto (Goldrei)
[Go 225]
I passi per la creazione della CHS a partire dal solo insieme vuoto sono i
seguenti:
V0
= ∅
Vγ+
= P(Vγ)
Vλ
= ∪{Vγ
| γ ∈
λ} per un ordinale limite λ
[Go 97]
dove i Vi sono indicizzati dagli ordinali.
[Go 97]
Abbiamo cioè, costruendo i primi livelli a titolo di esempio:
V0
= ∅
Vn+
= P(Vn), per n ∈
ℕ
Vω
= ∪{vn | n ∈
ℕ}
Ripetiamo
il processo di successione mediante insieme potenza su Vω
ottenendo una ulteriore serie:
Vω,
P(Vω), P(P(Vω)), …
Poi
ripetiamo il processo di unione generalizzata, comprendendovi tutti i precedenti Vi:
∪{V0,
V1, V2, …, Vω,
, P(Vω), P(P(Vω)), …}
La
costruzione va avanti alternando la costruzione di successori mediante
l'insieme potenza e l'unione generalizzata.
[En 9]
mostra che si può anche scrivere Vγ+ = Vγ ∪
P(Vγ), perché tanto, con l'insieme
vuoto come V0, Vγ ∪
P(Vγ) = P(Vγ)
[En 9]
Proviamo a vedere di cosa consistono i primi livelli:
V0
= ∅
V1
= P(∅) = {∅}
V2
= P(P(∅)) = {∅,
{∅}}
V3
= P(P(P(∅))) = {∅,
{∅}, {∅,
{∅}}}
V4
= P(P(P(P(∅)))) = { ∅, {∅}, {∅,
{∅}}, {∅,
{∅}, {∅,
{∅}}}, {∅,
{∅, {∅}}},
{{∅},
{∅, {∅}}}
}
………………………………………..
Vediamo
che si tratta della successione di ordinali:
V0
= 0
V1
= 1
V2
= 2
V3
= 3
Gli
insiemi che compaiono in ogni livello non sono tuttavia solo ordinali; ad es V4
comprende anche gli insiemi:
{∅,
{∅, {∅}}}
{{∅},
{∅, {∅}}}
che
non sono ordinali perché non sono transitivi, anche se sono ordinati dalla
relazione di appartenenza. Inoltre, se è dimostrabilmente vero che tutti gli insiemi devono comparire in
CHS, allora devono esserci insiemi come ω + 1, che non è
un ordinale (anche se è order isomorphic
ad un ordinale), ottenuti indicizzando ω ed 1 rispettivamente con 0 ed 1.
Dimostrazione che CHS contiene ogni insieme di ZF
[Go 97 riga 12, 226]
Si può dimostrare che ogni insieme di
ZF apparirà in qualche livello di CHS, quindi CHS non è altro che l'universo V
di tutti gli insiemi.
[En 9]
Questa affermazione è anche vera in un sistema con urelemente.
Il rango degli insiemi in CHS
[Go 229]
Ogni insieme x nella CHS ha un rango ρ(x),
che è dato dal least ordinal α tale che x ∈
Vα+
[En 9] Il rango di x può
anche essere definito come il minimo α tale che x ⊆
Vα.
rassegna
delle operazioni aritmetiche tra insiemi
▸ Addizione
ordinale
[Go 232]
Definiamo l'addizione ordinale, per un ordinale dato α
e tutti gli ordinali β, come segue:
α + 0 = α
α + γ+
= (α + γ)+
α + λ = ∪{α
+ γ | γ
∈ λ} per un ordinale limite λ
[Go 241]
L'addizione ordinale è associativa
▸ Moltiplicazione
ordinale
[Go 232]
Definiamo la moltiplicazione ordinale, per un dato ordinale α
e tutti gli ordinali β, come segue:
α ⋅ 0 = 0
α ⋅ γ+ = (α ⋅ γ) + α
α ⋅ λ = ∪{α
⋅
γ | γ ∈ λ} per un ordinale limite λ
[Go 242]
La moltiplicazione ordinale è associativa
▸ Esponenziazione
ordinale
[Go 232]
L'esponenziazione ordinale è definita in modo da coincidere con la definizione
equivalente per i numeri naturali, cioè gli ordinali finiti, e utilizza la
moltiplicazione in modo simile, stavolta di ordinali. Per un dato ordinale α
e tutti gli ordinali β:
α0 = 1
αγ+ = (αγ) ⋅ α
αλ = ∪{αγ | γ ∈
λ} per un
ordinale limite λ
[Go 239]
Attenzione: la moltiplicazione ordinale non è commutativa: 2 ⋅ ω = ω
≠ ω
⋅
2
▸ Somma
cardinale
[Go 270]
card(X) + card(Y) = card((X x {0}) ∪
(Y x {1}))
[En 139]
card(X) + card(Y) = card(K + L) dove K,L sono due qualsiasi insiemi disgiunti
di cardinalità card(X) e card(Y) rispettivamente
▸ Moltiplicazione
cardinale
[Go 270]
card(X) ⋅ card(Y) = card(X x Y)
[En 139]
card(X) ⋅ card(Y) = card(K x L) dove K,L sono due
qualsiasi insiemi di cardinalità card(X) e card(Y) rispettivamente
▸ Esponenziazione
cardinale
[Go 270]
card(X)card(Y) = card(XY)
[En 139]
card(X)card(Y) = card(KL) dove K,L sono due qualsiasi
insiemi di cardinalità card(X) e card(Y) rispettivamente
[Lo 165]
Se h e k sono cardinali, hk
per definizione è la cardinalità di kh, cioè dell'insieme di
tutte le funzioni da (un insieme di cardinalità) k in (un insieme di
cardinalità) h. Nel caso finito, l'operazione coincide col solito elevamento a
potenza.
Gli ordinali finiti,
incidentalmente, vennero a colmare una lacuna nel processo di consolidamento
delle fondamenta della matematica.
Le nuove scoperte nel campo
dell'analisi, ad opera di Cauchy, Bolzano, Weierstrass e dei loro allievi
crearono, intorno alla metà dell'Ottocento, la necessità di porre la mole di
conoscenze sino ad allora acquisite su fondamenta più rigorose, e si sentì il
bisogno di definire in modo preciso i numeri reali, i numeri razionali e i
numeri interi, la cui nozione era rimasta a dir poco vaga.
Nel 1872 la prima parte di questa
impresa era stata portata a termine: un articolo di Richard Dedekind aveva
finalmente proposto una soddisfacente definizione dei numeri reali in termini
di sezioni di numeri razionali(5).
I razionali erano già stati definiti come classi di equivalenza di coppie di
interi(6), e gli interi come classi di
equivalenza di coppie di numeri naturali(7). Il lavoro di Cantor e
quello di Giuseppe Peano fornirono le fondamenta mancanti: la definizione
rigorosa di numero naturale.
Nel 1898 il matematico e logico
italiano Giuseppe Peano definì quelli che sono noti come assiomi di Peano:
X
è un insieme con un elemento speciale 0 e una funzione S da X ad X chiamata
"funzione successore", tale che valgono le seguenti proprietà:
(i) la
funzione S è iniettiva
(ii) per tutti gli x appartenenti ad X, l'elemento 0 non immagine di
tali elementi
(iii) se un qualsiasi sottoinsieme A di X contiene l'elemento 0 e contiene
S(x), cioè il successore di x ogniqualvolta x appartenga ad A, allora A
coincide con X
Ogni insieme ordinato e dotato di
un'operazione di successione che soddisfa questi assiomi è chiamato un sistema di Peano. I numeri naturali sono
un sistema di Peano (in effetti gli assiomi furono dati proprio per definirne
le proprietà fondamentali).
La straordinaria importanza degli
assiomi di Peano è stata quella di aver svincolato lo studio dei naturali dal
modello numerico, aprendo la strada ad altri modelli, come quello insiemistico,
che si sarebbero rivelati estremamente efficaci per studiarne le proprietà.
In particolare, l'insieme degli
ordinali finiti, definito come sopra, con l'ordine dato dall'inclusione e la
definizione di ordinale successore, soddisfa gli assiomi di Peano. Da allora
l'insieme ω degli ordinali finiti fornì ai matematici un modello per lo
studio delle proprietà dei numeri naturali e nei testi ω viene
alternativamente definito insieme dei
numeri naturali o costruzione
insiemistica dei numeri naturali o numeri
naturali entro la teoria degli insiemi o numeri naturali entro ZFC.
[Go 188]
Cantor sviluppò il sistema degli ordinali come mezzo per estendere oltre il
finito l'idea di numerare gli stadi di un processo – "prima fa' questo,
poi quello, poi quell'altro…". Se rappresentiamo questi stadi con gli
elementi di un insieme ordinato X, allora richiediamo implicitamente che per
ogni dato stadio x ci sia uno stadio "successivo" (a meno che x non
sia lo stadio "finale", cioè l'elemento
massimo di X). Così, se x non è il massimo elemento di X, nel qual caso
l'insieme degli elementi che seguono x nell'ordine è vuoto, noi richiederemo
che questo insieme contenga un elemento minimo x+. Andando un
tantino al di là di questo requisito minimo, richiederemo che in un insieme
ben-ordinato ogni sottoinsieme non vuoto abbia un elemento minimo.
Cantor si volse a studiare le
relazioni d'ordine.
Il primo infinito, l'insieme dei
numeri naturali non ha solo una dimensione,
che Cantor era riuscito a misurare e comparare, ma anche un ordine, per cui, dati due numeri, si può
dire che uno precede e l'altro segue. Cantor indagò le caratteristiche
peculiari di questo ordine:
▸ n R
n : l'ordine dei naturali è irriflessivo: un numero n non è in
rapporto R con se stesso
▸ ((m R n)
& (n R p)) ➙
m R p :
l'ordine è transitivo: se un
numero è in rapporto con un altro e questo a sua volta con un terzo, anche il
primo e il terzo sono in rapporto.
▸ ∀n ∀m
((n R m) ∨ (m R n) ∨
(m = r)) : l'ordine soddisfa la legge di tricotomia o linearità: dati due numeri, essi sono
uguali o in relazione tra loro
▸ ∀S ≠ ∅ ⊆
ℕ
(∃ n ∈
S (∀m
∈ S (n R m)))
: l'ordine è un buon ordine: ogni sottoinsieme non vuoto
di ℕ,
insieme dei naturali, compreso ℕ stesso, possiede un elemento minimo, minore di tutti gli
altri elementi dell'insieme. Invece, l'insieme ℤ dei numeri interi non è ben
ordinato, perché ℤ, considerato come sottoinsieme di se stesso, non ha un
elemento minimo: infatti, qualsiasi numero n intero si prenda esiste sempre un
intero m che lo precede nell'ordine, talché n non può essere elemento minimo.
Le prime tre caratteristiche
individuano quella che si chiama una relazione
lineare di ordine stretto: irriflessiva, transitiva, lineare.
Una relazione riflessiva,
transitiva e lineare è invece detta relazione
lineare di ordine debole.
Una relazione di ordine debole o di
ordine stretto può anche essere non
lineare.
La relazione "<",
"maggiore di" tra i numeri naturali è una relazione di ordine stretto
lineare, mentre la relazione "≤", "maggiore o uguale
a" tra i numeri naturali è una relazione di ordine debole lineare.
A ciascun ordine stretto lineare S
corrisponde uno e un solo ordine debole lineare R ottenuto aggiungendo ad S
l'insieme delle coppie identiche: (x,x), (y,y), … ecc.
A ciascun ordine debole lineare R
corrisponde viceversa uno e un solo ordine stretto lineare ottenuto da R
sottraendo l'insieme delle coppie identiche. Così, si può parlare senza
ambiguità di ordine lineare, stretto
o debole indifferentemente.
Agli elementi di un qualsiasi
insieme finito si possono dare moltissimi buoni ordini che a prima vista
sembrano diversi: ad esempio, nell'insieme {rosso, verde, giallo, blu, bianco,
nero} i colori possono essere ordinati in 6! (fattoriale di 6) modi
(successioni) diversi.
Ma in realtà si tratta di ordini identici. Cantor precisò il concetto di ordine identico definendo, per due
insiemi X e Y ben ordinati da un ordine lineare una corrispondenza bijettiva f
che mantiene l'ordine:
x1
RX x2 ⇔ f(x1)
RY f(x2)
dove RX è la relazione
d'ordine nell'insieme X e RY è la (diversa) relazione d'ordine
nell'insieme Y.
Se due insiemi sono collegati da un
simile isomorfismo d'ordine essi
hanno ordini identici. Cantor chiamò tipo d'ordine la classe di tutti gli
insiemi legati da un isomorfismo d'ordine.
E' abbastanza stupefacente scoprire
che tutti gli insiemi finiti hanno in
realtà un solo tipo di buon ordine
lineare.
In particolare, nel caso di un
insieme finito di numeri, qualsiasi possibile ordine è isomorfo a quello della
successione aritmetica che ogni studente conosce: non ne esistono in realtà
altri.
nel caso di un
insieme infinito, ad una stessa cardinalità corrispondono più ordini possibili
Era dunque vero che ad una data
cardinalità è associato un unico ordine? E se no, come si può contrassegnare ciascun ordine, visto che la matematica
dei tempi di Cantor disponeva solo dei numeri cardinali e due ordini diversi
avevano lo stesso cardinale?
La risposta alla prima domanda fu
ottenuta subito: appare chiaro che esistono insiemi infiniti dotati della
stessa cardinalità ma di ordini diversi. Prendiamo, ad esempio, l'insieme
ω dei numeri naturali, togliamogli il numero 1 e mettiamolo alla fine, dopo la successione 2, 3, 4, 5, … Abbiamo creato un nuovo ordine,
diverso da quello della successione 1, 2, 3, 4, 5, …
Quest'ordine viene denominato
ω + 1. Da cosa si vede che si tratta di un ordine diverso? Dal fatto che
ω + 1 possiede un punto limite,
l'ultimo della serie, mentre ω non ne possiede. Un punto limite c di un
insieme ordinato da un ordine stretto, non necessariamente lineare, è tale che
esiste un punto a < c e per ogni a del genere esiste un d tale che a < d
< c.
In modo simile si possono produrre
ω + 2, ω + 3, … che sono ordini diversi l'uno dall'altro. Ma tutti
questi insiemi sono equipotenti.
Per mostrare che ω e
ω + 1 hanno la stessa cardinalità
si può mettere ω in corrispondenza biunivoca con ω + 1 utilizzando la
funzione identità :
f(n)
= n
Questa stessa funzione collega
ω a ciascuno degli altri ordini ω + 2, ω + 3, ω + 4, …
mostrandone l'equipotenza.
la
creazione dei numeri ordinali
Riepilogando: per ogni cardinalità
infinita esistono infiniti ordini, e per ogni ordine esistono infiniti insiemi
isomorfi. Occorreva trovare il modo di creare un modello più semplice possibile di insieme per ciascuna cardinalità
e ciascuno degli ordini che potevano essere dati ad insiemi di quella
cardinalità. Questo modello sarebbe stato, per i vari tipi di ordine, come il
numero cardinale per i vari tipi di dimensione. Si tratta dei numeri ordinali.
La definizione di numero ordinale è
ricorsiva.
Il primo ordinale è l'insieme
vuoto: ∅
Il secondo ordinale è definito come
l'unione del primo ordinale con l'insieme che lo contiene come solo elemento,
cioè come ∅ ∪ {∅}, che dà l'insieme {∅}.
Il terzo ordinale è definito come
l'unione del secondo ordinale con l'insieme che lo contiene come solo elemento:
{∅}
∪ {{∅}}, e cioè {∅, {∅}}.
In modo simile sono definiti il
quarto, il quinto, il sesto…, tutti gli
ordinali successivi.
Ecco i primi ordinali:
∅
: lo zero
{∅}
: l'uno
{∅, {∅}}
: il due
{∅, {∅}, {∅, {∅}}}
: il tre
La serie prosegue senza fermarsi:
{∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}} : il quattro
{∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}},{∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}}} : il cinque
il sei
il sette
l'otto…
Questi ordinali, a parte lo zero,
sono detti ordinali successori. Il
procedimento per creare un ordinale successore è quello indicato più sopra.
Formano l'insieme degli ordinali finiti,
denominato col simbolo ω.
I numeri ordinali servono per
classificare gli insiemi in cui sia stata definita una relazione di buon
ordine: irriflessiva, transitiva, lineare e in cui ogni sottoinsieme possiede
un elemento minimo. Per ogni insieme ben ordinato c'è un ordinale che gli è
isomorfo (isomorfismo d'ordine). Ciascun segmento iniziale di un insieme ben
ordinato è isomorfo (isomorfismo d'ordine) ad un ordinale.
Gli ordinali presentano varie
simmetrie e proprietà. Ogni ordinale incorpora quelli successivi. Un ordinale
contiene solo ordinali. All'interno di ciascun ordinale gli elementi sono
ordinabili per inclusione e quest'ordine ha le caratteristiche di un buon ordine. Ogni ordinale è un insieme transitivo: i suoi elementi sono
anche suoi sottoinsiemi. Tutti gli ordinali infiniti sono insiemi induttivi: un insieme A è induttivo se, oltre a possedere
l'insieme vuoto, dato un qualsiasi elemento di A, appartiene ad A anche il suo
successore. Omega ha l'ulteriore
proprietà di essere il più piccolo degli insiemi induttivi.
L'esistenza degli ordinali come insiemi induttivi necessita di un assioma,
chiamato assioma dell'infinito, che
stabilisca l'esistenza di almeno un
insieme del genere:
∃x (∅ ∈ x & ∀y (y ∈ x ➙ y ∪ {y} ∈ x))
[Go 204]
Una definizione semplice ed estremamente elegante di numero ordinale, che
comprende sia gli ordinali finiti che gli ordinali infiniti è la seguente: un
numero ordinale è un insieme transitivo ben-ordinato dalla relazione di
appartenenza.
Un insieme transitivo è un insieme
A ciascun elemento del quale è anche un insieme contenuto in esso:
a ∈ A ➙ a ⊆ A
Ecco alcune definizioni equivalenti
di insieme transitivo:
x ∈ a ∈ A ➙ x ∈ A : un elemento di un elemento di A è un elemento di A
∪A ⊆ A : l'unione degli elementi
contenuti in elementi di A è inclusa in A
A ⊆ P(A) : A è inclusa nel suo insieme potenza
Per vedere che ciascun ordinale
successivo include gli ordinali precedenti come
sottoinsiemi ma anche come elementi
è sufficiente confrontare due qualsiasi ordinali successivi:
{∅, {∅}}
{∅, {∅}, {∅, {∅}}}
Si osserva immediatamente che il
primo è incluso nel secondo.
E' facile vedere a questo punto che
un insieme transitivo completamente ordinato dalla relazione di appartenenza
deve possedere gli elementi di un ordinale e solo quegli elementi. Tutti gli
insiemi hanno come sottoinsieme ∅. Quindi un insieme transitivo deve
possedere ∅ come elemento. Poiché un insieme transitivo deve essere
ordinato per inclusione, questo vuol dire che l'elemento successivo, nel caso
l'ordinale abbia due elementi, deve contenere ∅. L'insieme transitivo non potrebbe
avere come secondo elemento, oltre ∅, un insieme α
diverso da ∅, perché non sarebbero ordinabili
per appartenenza. Quindi il secondo insieme deve essere un insieme che
quantomeno contiene ∅. Il secondo elemento.
Il secondo elemento non può
contenere un elemento β diverso da ∅
perché per la transitività, questo implicherebbe che tale secondo elemento sia
anche un sottoinsieme dell'ordinale: β dovrebbe essere un elemento
dell'ordinale diverso da ∅
e questo non è possibile, perché l'insieme vuoto e β non sono ordinabili
per appartenenza.
Ma per quanti numeri successori si
aggiungano alla serie, non si riesce, tramite la sola definizione di
successore, ad arrivare ad un insieme di cardinalità infinita: per quanto tale
successione proceda, non si riesce ad attingere al primo infinito, l'omega. Questo perché la successione 1,
2, 3, … conduce a numeri ciascuno più grande dei precedenti, ma pur sempre finiti.
Occorreva definire una successione
di ordinali che andasse oltre quelli finiti e fosse esaustiva: in cui cioè tutti gli ordinali, nessuno escluso, compaiano ad un certo punto, secondo l'ordine di
grandezza dato dall'inclusione (quello che i matematici chiamano lunghezza di un ordinale). Occorreva
definire una seconda operazione, diversa da quella del passaggio al successore.
A questo scopo l'operazione di
passaggio all'insieme potenza non può essere utilizzata, perché, mentre
l'operazione successore produce un ordinale, l'operazione di passaggio da un
ordinale al suo insieme delle parti non sempre produce un ordinale.
Consideriamo infatti il seguente
passaggio dall'insieme A all'insieme delle parti P(A):
A = {∅, {∅}, {∅,{∅}}}
P(A) = {∅, {∅}, {∅,{∅}}, {∅, {∅}, {∅,{∅}}}, {∅, {∅,{∅}}}, {{∅}, {∅,{∅}}}}
Si può vedere che gli ultimi due
elementi di P(A):
{∅, {∅,{∅}}}
{{∅}, {∅,{∅}}}
non fanno parte dell'ordinale
successore di A né di qualsiasi altro ordinale.
Bisogna quindi definire una
operazione diversa da P(A), che ci
faccia rimanere all'interno della categoria degli ordinali e che fornisca
l'ordinale precisamente successivo.
Per arrivare a omega occorre definire un diverso tipo di ordinale, l'ordinale limite, tramite una operazione
di unione infinita. Omega rappresenta il limite della successione dei numeri
naturali che si possono vedere all'interno delle parentesi graffe che sono il
simbolo di insieme:
∪{1, 2, 3, …} = ω
Dato un insieme A, se la serie dei
suoi elementi è finita e ha un massimo x allora si ha ∪A = x, cioè non viene prodotto nessun nuovo elemento oltre
quelli contenuti in A. Se la serie degli elementi è infinita, ma non sono tutti
ordinali, si produce un nuovo insieme, ma non necessariamente di cardinalità
superiore a quella di A. Se la serie di elementi è infinita, ed è composta da
ordinali, allora si produce un nuovo ordinale, di cardinalità superiore a
quelli contenuti in A. E finalmente, se, in aggiunta, questa serie è data dagli
ordinali successori di un dato ordinale, si ottiene precisamente un ordinale iniziale, cioè il primo di cardinalità superiore che segue
la serie degli elementi di A.
Si sono così ottenuti ben tre metodi per creare insiemi di
cardinalità superiore a partire da insiemi dati, finiti o infiniti: il
passaggio al successore, l'unione generalizzata, il passaggio all'insieme
potenza.
Mentre i primi due, a partire da un
ordinale o da un insieme di ordinali, producono un ordinale, non così è per il
terzo, come si è già detto.
In tal modo si giunge a quello che
Cantor chiamò il primo aleph,
l'infinito dei numeri naturali, ribattezzato col nome dell'ultima lettera
dell'alfabeto greco: ω, omega.
Oltre l'omega la serie dei numeri ordinali prosegue tornando ad utilizzare
la definizione di successore:
{ω, {ω}} : omega più uno, il primo passo sulla via
degli infiniti superiori
{ω, {ω}, {ω,
{ω}}} : omega più due
{ω, {ω}, {ω,
{ω}}, {ω, {ω}, {ω, {ω}}}} : omega più tre
Si noti la semplicità delle leggi
della numerazione: la serie degli omega è identica a quella dei numeri
naturali, con l'unica variante che al posto di ∅ è ora ω:
{∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}, …}
{ω, {ω}, {ω,
{ω}}, {ω, {ω}, {ω, {ω}}}, …}
Come si è già detto, i successori
di omega sono tutti infiniti dello
stesso tipo, nel senso che hanno tutti la stessa cardinalità.
Alternando l'operazione di
successione con quella di unione infinita si può andare oltre la cardinalità di
omega. Oltre la cardinalità di qualsiasi infinito. Ecco la definizione
del primo infinito di cardinalità superiore ad omega:
∪{ω + n | n ∈ ω}
Si ottiene così una numerazione che
va oltre i numeri naturali, la serie degli ordinali infiniti, come li chiamano i matematici. Quelli che utilizziamo nei
calcoli di ogni giorno sono invece i cardinali
finiti.
I numeri ordinali servono per
classificare gli insiemi in cui sia stata definita una relazione di buon
ordine: irriflessiva, transitiva, lineare e in cui ogni sottoinsieme possiede
un elemento minimo.
Un qualsiasi insieme ben ordinato X
può essere messo in corrispondenza bijettiva con uno e un solo ordinale Y
mediante un isomorfismo f che mantiene l'ordine:
x1
RX x2 ⇔ f(x1)
RY f(x2)
In tal modo riusciamo a
"numerare" qualsiasi insieme ben ordinato, assegnandogli il suo
numero ordinale.
Gli insiemi numerati con i numeri
ordinali differiscono tra loro o per la dimensione – cioè per il numero di
elementi – o per l'ordine – cioè per il modo in cui sono disposti gli elementi.
Due ordinali non sempre contrassegnano dimensioni diverse: potrebbero
contrassegnare due ordini diversi entro insiemi della stessa dimensione.
[Go 165 ]
Si supponga che R sia un ordine parziale debole su X e che la relazione S sia
definita da:
xSy
se e solo se xRy and x≠
y
Allora S è un ordine parziale
stretto su X e se R è lineare anche S lo è.
[Go 165 ]
Supponiamo viceversa che S sia un ordine stretto parziale su X, e che la
relazione R sia definita da:
xRy
se e solo se xSy or x = y
Allora
R è un ordine parziale debole su X e se S è lineare lo è anche R.
[Go 165 ]
Così, ciascun ordine debole su X è associato con un ordine stretto su X e
viceversa. Questo significa che quando parliamo di un insieme X con un ordine
lineare o parziale, possiamo indifferentemente riferirci alla forma debole o
stretta dell'ordine, a seconda della convenienza.
[Go 165 ]
Si tenga da ultimo presente una convenzione seguita dai matematici: un ordine
stretto su X è espresso da "<" anziché ">" al posto
di "R".
il
buon ordine della classe degli ordinali
[Go 165,167] [En 192]
La classe degli ordinali può essere ben ordinata da ∈,
che è un ordine lineare stretto, cioè ha le seguenti caratteristiche:
▸ irriflessivo
▸ transitivo
▸ lineare (o tricotomia): due elementi sono
comunque in relazione o sono uguali
▸ buon ordine: ogni insieme non vuoto contiene un
least element
Cantor fu il primo ad utilizzare
gli infiniti come oggetto di calcolo matematico e a mostrare che la loro
aritmetica è completamente diversa da quella dei numeri finiti. Addizionò un
numero finito ad un numero infinito: n + ω, e mostrò che il risultato
esiste, ed equivale invariabilmente al secondo termine, ω:
n + ω = ω
per un numero n qualsiasi, e non
solo per n = 0. Come dire che si ottiene a + b = a anche con addendi diversi da
zero. Da questo derivano ulteriori paradossi:
1 + ω = 2 + ω = 3 +
ω = …
Si ha anche:
ω + ω2 =
ω2
Si ha anche che, se ω2
appartiene o è eguale ad α, e α2 appartiene o è eguale a
β, allora ω + β = β
Dalla relazione precedente si
ricava, come caso particolare, che se ω2 è incluso o eguale ad
α, allora ω + α = α
non solo, ma è anche vero che:
1 + ω ≠ ω + 1
infatti si ha:
1 + ω = ∪{1 + γ | γ ∈ ω} = ω
ω + 1 = ω + 0+
= (ω + 0)+ = ω+ = ω ∪ {ω} ≠ ω
e risulta quindi violata anche la
proprietà commutativa.
Inoltre, questo fa vedere che le
ordinarie disequazioni non valgono, perché come conseguenza immediata
otteniamo:
1 + ω < ω + 1
e in generale, se n è diverso da
zero:
n + ω < ω + n
e anche queste sono espressioni che
risulterebbero errate nel caso di numeri naturali
Non si può scrivere, neanche nel
caso di α e β maggiori di zero:
α + β > β
ma:
α + β ≥ β
Per quanto riguarda la moltiplicazione,
si ha:
n ⋅ ω = ω
per un numero naturale n qualsiasi,
e non solamente per il numero n = 1, e si ha inoltre:
ω ⋅ ω = ω
La moltiplicazione è associativa ma
non è commutativa:
2 ⋅ ω < ω ⋅ 2
infatti si ha:
2 ⋅ ω = ∪{2 ⋅ γ | γ ∈ ω} = ω
ω ⋅ 2 = ω ⋅ 1+ = (ω ⋅ 1) + ω = ω + ω
Esistono ancora numerose altre
peculiarità:
Se 1 < h < k e k è infinito,
allora 2k = hk
La moltiplicazione è distributiva a
sinistra:
α ⋅ (β + γ) = α ⋅ β + α ⋅ γ
ma non è distributiva a destra:
(1 + 1) ⋅ ω ≠ 1 ⋅ ω + 1 ⋅ ω
infatti si ha:
(1 + 1) ⋅ ω = 2 ⋅ ω = ω
1 ⋅ ω + 1 ⋅ ω = ω + ω = ∪{ω + γ | γ ∈ ω}
e si ottiene quindi, invece
dell'eguaglianza, una diseguaglianza:
(1 + 1) ⋅ ω < 1 ⋅ ω + 1 ⋅ ω
Per quanto riguarda la sottrazione
si ha:
ω – n = ω
Inoltre, a differenza della
sottrazione tra numeri relativi, che può essere effettuata sottraendo da un
numero un numero ad esso maggiore, è impossibile definire la sottrazione tra un
ordinale β e un ordinale α superiore nell'ordinamento degli ordinali
(cioè che lo include).
Quanto all'elevazione a potenza,
essa ha le usuali proprietà:
α2 = α ⋅ α
α1 = α
1α = 1
αβ+γ =
αβ ⋅ αγ
(αβ)γ
= αβ ⋅ γ
ma non tutte:
(α + β)2
≠ α2 + α ⋅ β + β ⋅ α + β2
2ω = 3ω
= ω
(ω ⋅ 2)2 ≠ ω2
⋅
22
L'aritmetica dei numeri infiniti si
basa su definizioni rigorose. Ecco quelle di somma, sottrazione,
moltiplicazione, divisione tra ordinali.
Somma
tra ordinali:
α + 0 = α
α + β+ =
(α + β)+
α + λ = ∪{α + γ | γ ∈ λ} nel caso
λ sia un ordinale limite
Sottrazione
tra ordinali:
dati due ordinali α ∈ β esiste un unico ordinale δ tale che α +
δ = β, per cui si può scrivere:
α – β = δ
Come già detto, la sottrazione non
è definita se il sottraendo è maggiore del minuendo (non è incluso nel
minuendo).
Moltiplicazione
tra ordinali:
α ⋅ 0 = 0
α ⋅ β+ = (α ⋅ β) + α
α ⋅ λ = ∪{α ⋅ γ | γ ∈ λ} nel caso
λ sia un ordinale limite
Divisione
tra ordinali:
Siano α e δ ordinali con
δ (il divisore) diverso da zero. Allora esiste un'unica coppia di ordinali
β e γ (quoziente e resto) tali che
α = δ ⋅ β + γ
Elevazione
a potenza di ordinali:
α0 = 0+
= 1
αβ+ = (αβ)
⋅
α
αλ = ∪{αγ | γ ∈ λ} nel caso
λ sia un ordinale limite
l'insieme
∪x
di ordinali e cardinali
[Go 82] L'unione di un
insieme o di una serie di insiemi viene stabilita da un apposito assioma
(assioma dell'unione) nel sistema ZF:
∀x ∃y
∀z (z ∈
y ⇔ ∃w
(z ∈ w & w ∈
x))
[Go 82] Scriviamo ∪X,
chiamato "unione di un insieme"
x, per indicare l'insieme che, in riferimento a tale assioma è definito come:
∀z (z ∈
y ⇔ ∃w
(z ∈ w & w ∈
x))
[Go 209]
Se X è un insieme di ordinali, ∪X
è un ordinale, il minimo confine superiore ("least upper bound") di
X.
[L 158]
Se α è un insieme di ordinali, ∪α
è un cardinale ed è il primo cardinale maggiore o uguale a tutti i cardinali in
a; questo è ovvio se tra gli elementi di α c'è un massimo, che è allora ∪α.
Se in α non c'è un massimo, già sappiamo che ∪α
è un ordinale; dimostriamo che è un ordinale iniziale: supponiamo per assurdo
che esista una bijezione tra ∪α
e un β ∈ ∪α;
allora esiste k ∈ α tale
che β ∈ k e
card(β) < k; la supposta bijezione, ristretta a k ⊆
∪α, manderebbe k iniettivamente in un
sottoinsieme di β di cardinalità strettamente minore di k, il che è
impossibile. ∪α è il sup
di α rispetto all'ordine tra cardinali, perché se k < ∪α,
cioè k ∈ ∪α,
allora k ∈ h ∈
α, e k non può essere un maggiorante di α.
Per questi insiemi infiniti
superiori ad ω i matematici hanno definito un processo dimostrativo che
corrisponde a quello della dimostrazione per induzione di una proprietà dei
numeri naturali: il procedimento di induzione
transfinita. Il procedimento di induzione
ordinaria è invece quello già descritto dal terzo degli assiomi di Peano:
Se
un qualsiasi sottoinsieme A dell'insieme dei numeri naturali ℕ contiene
l'elemento 0 e contiene S(x), cioè il successore di x ogniqualvolta x
appartenga ad A, allora A coincide con ℕ.
La formulazione in termini
insiemistici rende difficile capire che in realtà questo è un procedimento per
dimostrare proprietà dei numeri
naturali. L'insieme A viene in partenza definito in base ad una proprietà. In
tal modo, il principio di induzione permette di estendere ai numeri naturali
una proprietà laddove sembra che
estenda semplicemente l'appartenenza ad A. Questo perché, in termini di teoria
degli insiemi, una proprietà P goduta dagli elementi dell'insieme X non è altro
che un sottoinsieme di X:
precisamente quello che contiene tutti e soli gli elementi che godono della
proprietà. I matematici parlano sinteticamente di "proprietà A".
Ecco il principio di induzione
transfinita, che consente di estendere una proprietà non solo ad elementi di
insiemi con la cardinalità di omega,
ma agli elementi appartenenti ad ordinali infiniti di cardinalità superiore:
Sia A un sottoinsieme dell'ordinale
α, tale che siano verificate le due proprietà:
(i) 0 ∈ A
(ii) per tutti gli ordinali β appartenenti ad
α, se β è incluso in A allora β appartiene ad A
Allora A = α
rapporti
degli ordinali con gli altri insiemi
[En 195]
(Teorema di Hartog) Dato un qualsiasi insieme A, esiste un ordinale α
che non è dominato da A, cioè tale che α ⋠
A. Un simile ordinale può essere definito come:
α
= {β | β è un ordinale &
β ≼ A}
[Go 251] Ecco la successione degli ordinali:
1,2,3,…, ω
ω + 1, ω + 2, ω + 3, …, ω + ω =
2ω
ω, ω + ω, ω + ω + ω, … = 1ω, 2ω, 3ω, …
∪{1ω,
2ω, 3ω, …} = ω ⋅ ω = ω2
(ω ⋅ ω) + 1, …,
(ω ⋅ ω) + (ω ⋅ ω) = 2(ω ⋅ ω)
1(ω ⋅ ω), 2(ω ⋅ ω), 3(ω ⋅ ω), …, ω ⋅ ω ⋅ ω = ω3
∪{ω, ω2,
ω3, …} = ωω
ωω + ωω =
2ωω, 3ωω, ω ⋅ ωω, …, ωω ⋅ ωω = (ωω)2,
…, (ωω)ω
(ωω)ω = ωω2,
ωω3,
…,
, , …
∪{, , , …} = ε0
[Go 251, 252]
Si può dimostrare
che ε0
è contabile, e quindi che ε0
<ω1; quest'ultimo, lo si ricordi ([Go 215])
è il minimo ordinale non-contabile (least
uncountable ordinal), dato da:
ω1
= {α | α è un ordinale contabile}
Ciò
è fondamentalmente dovuto al fatto che qualsiasi unione contabile di insiemi
contabili è contabile.
[En 194]
Si può dimostrare che la classe di tutti gli ordinali è una classe transitiva
ben-ordinata dalla relazione di appartenenza. Se fosse un insieme, allora
avrebbe tutte le caratteristiche di un ordinale. Ma sarebbe un membro di se
stesso, e nessun ordinale ha questa proprietà.
le
varie forme dell'assioma di scelta. prova che ac implica wo.
L'assioma di scelta può assumere
molte forme equivalenti:
▸ [Go 108] Data una famiglia F di insiemi
non-vuoti, esiste una funzione h : F ➙ ∪F
tale che per ogni A ∈
F si ha che h(A) ∈ A. Questa
funzione h è chiamata funzione di scelta
(cosiddetta choice function) per F.
▸ [Go 108] Si supponga che F è una famiglia
di insiemi disgiunti e non vuoti, cioè tali che per due distinti insiemi A,B ∈
F, A ∩ B = ∅. Allora c'è
una funzione h : F ➙
∪F tale che per ogni A ∈
F h(A) ∈ A.
▸ [Go 108] Per ogni insieme non vuoto M c'è
una funzione dagli elementi del suo insieme potenza (escluso l'insieme vuoto)
in M tale che l'immagine del sottoinsieme A di M appartenga ad A
▸ Ogni insieme può essere ben ordinato
▸ (Lemma di Zorn): Sia P un insieme non vuoto
ordinato dalla relazione R, tale che ogni catena(9) C in P abbia un
confine superiore(10) in P. Allora P contiene almeno un elemento
massimale(11).
Ma questo assioma assume forme
ancora più specifiche, come le seguenti, che non sono puramente conseguenze, ma equivalenti
dell'assioma:
▸ [Go 116] (Teorema di Tychonoff) Il prodotto
infinito di spazi compatti è compatto
▸ [Go 116] (Teorema di completezza) Dato un
linguaggio infinito del primo ordine, un insieme di formule è coerente se e
solo se ha un modello.
▸ [Go 138] (Principio dicotomico) Per due
qualsiasi insiemi A e B si ha che A ≼
B oppure B ≼ A
▸ [En 151] Per ogni relazione R c'è una funzione f ⊆
R con dominio eguale a quello di R
▸ [En 151] (Assioma di moltiplicazione) Il prodotto
cartesiano di insiemi non vuoti è sempre non vuoto
▸ [En 151] Sia A un insieme tale che (a) ogni
membro di A è un insieme non vuoto e (b) due qualsiasi membri distinti di A
sono disgiunti. Allora esiste un insieme C che contiene esattamente un elemento
da ciascun membro di A
Le
forme principali dell'assioma vengono abbreviate in AC (assioma di scelta), WO
(principio del buon ordine), ZL (lemma di Zorn)
Prova
che AC implica WO (data una funzione di
scelta un insieme può essere ben-ordinato).
[Go 265]
AC implica WO
Dopo
aver scelto un ordinale α più grande di X
tramite Hartog, utilizziamo AC per costruire una funzione suriettiva α
➙ X nel seguente modo:
data
una choice function h : P(X)\∅
➙ X tale che h(A) ∈
A per ogni A ⊆ X e un insieme
c non contenuto in X definiamo:
f
: α ➙ X ∪
X
0
↦ h(X)
β
↦ h(X\Range(f|β)) se
X\Range(f|β) ≠
∅
β ↦ c se X\Range(f|β) = ∅
(per
capire perché l'immagine di β è X\Range(f|β)) e non
X\Range(f|β–)) occorre tenere conto che β = {β–})
Si
può mostrare che se f(γ)
e f(λ) sono in X (cioè non hanno immagine c) allora è f(γ) ≠ f(λ)
Si
può mostrare che, dato Hartog e l'affermazione precedente, c deve essere in
Range(f), cioè che ci deve essere una "eccedenza" di α su X
Sia
δ il least element delle controimmagini di c
Si
può mostrare che f|δ è una bijezione δ ➙
X
Si
può sfruttare questa bijezione per dotare X di un well-order
Senza AC non si può stabilire una
bijezione tra ℕ
e un insieme numerabile
[Go 149]
Senza AC non si può stabilire una bijezione tra ℕ e un insieme numerabile (cioè
contabilmente infinito) X, perché in generale ci saranno diverse bijezioni tra ℕ e X, e abbiamo la necessità di
sceglierne una. Se X ha una sufficiente struttura, ci potrebbe essere un modo
di specificare la bijezione. Ma altrimenti è richiesta una forma di AC.
Senza AC non si può dimostrare il
converso dell'affermazione che se ℕ ≼
X allora X è infinito
[Go 149]
Senza AC si può dimostrare che se ℕ ≼
X allora X è infinito. Ma senza AC non si può dimostrare il converso, perché X
non ha sufficiente struttura per definire una iniezione da ℕ ad X.
Con AC si può assegnare un cardinale ad
ogni insieme infinito
[Go 268]
Con AC si può assegnare un numero cardinale ad ogni insieme infinito
Se A ⋠
B, senza AC non si può concludere che B ≺ A.
[Go 255]
Se A ⋠ B, senza AC non si può concludere che B ≺ A. Infatti, è lo stesso problema
dell'assioma di scelta: posto che A ➙ B sia suriettiva, come scegliere
una controimmagine per ogni elemento di B?
Con AC si può dimostrare che l'unione
contabile di insiemi nulli è nulla
[Go 113]
Un risultato classico della teoria dell'integrazione di Lebesgue è che una
unione contabile di insiemi nulli è nulla. Un sottoinsieme X di ℝ è nullo se per ogni dato ε
> 0 c'è una sequenza <In> di intervalli che copre X con
lunghezza totale inferiore ad ε, cioè X ⊆
∪{In | n ∈
ℕ} e ∑n∈ℕ l(In) < ε
[Go 114]
Un'altra conseguenza dell'assioma di scelta si ha nella teoria della misura di
Lebesgue, e consiste nel fatto che esistono sottoinsiemi non-misurabili degli
spazi ℝn.
[Go 114]
Il concetto di misura su un sottoinsieme di ℝn generalizza la nostra intuizione
della lunghezza di un intervallo di ℝ o di una curva in ℝ2, dell'area di una superficie delimitata
da un profilo in ℝ2 e del volume di un solido in ℝ3. Nella teoria di Lebesgue una misura è una funzione μ
da qualche insieme Y di sottoinsiemi di ℝn in ℝ ∪
{∞} con le seguenti proprietà:
(i) μ(X)
≥ 0
(ii) se X e Y sono sottoinsiemi congruenti di ℝn allofa μ(X)
= μ(Y)
(iii) μ
è contabilmente additivo, cioè, se X0, X1, X2,
…, Xn, … sono un numero contabile di insiemi disgiunti di ℝn allora
Normalmente
si impone un qualche tipo di unità di misura per una specifica misura: per
esempio, per misurare lunghezze di sottoinsiemi della linea reale ℝ, si definisce normalmente la
misura dell'intervallo chiuso unitario μ([0,1]) = 1 e la
misura di un intervallo [a,b] come b – a. Gli insiemi nulli sono gli insiemi
con misura zero. La misura di ℝ è posta pari ad ∞.
Utilizzando
l'assioma di scelta il quesito se tutti
i sottoinsiemi di ℝn possiedono una misura ha risposta
negativa. Come conseguenza di AC si ricava, più precisamente, che esiste un
sottoinsieme del cerchio unitario C che ha una lunghezza non-misurabile. Questo
teorema è facilmente estendibile al disco
unitario in R2.
Il paradosso di Tarski
[Go 116]
AC dà luogo al paradosso di Tarski: Sia S la sfera solida unitaria in ℝ3, cioè l'insieme di tutti i punti
compresi nella sfera di raggio unitario. Allora S può essere sottoposto a
partizione in un numero finito di sottoinsiemi che possono essere spostati,
usando traslazioni e rotazioni, per produrre due sfere solide unitarie. Questo teorema è spesso descritto come
un paradosso.
[Go 117]
Ma in realtà AC ha talmente tante conseguenze ragionevoli che sembra
desiderabile accettarlo come una parte non contestabile della matematica.
Le conseguenze principali di AC sotto
forma di lemma di Zorn
[Go 121 ss.]
Ogni gruppo ha un sottogruppo abeliano, cioè in cui l'addizione è commutativa
[Go 121 ss.]
Ogni spazio vettoriale ha una base
[Go 121 ss.]
Dati due insiemi A e B esiste una funzione iniettiva da A a B o da B ad A
Senza AC non si può provare che una
funzione possiede un'inversa
[Go 104]
Supponiamo che f : A ➙
B sia una funzione suriettiva. Esiste una funzione iniettiva g : B ➙
A tale che f(g(b)) = b per tutti gli b ∈
B? Il problema è scegliere una delle
controimmagini di ciascun b ∈
f–1(B). Se fosse B = ℕ potremmo sfruttare il buon ordine
di ℕ
e scegliere il least element. Ma già
con ℝ
non possiamo usare tale soluzione, perché un sottoinsieme non vuoto di ℝ non contiene necessariamente un
elemento minimo (least element). Non
c'è modo di trovare una funzione g con gli assiomi di ZF. Solo in alcuni casi
il problema può essere risolto: es. quando f : ℝ ➙ ℝ è continua e non-decrescente
[Go 106]
Se si ha f : ℝ ➙ B con B finito si può sempre dare una lista finita di
valori di g(f(b)), uno per ogni elemento b di B.
[Go 106]
Se B è finito non c'è problema nel descrivere g. Ma se B è infinito, abbiamo
bisogno di informazioni aggiuntive su A o su entrambi, per assicurare che
possiamo descrivere g. E se non possiamo descrivere g in modo diverso se non
stabilendo per assioma la proprietà desiderata di tale g (cioè che f(g(b)) = b
per ogni b) su quale base possiamo asserire che g esiste? E' per risolvere
questo problema che viene introdotto l'assioma di scelta.
[Go 107]
Bertrand Russell diede una divertente illustrazione dell'uso dell'assioma di
scelta. Pensate a come si può descrivere il modo di scegliere una scarpa da ciascun paio di una infinita serie di
paia. Per "descrizione" intendiamo qualcosa che può essere comunicato
ad altre persone e usato da queste in modo che ciascuna persona prenderebbe la
stessa scarpa da ogni paio. Si tratta di applicare una funzione di scelta, come
definita sopra, non una istruzione del tipo: "prendi una scarpa a caso da
ogni paio". Potremmo specificare la funzione di scelta nel seguente modo:
"Scegli sempre la scarpa sinistra". Ora proviamo a fare la stessa
cosa per un insieme infinito di paia di calzini. A differenza del caso
precedente non c'è una descrizione finita di una funzione di scelta. Si
potrebbe applicare un contrassegno ad uno del calzini di ogni paio, ma la teoria
degli insiemi richiede una descrizione finita. L'assioma di scelta dice
semplicemente che esiste una funzione di scelta, che viene evocata dal nulla!
ac, sotto forma di funzione di scelta, consente di dare ad
ogni insieme un buon ordinamento.
Dimostrazione di Enderton che grazie
all'assioma di scelta un qualsiasi insieme può essere ben ordinato.
Con
l'assioma di scelta si può definire un buon ordinamento su qualsiasi insieme A.
Il teorema di Hartog garantisce che per ogni insieme A ci sia un ordinale α
che non è dominato da A. Questo ci consente di disporre di un ordinale α
per tentare di stabilire una funzione iniettiva α ➙
A senza il rischio che gli elementi di α si esauriscano. Ma senza
l'assioma di scelta ci dovremmo fermare a questo punto, perché dal fatto che
α ⋠ A non possiamo
concludere che A ≺ α, cioè che vi è una funzione
iniettiva da A in α. Per ottenere questa funzione iniettiva dobbiamo far
uso dell'assioma di scelta, nella forma della choice function: per ogni insieme A c'è una funzione di scelta F :
P(A) ➙ A tale che F(B) ∈
B per ogni subset non vuoto B di A.
Abbiamo
anche bisogno dello Schema di Teorema di Ricorsione Transfinita: Si assuma che
esista un buon ordine > su un insieme A. Data una qualsiasi formula φ(f,y) che lega una funzione f con dominio A
ad un insieme y, tale che per ogni f esista un solo y tale che φ(f,y),
allora esiste una funzione F con dominio A tale che φ(F|seg t ,
F(t)).
[En 176]
La formula φ non è in realtà che una class
function, cioè una classe di
coppie ordinate, dall'insieme >AV di tutte le funzioni dai
segmenti iniziali di un insieme A verso un qualsivoglia altro dominio (V è la
classe universale), che consente di definire univocamente la funzione F(t) =
G(F|seg t). Ma quest'ultima formula non è consentita in ZF, perché G
è una classe e non sono ammesse classi. Così occorre riformulare G, come si è
fatto, utilizzando una formula
φ.
[En 177]
In particolare, se φ(f,y) è: "rango(f) = y" otteniamo il
seguente teorema: Si assuma che < è un buon ordine su A. Allora esiste
un'unica funzione con dominio A tale che F(t) = rango(F|seg t).
[En 196]
Sia dato un oggetto e
che non appartiene ad A e una funzione di scelta G : P(A) ➙
A. Usiamo la ricorsione transfinita per ottenere una funzione F : α ➙
A ∪ e
tale che per ogni γ
∈ α si ha:
▸ F(γ) = G(A – F[[γ]]) se A – F[[γ]] ≠ ∅
▸ F(γ) = e se A – F[[γ]] = ∅
dove
F[[γ]] =
rango(F|γ)
In
altre parole, F(γ)
è un membro scelto di A – F[[γ]]
Il
primo elemento di α è ∅,
e quindi F(∅) = G(A – F[[∅]])
= G(A – ∅) = G(A)
Poiché
ogni elemento δ di un ordinale include
in sé il segmento iniziale seg δ secondo l'ordine ∈,
col procedimento sopra indicato non c'è pericolo che la sua immagine coincida
con una delle immagini degli ordinali che esso contiene.
Una
volta stabilita l'iniezione α ➙
A, l'ordine è dato dalla stessa iniezione: f(β) < f(λ) in A sse
β ∈ λ in
α.
[En 197]
Si può dimostrare che si tratta di un isomorfismo d'ordine (order-isomorphism) tra A e il segmento
iniziale di α.
E'
possibile dimostrare che l'iniezione è tra A e il segmento iniziale di α.
Si consideri infatti una funzione F tra l'ordinale 10 = {1,2,3,4,5,6,7,8,9}
e l'insieme A = {a, b, c d, e}, che ha
cinque elementi. Se prendiamo 9, la sua immagine deve cadere in A – F[[{1,2,3,4,5,6,7,8}]],
e quindi sicuramente cadere in e. Lo
stesso vale per l'immagine di 8,7,6. Quindi la bijezione si instaura solo col
segmento iniziale {1,2,3,4,5}.
In
che modo interviene il teorema di ricorsione transfinita nel modellare la
funzione F? La formula φ(F,y)
diviene: "y = G(A – F[[γ]])"
[En 178 riga 4]
Perché il teorema funzioni è necessario anche l'assioma di
rimpiazzamento. Tale assioma viene utilizzato fondamentalmente per dimostrare
che, data una class function H su un insieme A, che H[[A]], immagine di A in H,
è un insieme. Nel caso di una ordinaria set-function
(funzione che è un insieme) il fatto
che rango(A) è un insieme è provabile in base agli altri assiomi.
[En 197]
Il teorema del buon ordinamento (ogni insieme può essere ben ordinato ed è
collegato da un isomorfismo d'ordine al segmento iniziale di un qualche
ordinale) consente di concludere che ogni insieme è equinumeroso con qualche
numero ordinale.
[En 197]
Il numero cardinale di un insieme A, indicato con card(A), è il più piccolo
ordinale equinumeroso con A.
[Ho 42]
In alternativa, possiamo dire che un numero cardinale è un ordinale che non può
essere messo in corrispondenza bijettiva con un ordinale più piccolo.
[Lo 157]
Gli ordinali finiti sono cardinali; ω è un cardinale;
ω+ non lo è. In generale se α è un ordinale infinito,
α+ non è un ordinale.
Un cardinale non è altro che un ordinale
iniziale. [En 199] Diciamo che un ordinale è un ordinale iniziale se e solo se non è
equinumeroso con nessun ordinale più piccolo. Allora ogni ordinale iniziale è
anche il proprio numero cardinale. Di
converso, qualsiasi numero cardinale deve, per definizione, essere un ordinale
iniziale. Così vediamo che cardinali e ordinali iniziali sono esattamente la
stessa cosa.
nozioni
da leggere prima di studiare i cardinali
▸ Ci sono dei simboli, come 2ω,
che indicano una cardinalità ben definita, ma non sono cardinali, perché i cardinali devono essere insiemi
ordinali. Tenere presente che ω+ è un ordinale, mentre ω +
1 non è un ordinale, pur avendo la stessa cardinalità, e anche lo stesso ordine.
▸ Alcuni
autori, come Lolli, introducono usano, accanto a Card(A), che è il cardinale
vero e proprio, anche card(A), che è invece un simbolo che va letto nel
contesto di espressioni di confronto, come "card(A) = card(B)" che
esprimono solo relazioni di equinumerosità o iniettività.
▸ ℝ è sicuramente equipotente a
numerosi ordinali con ordini diversi, ma in genere gli studiosi non sanno
indicare di che tipi di ordini si tratti. Tanto meno sanno indicare, tra tutti
gli ordinali equipotenti ad ℝ, il cardinale (ordinale) corrispondente ad ℝ. Ci si limita a dire che ℝ ≈ 2ℕ, ma 2ℕ non è neanche un ordinale.
le relazioni di
equipotenza tra insiemi e l'esplorazione delle dimensioni dei principali
insiemi
Cantor dimostrò una cosa che nessuno prima di allora aveva dimostrato: che esistono infiniti di tipo differente. Che oltre l'infinito
dei numeri naturali esiste l'infinito dei numeri reali, e oltre quello
innumerevoli e diversi altri, senza fine.
In matematica, spesso, la
formulazione esatta di un problema è più importante della soluzione. Egli si
chiese: cosa esattamente vuol dire che un insieme infinito è più grande di un altro? Provò a
ribaltare la domanda, e si chiese: in che modo possiamo verificare che due
insiemi infiniti hanno la stessa
dimensione? La risposta venne allora con chiarezza: quando è possibile
trovare una bijezione tra di essi. In tal caso si dice che hanno la stessa cardinalità o che sono equipotenti o aventi la stessa potenza. Un insieme equipotente a
quello dei numeri naturali è detto numerabile.
Armato di questo criterio, Cantor
passò al setaccio gli insiemi noti per confrontarne le dimensioni.
Emersero subito i primi apparenti
paradossi: l'insieme dei numeri naturali è equipotente
a quello dei soli numeri naturali pari:
infatti, è possibile dare la seguente legge:
f(n)
= 2n
che stabilisce una corrispondenza
biunivoca tra i due insiemi, provando che essi hanno la stessa dimensione. Una bijezione collega pure i
naturali con i naturali dispari.
Cantor indicò col simbolo
"≈" la relazione di equipotenza e col simbolo "≼" la relazione che collega
l'insieme di sinistra con quello di destra mediante una bijezione ovvero una
iniezione.
Indicò col simbolo "≺" la relazione che collega
l'insieme di sinistra con quello di destra mediante una iniezione che non è una
bijezione.
Esplorò l'argomento delle relazioni
di equipotenza tra i vari insiemi numerici.
Scoprì che l'insieme dei numeri
interi e, inaspettatamente, quello dei numeri razionali, cioè dei numeri
decimali finiti o periodici, sono equipotenti ai numeri naturali.
I numeri irrazionali – cioè tutti i
decimali non finiti e non periodici – non sono commensurabili con i numeri
naturali, hanno una dimensione superiore, la cardinalità del continuo: sono equipotenti ai punti della retta
reale. La dimostrazione di Cantor è rimasta famosa col nome di dimostrazione diagonale(3).
Scoprì anche che l'insieme dei
numeri reali può essere messo in corrispondenza biunivoca con un suo qualsiasi
sottoinsieme aperto, come quello compreso tra gli estremi zero ed uno esclusi.
Ecco, di seguito, un elenco dei più
importanti risultati conseguiti da Cantor:
P(X) ≈ 2X :
L'insieme delle parti di X è equipotente all'insieme di tutte le funzioni da X
nell'insieme {0,1} = 2
Dato un qualsiasi insieme X si ha
che X ≺ P(X) : X può
essere messo in corrispondenza bijettiva con un sottoinsieme proprio di P(X), ma non con l'intero P(X)
ℚ ≈ ℕ : l'insieme dei numeri razionali è
equipotente a quello dei numeri naturali (vedine in nota la dimostrazione)(4)
ℕ ≈ ℤ : l'insieme dei numeri naturali è
equipotente all'insieme dei numeri interi (naturali positivi e negativi)
ℕ ≺ ℝ : vale a dire che ℝ è non-contabile (contabile
è un insieme che è finito o numerabile, cioè equipotente ad ℕ)
ℝ ≈ P(ℚ) ≈ 2ℕ : l'insieme dei numeri reali è
equipotente all'insieme delle parti dei numeri razionali e all'insieme delle
funzioni dall'insieme dei numeri naturali nell'insieme {0,1} = 2
ℕxℕ ≈ ℕ : il prodotto cartesiano dato da
tutte le coppie composte da numeri di ℕ è equipotente ad ℕ
ℕ ≺ ℝ\ℚ : l'insieme dei numeri irrazionali
ℝ\ℚ è non-contabile
(–1,1) ≈ ℝ : l'insieme dei numeri reali ℝ è equipotente all'intervallo
aperto di estremi –1, 1
(x,y) ≈ ℝ : l'insieme dei numeri reali ℝ è equipotente ad un qualsiasi
intervallo aperto (con x < y)
{ℕn | n ∈ ℕ} ≈ ℕ : l'insieme di tutte le sequenze di numeri naturali è equipotente
ad ℕ
L'insieme dei numeri algebrici,
cioè l'insieme dei numeri che sono soluzioni delle equazioni algebriche:
a0xn + a1xn–1
+ … + an = 0
dove gli ai sono interi,
è numerabile
I numeri trascendenti, cioè
non-algebrici (tra cui vi sono il numero di Eulero e e π) sono equipotenti ad ℝ
gli infiniti di
cardinalità superiore a quella dei reali e l'ipotesi (generalizzata) del
continuo
Esistono altri infiniti, di cardinalità superiore a quella dei numeri reali?
La dimostrazione è in realtà
semplice: esiste un'operazione insiemistica ben nota, che da un insieme A
produce un altro insieme, denotato con P(A)
e chiamato insieme delle parti di A,
o insieme potenza di A che comprende
tutti i sottoinsiemi di A (incluso A stesso). Cantor provò che ogni volta che
si passa da un insieme all'insieme delle parti la cardinalità aumenta, e che
questo processo può essere ripetuto un numero illimitato di volte:
P(A)
P(P(A))
P(P(P(A)))
……………
Ogni volta si ottiene un infinito
di dimensione superiore.
Cantor si pose il problema
dell'immediato successore di ℝ, l'insieme dei numeri reali: tra ℝ
e P(ℝ) esiste un infinito di dimensione
intermedia, o i salti avvengono da un insieme all'insieme delle parti senza
tappe intermedie? Fece la congettura che gli insiemi intermedi non esistano. E'
nota come ipotesi generalizzata del
continuo o GCH. La congettura limitata agli insiemi ℝ
e P(ℝ) è nota come CH.
Nel
1940 Kurt Gödel
provò che se ZF è coerente, lo è pure ZF con CH e GCH.
Nel 1963 Paul Cohen mostrò che se
ZF è coerente, AC, CH e GCH non possono provate a partire dai suoi assiomi (AC
è l'assioma di scelta, di cui parleremo in seguito). GCH non può essere provato
neanche in ZFC, cioè aggiungendo a ZF l'assioma di scelta.
Il passo successivo consiste nel
creare, come naturale sviluppo della nozione di equipotenza, una seconda serie
di numeri, che contrassegna esclusivamente la dimensione di ciascun insieme infinito. Questa seconda numerazione
è quella dei numeri cardinali.
Prima di Cantor, esisteva già una
definizione di tali numeri, data da Gottlob Frege: un numero cardinale è un
insieme di tutti gli insiemi equipotenti.
Il numero 4 è l'insieme di tutti gli insiemi che possiedono quattro
elementi. Il numero 5 è l'insieme di tutti gli insiemi con cinque elementi. E
così via(8). La grande eleganza della definizione di Frege
nascondeva però gravi paradossi, che furono scoperti pochi anni più tardi.
Consideriamo il seguente paradosso:
se 1 è l'insieme di tutti gli insiemi con un elemento, possiamo formare un
nuovo insieme che contenga 1, e cioè {1}. Questo insieme include 1, ma al
contempo 1 è incluso in esso:
1 ∈ {1} ∈ 1
Ma la pecca logica fatale della
definizione di Frege era molto più sottile e molto più grave. Il sogno di Frege
era di ridurre la matematica all'insiemistica e l'insiemistica alla logica.
Questo indirizzo di pensiero viene chiamato logicismo.
Per ridurre la teoria degli insiemi alla logica, Frege stabilì una
corrispondenza tra ciascuna delle proprietà predicabili di un qualsiasi oggetto
e un insieme. Se la proprietà P è predicabile degli oggetti a, b, c, d e di
nessun altro, allora essa corrisponde all'insieme {a,b,c,d}. Viceversa,
possiamo descrivere un insieme fornendo la proprietà che hanno i suoi elementi
e nessun altro. Questo metodo di descrivere insiemi è molto potente, e viene
detto principio di astrazione:
{x | x è rosso}
è l'insieme degli oggetti rossi
{x | x è umano e x è nato in
Inghilterra}
definisce l'insieme di tutti gli
inglesi (secondo una possibile definizione di questo popolo). E così via.
E' proprio questo metodo che è
stato usato da Frege per costruire i suoi numeri naturali: uno è l'insieme i
cui elementi hanno la proprietà di essere insiemi e di avere un solo elemento:
{x | x è un insieme e x possiede un
solo elemento}
due è l'insieme i cui elementi
hanno la proprietà di essere insiemi e di possedere due elementi:
{x | x è un insieme e x possiede
due elementi}
e così via.
Ma proprio questo modo di definire
insiemi nasconde paradossi. Prendiamo ad esempio l'insieme V di tutti gli
insiemi. Allora V deve appartenere a se stesso: V ∈ V. Questo contraddice la nostra idea intuitiva di un
insieme come collezione di oggetti materiali che, in quanto tale, non può
appartenere a se stessa.
Ma il paradosso più grave, noto
come paradosso di Russell, è il
seguente. Consideriamo l'insieme S di tutti gli insiemi che non appartengono a se stessi.
Chiediamoci: S appartiene a se stesso? Se diciamo che S appartiene a se stesso,
allora S non può appartenere a se stesso,
perché gli appartengono solo gli insiemi che non appartengono a se stessi. Se
diciamo che S non appartiene a se stesso, allora S appartiene a se stesso, perché in tale insieme sono compresi
proprio gli insiemi che non appartengono a se stessi. Quale che sia
l'affermazione su S, essa genera una contraddizione con altre affermazioni che
abbiamo fatto su S.
Pertanto, non può essere
utilizzato, per fondare la teoria degli insiemi, un assioma del tipo:
∃y ∀x (x ∈ y ⇔ φ(x))
dove φ(x) è una qualsiasi
proposizione che enuncia che x ha una o più proprietà. E' detto assioma di astrazione. E' il quinto
assioma del sistema logico esposto da Gottlob Frege nel suo Grundgesetze der Arithmetik del 1893.
Senza di esso l'intero sistema – e in particolare la nozione di numero – crolla
come un castello di carte. Bertrand Russell comunicò a Frege questo paradosso
in una sua famosa lettera del 1902: Frege cadde in una crisi depressiva e non
pubblicò più nulla per molti anni.
Quando Cantor si mise all'opera,
una definizione soddisfacente di numero cardinale che sostituisse quella di
Frege non era stata ancora trovata.
[Go 128]
Cantor è il creatore della teoria dei cardinali infiniti.
L'idea alla base della moderna
definizione insiemistica di cardinale è di prendere un ordinale da ciascun
gruppo di ordinali equipotenti e definirlo come il numero cardinale di tutti quelli e degli altri insiemi non-ordinali
equipotenti. Di ciascun gruppo di ordinali equipotenti si prende il più
piccolo. [Go 268] Questo ha il vantaggio che un
cardinale è un insieme, non una classe propria, come sarebbe se fosse
definito al modo di Frege.
[Go 268]
(Effettivamente la definizione di Cantor era nella scia di quella di Frege:
egli definiva il cardinale di un insieme X come l'insieme {Y
| Y ≈ X} di tutti gli insiemi equipotenti ad X).
Ma occorre chiarire il concetto di più piccolo, introducendo una nuova
relazione di ordine lineare tra gli ordinali. Come già rilevato, tra le
notevoli proprietà dei numeri ordinali c'è quella che essi sono transitivi. Un insieme transitivo è un
insieme A ciascun elemento del quale è anche un insieme contenuto in esso:
a ∈ A ➙ a ⊆ A
La relazione di appartenenza di un
ordinale ad un altro, maggiore, come suo elemento, è la relazione idonea a
definire un ordine. In realtà, poiché due ordinali sono in relazione di
inclusione se e solo se sono anche in relazione di appartenenza, avrei potuto
usare indifferentemente anche la relazione di inclusione.
Cantor si imbatté qui in un
apparente paradosso, che non sfuggì ai suoi critici: come era possibile, che un
insieme incluso in un altro, addirittura elemento di esso potesse avere lo
stesso numero di elementi?
Ma in realtà non c'è niente di
nuovo: l'intervallo di numeri compresi tra zero ed uno esclusi appartiene ed è
incluso nell'insieme ℝ dei numeri reali, e tuttavia è equipotente ad esso. Anzi,
una caratteristica di quasi tutti gli insiemi infiniti è di essere equipotenti
ad un sottoinsieme proprio. Questa caratteristica è così comune che in effetti
è uno dei criteri utilizzati per dimostrare
che un insieme è infinito.
Definizione di numero cardinale.
Un numero cardinale, dunque, è il minimo ordinale di un gruppo di ordinali
equipotenti. Il numero cardinale ha la proprietà di essere un ordinale iniziale: non è equipotente a
nessun sottoinsieme proprio. Cardinali e ordinali iniziali coincidono. I cardinali infiniti, come vedremo più avanti, sono gli
aleph.
[Go 259] In realtà tutti gli aleph sono
anche ordinali limite, per la
semplice ragione che se fossero ordinali successori sarebbero equipotenti
all'ordinale che li precede, e che è un loro sottoinsieme proprio.
E con questo rimangono definite tre
categorie, che esauriscono tutti i tipi di ordinali: gli ordinali successori, gli ordinali
limite (quelli ottenuti con le unioni infinite di successori), e gli ordinali iniziali.
I cardinali finiti coincidono con
gli ordinali, perché la classe di ordinali equipotenti al numero n è formata
dal solo n. Invece i cardinali infiniti sono equipotenti a più ordinali infiniti.
Definendo
un cardinale come il minimo ordinale di un gruppo di ordinali equipotenti si
riesce ad assegnare un numero cardinale ad essi, e quindi ad assegnare un
cardinale ad ogni ordinale.
Dimostrazione che se un insieme X ha un
buon ordine può essergli assegnato un cardinale (aleph) E' anche possibile assegnare un numero
cardinale ad un insieme infinito, a patto che questo sia ben ordinabile. [Go 259, 268] Se X è un qualsiasi insieme infinito dotato di un buon
ordine, esso sarà collegato da un isomorfismo d'ordine ad un dato ordinale α. Tra gli ordinali equipotenti ad α esiste un ordinale iniziale ℵγ, che è anche il più piccolo
ordinale tra essi. Poiché X è equipotente ad α che a sua volta è equipotente a ℵγ si ha che X ≈
ℵγ.
Per inciso, se un insieme infinito
ha un buon ordine allora può essere dotato di tutti i buoni ordini corrispondenti ai vari ordinali equipotenti.
Questo perché questo insieme è collegabile a qualsiasi ordinale equipotente
tramite bijezione, e mediante tale bijezione può essergli imposto l'ordine
dell'ordinale.
Non è però possibile assegnare un
cardinale ad un insieme che non sia ben-ordinabile.
[Go 190]
Per lungo tempo, ad esempio, i matematici, tra cui David Hilbert, si sono
chiesti se possa essere dato un buon ordine ad ℝ. Questo buon ordine, se esiste,
deve essere diverso dall'usuale ordine
"<", perché ℝ, ordinato in questo modo, non possiede buon ordine.
Se non sappiamo nulla circa
l'esistenza del buon ordine in un insieme infinito, non possiamo assegnargli un
cardinale. E' necessario postulare il
suo buon ordine tramite uno specifico assioma, l'assioma di scelta, che, in una delle sue forme, stabilisce che
qualsiasi insieme può essere ben ordinato. Si tratta di un assioma
sorprendente, indipendente dagli altri assiomi su cui si regge la teoria degli
insiemi, e che può assumere forme apparentemente del tutto differenti, ma in
realtà equivalenti (vedi paragrafo specifico).
Come si può creare una funzione di scelta (choice function) dato un insieme con WO.
[Go 264]
Dato un well-order R su M. Allora ogni subset A contiene un elemento minimo.
Quindi possiamo definire:
h
: P(M)\{ ∅}
➙ M
A
↦ min A
Dimostrazione di come si possa assegnare
un cardinale (aleph) ad un insieme X mediante AC sotto forma di choice function.
[Go 265]
Se prendiamo l'assioma di scelta nella forma che stabilisce l'esistenza di una choice function h : P(X)\∅
➙ X con h(A) ∈
A per ogni A ⊆ X e un insieme
c non appartenente ad X, possiamo provare che esiste una bijezione tra X e un
ordinale nel seguente modo. Prendiamo un ordinale α tale che α ⋠
X (l'esistenza di tale ordinale è garantita dal teorema di Hartog). Utilizzando
h definiamo una funzione suriettiva α ➙
X ∪ c:
f
: α ➙ X ∪
c
0
↦ h(X)
β
↦ h(X\Range(f|β)) se
X\Range(f|β) ≠
∅
β ↦ c se X\Range(f|β) = ∅
Si
può mostrare che se f(γ)
e f(λ) sono in X (cioè non hanno immagine c) allora è f(γ) ≠ f(λ)
Si
può mostrare che, dato Hartog e l'affermazione immediatamente precedente, c
deve essere in Range(f), cioè che ci deve essere una "eccedenza" di
α su X, e quindi l'insieme delle controimmagini di c non sia vuoto.
Sia
δ il least element delle controimmagini di c
Si
può mostrare che f|δ è una bijezione δ ➙
X
Si
può sfruttare questa bijezione per dotare X di un well-order
Dimostrazione alternativa di come si
possa assegnare un cardinale (aleph)
ad un insieme X mediante AC sotto forma di choice
function. Il teorema di Hartog stabilisce che, dato un
insieme X, esiste un ordinale α tale che α⋠
X. Senza l'assioma di scelta, utilizzando l'assioma dell'unione, l'assioma di
separazione, l'assioma delle coppie e il buon ordinamento di α riusciamo a
costruire una serie di funzioni X ➙
α ciascuna delle quali manda tutti
gli elementi di X in un solo elemento
di α. Se postuliamo l'esistenza di una choice function, possiamo selezionare,
per ciascuna di queste funzioni, un
elemento dalla controimmagine e combinare tali coppie. Possiamo
usare la tecnica con cui sopra abbiamo usato la funzione f e un elemento
estraneo c per creare una funzione suriettiva α ➙
X ∪ c. A questo punto si possono avere tre
possibilità: o gli elementi di X terminano prima di quelli di α o gli
elementi di α terminano prima di quelli di X oppure terminano nello stesso
momento (i due insiemi sono equinumerosi). Le ultime due possibilità, per
Hartog, non possono essere, quindi deve essere la prima. Se gli elementi di X
terminano prima di quelli di α, avremo una funzione suriettiva α ➙
X ∪ c. A questo punto si prosegue con la
dimostrazione di Goldrei p. 265
La dimostrazione di come si possa
assegnare un cardinale (aleph) ad un
insieme X mediante AC sotto forma di WO si riconduce a quella, data sopra, di
come a un insieme ben ordinato possa essere assegnato un cardinale.
Molti altri risultati della teoria
di Cantor, scoprirono i matematici, dipendono in modo vitale da tale assioma.
Come abbiamo detto più sopra, riferendo dei risultati di Gödel e di Cohen,
l'assioma di scelta, esattamente come la congettura GCH è indipendente
dagli assiomi di ZF.
▸ Ordine
basato su ≼ (Enderton) (Lolli)
[En 145]
Dati due numeri cardinali κ,
λ e due insiemi K,L tale che card(K) = κ e card(L) = λ,
stabiliamo che κ
≤ λ se e solo se K ≼
L
[En 146]
Definiamo poi κ
< λ sse k ≤ λ e κ
≠ λ
[En 146]
Si può provare che l'ordine ≤ è:
▸ riflessivo: κ ≤ κ
▸ transitivo: κ ≤ λ ≤ μ ➙
κ ≤
μ
▸ antisimmetrico: κ ≤ λ & λ ≤ κ ➙ κ = λ
▸ lineare: κ ≤ λ oppure λ ≤ κ
▸ Ordine
basato sulla relazione di appartenenza (Enderton)
I numeri cardinali, come qualsiasi altro numero ordinale,
sono ben-ordinati dalla relazione di appartenenza. Posto questo, è facile
verificare che questo ordine coincide con l'ordine basato su ≼
▸ L'ordine
basato su ∈ coincide con quello basato su ≼ (Lolli) (Enderton)
[Lo 158]
[En 199]
Lolli ed Enderton dimostrano che la relazione di appartenenza tra i numeri
cardinali (cioè gli ordinali più piccoli tra quelli equinumerosi) coincide con
la relazione basata su ≼:
A ≈ B ⇔ card(A) = card(B)
A ≺ B ⇔ card(A) ∈
card(B)
Scriveremo "≤" e
"<" per le relazioni di ordine e ordine stretto tra cardinali,
anche se questa coincide con la relazione di appartenenza, per comodità di
scrittura nel caso "≤"
[En 139]
La definizione delle operazioni tra cardinali è differente da quella delle
operazioni tra ordinali:
Addizione
tra cardinali:
κ + λ = card(K ∪ L)
dove "card( )" indica la cardinalità dell'insieme
tra le parentesi, e K e L sono due qualsiasi insiemi disgiunti di cardinalità
κ e λ rispettivamente.
Moltiplicazione
tra cardinali:
κ ⋅ λ = card(K x L)
dove K e L sono due qualsiasi
insiemi disgiunti di cardinalità κ e λ rispettivamente.
Elevamento
a potenza:
κλ = card(LK)
dove LK è l'insieme
delle funzioni da L in K mentre K ed L sono due qualsiasi insiemi disgiunti di
cardinalità κ e λ rispettivamente.
Diseguaglianza:
[En 146]
card(K) < card(L) ≡ K ≼
L e K ≉ L
[En 146]
k ≤ λ ≡ k < λ oppure k =
λ
[Go 269]
k <
λ è l'usuale relazione di appartenenza
[Go 269]
k ≤
λ è il weak order associato
[En 164]
L'aritmetica dei cardinali infiniti è parzialmente differente da quella degli
ordinali infiniti. Ad esempio, nel caso dei cardinali, si può dimostrare che,
se α o β sono infiniti e diversi da zero, si ha:
α + β = α ⋅ β = max(α, β)
ciò che non è vero per tutti gli
ordinali. Infatti, come abbiamo visto, 2 ⋅ ω è un ordinale maggiore di ω.
[Go 273]
k < 2k per tutti i cardinali k
[En 146]
0 ≤ k per qualsiasi cardinale k
k
≤ λ ≤ μ ⇒
k ≤ μ
k
≤ λ e λ ≤ μ ⇒
k = λ
k
≤ λ oppure λ ≤ k
[En 148]
k ≤ λ < μ ⇒
k < μ
k
< λ ≤ μ ⇒
k < μ
[En 149]
2ℵ0
⋅
2ℵ0
= 2ℵ0
⋅ ℵ0
= 2ℵ0
[En 162]
per ogni cardinale infinito k si ha che k ⋅ k = k
[Go 271] α ⋅ β = β
⋅ α
[Go 272] k + λ = λ + k
k + (λ + μ) = (k + λ) + μ
k ⋅ (λ ⋅ μ) = (k ⋅ λ) ⋅ μ
k ⋅ (λ + μ) = (k ⋅ λ) + (k ⋅ μ)
kλ + μ = kλ ⋅ kμ
kλ
⋅ μ
= (kλ)μ
[Go 272]
dati k ≤ λ (dove ≤ è l'ordine dei cardinali "appartiene o
è eguale") si ha:
k
+ μ ≤ λ + μ
k
⋅
μ ≤ λ ⋅ μ
kμ
≤ λμ
μk
≤ μλ
[Go 272]
2k + k = 2k
2k
⋅
2λ = 2max(k ,
λ)
Se k ≤ λ
allora kλ ≤ 2λ
Come possono essere due ordinali
equinumerosi e contemporaneamente ordinati da ∈
Il
fatto che due ordinali possano essere equinumerosi e contemporaneamente
ordinati dalla relazione ∈
può apparire sorprendente. Si tenga presente che questo non è possibile per gli
ordinali finiti, ma solo per gli
ordinali infiniti. Poiché ogni
ordinale è un insieme transitivo, e
cioè un insieme α tale che β ∈
α ➙ β ⊆
α, dati due ordinali, uno è, non solo un elemento, ma anche un sottoinsieme
proprio dell'altro. Esistono facili esempi di insiemi
infiniti equinumerosi rispetto ad un sottoinsieme proprio: ad es. R ≈
(0,1). Ma si potrebbe obiettare che non si tratta di ordinali. Consideriamo allora la serie di ordinali: ω, ω+,
ω++, …, che sono in realtà equinumerosi.
Come si sa, ω = {1, 2, 3, …} e ω+
= ω ∪ {ω}
= {1, 2, 3, .., ω}. Tra ω
ed ω+ si può stabilire una bijezione collegando 1 a ω e la
successione 2, 3, … di ω e alla successione 1, 2, 3, … di ω+.
Il
problema non è solo il fatto che due ordinali equinumerosi dovrebbero avere due
ordini diversi. Esempi di due insiemi equinumerosi con ordini diversi sono
facili da trovare. Il fatto è che gli ordinali sono uno sottoinsieme proprio di un altro.
la
successione degli aleph.
l'indicizzazione mediante ordinali.
Ora si presentava per i cardinali
un problema simile a quello della successione degli ordinali: come definire un
ordine e una successione che li comprendessero tutti e li ordinasse in base
alla grandezza? Cantor utilizzò gli ordinali per indicizzare i cardinali,
creando la successione degli aleph.
Poter utilizzare nella definizione
del cardinale successore una caratteristica dell'ordinale indice (quella di
essere un ordinale limite) consente di raggiungere il risultato desiderato:
definire una successione che comprende tutti
i cardinali in ordine di grandezza.
La successione dei numeri cardinali
inizia con l'insieme vuoto: ∅, lo zero. Prosegue con i numeri naturali: 1, 2, 3, ... Poi
vengono i numeri infiniti, che Cantor chiamò aleph, dal nome della prima lettera dell'alfabeto ebraico, che si
scrive "ℵ". Come già detto, gli aleph sono gli ordinali iniziali e costituiscono i cardinali
infiniti.
La successione degli aleph è definita ricorsivamente:
ℵ(0) = ω : Omega, il più piccolo degli infiniti
ℵ(γ+) : Aleph successore, il più piccolo
ordinale iniziale α tale che ℵ(γ) possa applicarsi su α
ma non sia ad esso equipotente.
ℵ(λ) = ∪{ℵ(γ) : γ ∈ λ} : Aleph
limite, l'unione di tutti gli aleph
contrassegnati da un qualsiasi ordinale γ contenuto nell'ordinale limite
λ
(γ+ indica
l'ordinale successore di γ, e ℵ(γ) ≺ α significa che ℵ(γ) può essere proiettato
iniettivamente su α, ma non bijettivamente)
(Le espressioni "aleph
successore" e "aleph limite" non si trovano nei testi, ma solo
perché i matematici preferiscono le espressioni equivalenti di "cardinale
successore" e "cardinale limite").
Come si è già detto, per ogni
cardinale infinito, a cominciare da omega,
esistono infiniti ordini diversi, ciascuno dei quali è esemplificato da un
ordinale che è equipotente a quel cardinale.
Ordinali
infiniti e cardinali infiniti (aleph) costituiscono i numeri
infiniti, contrapposti ai numeri
finiti dell'aritmetica ordinaria.
Cantor aveva scoperto, accanto ai
numeri cardinali, già noti ai matematici, un insieme immensamente più grande e
complesso, quello dei numeri ordinali.
Con i cardinali e gli ordinali
aveva ottenuto due tipi di numeri,
con proprietà matematiche molto diverse.
i paradossi
dell'insieme di tutti i cardinali e dell'insieme di tutti gli ordinali.
L'insieme di tutti gli aleph – dei cardinali infiniti – non
esiste, né esiste l'insieme degli ordinali infiniti: sono costituiti da quelle
che i logici chiamano classi proprie,
la cui qualificazione come insiemi genera inesorabilmente paradossi.
Ne saranno indicati qui due: il
paradosso della definizione dell'insieme di tutti gli ordinali o paradosso di Burali-Forti (dal nome del
matematico italiano che lo segnalò nel 1897), e il paradosso della cardinalità
dell'insieme degli ordinali ([Go 269] c.d. paradosso di Cantor, rivelato da Cantor nel 1899).
Per quanto riguarda il primo,
chiediamoci se la classe di tutti i numeri ordinali è esso stesso un ordinale.
Sembrerebbe di sì, perché soddisfa la definizione di insieme transitivo ed è
ben ordinato dalla relazione di appartenenza. Ma contemporaneamente non può essere un ordinale, perché dagli
stessi assiomi della teoria degli insiemi che consentono di definire
compiutamente i numeri ordinali, e in particolare dal cosiddetto assioma di regolarità o assioma di fondazione (Fundierungsaxiom), si ricava la conseguenza logica che un ordinale non può appartenere a se stesso.
(L'assioma di regolarità dice che ogni insieme non vuoto A ha almeno un
elemento m tale che m ∩ A = ∅).
Per quanto riguarda il secondo
paradosso, si pensi a questa contraddizione: qual è la cardinalità della classe
di tutti gli aleph? Questa
cardinalità, l'aleph degli aleph, non può essere uno degli aleph che include, perché c'è sempre un aleph superiore. Ma contemporaneamente
deve essere uno di questi aleph,
perché, per definizione, li include tutti. [Kl
117] In due lettere a
Dedekind del 28 luglio e del 28 agosto 1899, Cantor si chiese se l'insieme di
tutti i numeri cardinali sia esso stesso un insieme perché, se lo fosse,
avrebbe dovuto avere un numero cardinale maggiore di ogni altro numero cardinale.
Egli pensava di dover rispondere in senso negativo distinguendo tra insiemi
coerenti e insiemi non coerenti.
l'ipotesi
del continuo ch e l'ipotesi generalizzata del continuo gch
Esistono altri infiniti, di cardinalità superiore a quella dei numeri reali?
La dimostrazione è in realtà
semplice: esiste un'operazione insiemistica ben nota, che da un insieme A
produce un altro insieme, denotato con P(A)
e chiamato insieme delle parti di A,
o insieme potenza di A che comprende
tutti i sottoinsiemi di A (incluso A stesso). Cantor provò che ogni volta che
si passa da un insieme all'insieme delle parti la cardinalità aumenta, e che
questo processo può essere ripetuto un numero illimitato di volte:
P(A)
P(P(A))
P(P(P(A)))
……………
Ogni volta si ottiene un infinito
di dimensione superiore.
Cantor si pose il problema
dell'immediato successore di ℝ, l'insieme dei numeri reali: tra ℝ
e P(ℝ) esiste un infinito di dimensione
intermedia, o i salti avvengono da un insieme all'insieme delle parti senza
tappe intermedie? Fece la congettura che gli insiemi intermedi non esistano. E'
nota come ipotesi generalizzata del
continuo o GCH. La congettura limitata agli insiemi ℝ
e P(ℝ) è nota come CH.
Nel
1940 Kurt Gödel
provò che se ZF è coerente, lo è pure ZF con CH e GCH.
Nel 1963 Paul Cohen mostrò che se
ZF è coerente, AC, CH e GCH non possono provate a partire dai suoi assiomi (AC
è l'assioma di scelta, di cui parleremo in seguito). GCH non può essere provato
neanche in ZFC, cioè aggiungendo a ZF l'assioma di scelta.
(1)
I tensori sono
una generalizzazione del concetto di vettore. Dato un sistema di coordinate
n-dimensionali consideriamo un punto di coordinate (x1, …, xn)
e un vettore applicato in quel punto, che esprime una direzione e una
magnitudine. Il vettore è una n-pla di numeri (v1, v2, …,
vn) che cambia al passaggio dal sistema di coordinate x al sistema
di coordinate x' secondo la legge espressa dalla formula:
[1]
dove le sono le derivate della nuova coordinata rispetto alla vecchia
nel punto considerato.
Generalizzando,
consideriamo una matrice m-dimensionale Ti1,i2,i3,…,im che ha un
valore per ciascuna combinazione di valori degli indici i1, i2,
…, im con 1 ≤ ii ≤ p per ciascun indice e che
è collegata ad un determinato punto di uno spazio p-dimensionale. La sua legge
di trasformazione tensoriale al cambiare delle coordinate dal sistema x al
sistema x̅ sarà:
[2]
dove le sono le derivate della
trasformazione. Una tale matrice è detta tensore
controvariante di ordine m.
Accanto ai tensori controvarianti, del tipo
indicato sopra, esistono anche i tensori
covarianti, contrassegnati da pedici anziché da apici, la cui legge di
variazione è invece:
[3]
La combinazione
di un tensore covariante e di un tensore controvariante dà un tensore misto, la cui legge di
variazione è:
[4]
Le formule
scritte in linguaggio tensoriale, grazie alla loro natura, consentono di
esprimere una legge naturale in modo invariante
rispetto a cambiamenti molto generali dei sistemi di coordinate, che includono
trasformazioni cartesiane, affini e curvilinee di tali sistemi. Questo le rese
ideali per esprimere la teoria della relatività generale di Albert Einstein,
che considera, accanto ai cambiamenti di coordinate dello spazio-tempo da un
sistema ad un altro in moto inerziale rispetto al primo, anche i cambiamenti di
coordinate dello spazio-tempo da un sistema ad un altro in moto accelerato rispetto al primo.
(2)
[Co "serie trigonometrica"] Una serie trigonometrica è una serie infinita della forma:
[1]
Le costanti a0,
an, bn sono i coefficienti
della serie. Se una tale serie rappresenta una funzione nell'intervallo
(–π,+π) allora i coefficienti sono dati da:
[2]
[3]
per n = 1, 2, …
Allora i
coefficienti prendono il nome di coefficienti
di Fourier e la serie viene detta serie
di Fourier della funzione.
Quali proprietà
deve possedere la funzione f(x) perché
la sua serie di Fourier converga e perché la somma di questa serie sia uguale
ai valori della funzione nei punti corrispondenti? Enunceremo le condizioni
sufficienti perché la funzione f(x) sia rappresentata da una serie di Fourier
(il problema di trovare condizioni necessarie e sufficienti su f(x) affinché la
sua serie di Fourier converga a f(x) non è stato ancora risolto).
Se la funzione
periodica f(x) di periodo 2π è monotòna a tratti (cioè possiede solo un
numero finito di massimi e minimi) e limitata sul segmento [–π,+π] la
serie di Fourier formata per questa funzione converge in tutti i punti. La
somma della serie ottenuta s(x) è uguale al valore della funzione f(x) nei
punti di continuità. Nei punti di discontinuità della funzione f(x) la somma
della serie è uguale alla media aritmetica dei limiti della funzione a destra e
a sinistra. In questi punti la serie di Fourier non approssima la funzione.
Se una funzione è
continua a tratti sul segmento [–π,+π], la convergenza della serie di
Fourier nel dato punto x0 al valore della funzione f(x0)
dipende dal comportamento della funzione in un intorno arbitrariamente piccolo
avente per centro il punto x0. Se la funzine è, nell'intorno, tale
che i suoi limiti destro e sinistro esistono e sono finiti e se nel punto la
funzione è continua, allora la serie di Fourier in questo punto converge al
valore corrispondente della funzione f(x).
La serie di
Fourier, rispetto allo sviluppo di Taylor, ha il triplice vantaggio di poter
approssimare anche funzioni discontinue, funzioni che non possiedono una
espressione analitica e di convergere non solo nell'intorno di un punto, ma in
un ampio intervallo trigonometrico. In particolare, lo sviluppo in serie di
Taylor e di Maclaurin richiede che esistano le derivate di ogni ordine, ciò che
non è richiesto per lo sviluppo in serie di Fourier.
Intorno al 1870
il matematico E. Heine sollevò il problema dell'unicità della rappresentazione
di una funzione mediante serie trigonometriche e della risposta al quesito se i
coefficienti sono necessariamente i coefficienti di Fourier.
Egli provò che
una serie di Fourier che rappresenta una funzione limitata soddisfacente alle
condizioni di Dirichlet è uniformemente convergente nelle porzioni
dell'intervallo [–π,+π] che rimangono dopo che ne siano stati
asportati intorni arbitrariamente piccoli dei punti di discontinuità della
funzione. In questi intorni la convergenza è necessariamente non uniforme.
Heine dimostrò poi che, se la convergenza uniforme ora specificata vale per una
serie trigonometrica che rappresenta una funzione, allora la serie è unica.
Le condizioni di
Dirichlet, trovate nel 1837, sono una serie di condizioni sufficienti affinché
la serie di Fourier che rappresenta una data f(x) converga e converga ad f(x).
Sia f(x) una funzione periodica di periodo 2π o una funzione data
nell'intervallo [–π,+π] ed estesa periodicamente in ogni intervallo
di lunghezza 2π a sinistra e a destra di [–π,+π]. Le condizioni
di Dirichlet sono le seguenti:
(i) f(x) è ad un valore e limitata
(ii) f(x) è continua a tratti, cioè possiede solo
un numero finito di discontinuità nell'intervallo (chiuso) che ne costituisce
il periodo.
(iii) f(x) è monotòna a tratti, cioè possiede solo
un numero finito di massimi e minimi nello stesso intervallo di cui sopra
I problemi
connessi con l'unicità delle serie trigonometriche e delle serie di Fourier
attirarono Georg Cantor, che aveva studiato il lavoro di Heine. Cantor iniziò
le sue ricerche cercando criteri di unicità per le rappresentazioni delle
funzioni mediante serie trigonometriche e dimostrando (1870) che quando f(x) è
rappresentata da una serie trigonometrica convergente per tutti gli x, non
esiste nessun'altra serie della stessa forma che converga per tutti gli x e che
rappresenti la stessa f(x).
Il teorema di
unicità dimostrato da Cantor può essere riformulato nel modo seguente: se, per
tutti gli x, esiste una rappresentazione convergente dello zero mediante una
serie trigonometrica, allora i coefficienti an e bn sono
tutti nulli. Infatti, una serie con coefficienti tutti nulli dà sicuramente
zero, e non ci possono essere serie diverse. Quindi la serie che dà zero è quella
con coefficienti nulli.
Un altro
risultato di Cantor del 1871 afferma che vale la stessa conclusione anche se si
rinuncia alla convergenza in un numero finito di punti. Questo lavoro fu il
primo di una serie in cui Cantor studia l'insieme dei valori eccezionali di x,
estendendo il risultato sull'unicità al caso in cui è ammesso un insieme
infinito di valori eccezionali.
Per descrivere
questo insieme Cantor comincia a definire un punto p punto limite di un insieme di punti S se ogni intervallo contenente
p contiene infiniti punti di S. Introduce poi la nozione di insieme derivato S(1) di un
insieme di punti S, che è l'insieme di tutti i punti limite dell'insieme di
partenza. Esiste poi un secondo insieme derivato S(2) cioè l'insieme
derivato dell'insieme derivato, e così via: S(3), S(4)
ecc. Se l'n-esimo insieme derivato di un insieme dato è costituito da un
insieme finito di punti, l'insieme di partenza è detto di n-esimo tipo o di n-esimo
ordine (o di prima specie).
La risposta
finale data da Cantor al problema della possibilità per una funzione di avere
due diverse rappresentazioni mediante serie trigonometriche nell'intervallo
[–π,+π] o, equivalentemente, della possibilità per lo zero di avere
una rappresentazione in serie di Fourier non nulla dice che, se nell'intervallo
una serie trigonometrica ha come somma zero in tutti i punti x tranne che in
quelli di un insieme di n-esimo tipo (nei quali non si sa nulla della serie),
allora tutti i coefficienti della serie devono essere nulli.
Quando S(1)
≠ ∅ e S(2) = ∅ questo significa che S è infinito.
Cantor voleva portare avanti la sua costruzione
per il caso in cui nessuno degli insiemi derivati S(1), S(2),
… fose vuoto. Poi fece uso ripetuto
della costruzione degli insiemi derivati per dare S(∞+1),
S(∞ + 2) ecc. e nel caso che nessuno di questi fosse vuoto, di
nuovo prese la loro intersezione per dare S(∞+∞), e così
via. Alla fine Cantor studiò gli apici:
∞, ∞
+1, ∞ + 2, ∞ + ∞, …
Si trattava
chiaramente di numeri che andavano oltre i numeri naturali, che lui chiamò numeri ordinali.
(3)
Ecco la
dimostrazione:
Supponiamo che ℝ sia contabile (cioè che esista una
bijezione tra ℝ ed ℕ, insieme dei naturali). Allora dovremmo poter enumerare i
numeri reali nell'intervallo [0,1), chiuso a sinistra e aperto a destra nel
seguente modo:
a1, a2,
a3, …, an, …
con ciascun
numero reale nell'intervallo [0,1) che compare come an per esattamente uno e un
solo n ∈ ℕ, n ≥ 1. Rappresenteremo un
tale numero reale nella sua espansione decimale,
r = 0,r1r2r3…rn….
con l'accorgimento
di evitare l'uso dei 9 (ad esempio, rappresenteremo 0,2 come 0,2000… piuttosto
che come 0,1999…). Possiamo visualizzare i numeri nell'intervallo [0,1) in una
lista:
a1 =
0,a1,1a1,2a1,3…
a2 = 0,a2,1a2,2a2,3…
a3 = 0,a3,1a3,2a3,3…
……………………
an = 0,an,1an,2an,3…
……………………
Si noti che gli
indici delle cifre sono tutti diversi. Ora definiamo un numero reale r = 0,r1r2r3…rn…
nel seguente modo:
rn =
4 se an,n ≥ 6
rn =
7 se an,n < 6
r appartiene
chiaramente all'intervallo [0,1). Ma r è stato costruito in modo da differire
da ciascun an per la n-esima cifra decimale, cosicché non può essere
uguale a nessuno degli an che si sono listati sopra per nessun n.
Così r non appare nella lista, contraddicendo l'ipotesi che la lista contenga
tutti i numeri reali compresi nell'intervallo [0,1).
(4)
Ecco la
dimostrazione che i numeri razionali sono numerabili:
I numeri
razionali possono essere disposti nel modo seguente:
1/1 2/1 3/1 4/1 5/1 …
1/2 2/2 3/2 4/2 5/2 …
1/3 2/3 3/3 4/3 5/3 …
1/4 2/4 3/4 4/4 5/4 …
………………………………………
Si noterà che
tutti quelli che appartengono a una stessa diagonale hanno la stessa somma del
numeratore e del denominatore. Partendo ora da 1/1 si operi la seguente
numerazione:
1 ➙ 1/1
2 ➙ 2/1
3 ➙ 1/2
4 ➙ 1/3
5 ➙ 2/2
6 ➙ 3/1
7 ➙ 3/1
8 ➙ 4/1
9 ➙ 3/2
10 ➙ 2/3
11 ➙ 1/4
12 ➙ 1/5
…………
Come si vede, si
parte o dalla prima colonna o dalla prima riga e si procede nelle righe o
colonne successive, individuando tutti i numeri razionali che hanno la stessa
somma di numeratore e denominatore. L'ultimo numero con la stessa somma sarà
incontrato così sulla prima colonna o sulla prima riga. Si salta in tale
colonna o riga al numero con la somma immediatamente più alta e si ricomincia.
Ogni numero razionale verrà così raggiunto ad un certo punto e a ciascuno verrà
associato un numero intero. Non ha importanza che nella tabulazione dei numeri
razionali alcuni (es. 2/1 e 4/2) compaiano più di una volta.
(5)
Una sezione di Dedekind è un sottoinsieme x
dell'insieme ℚ dei numeri razionali tale che:
(i) x non è né l'insieme vuoto ∅ né ℚ
(ii) se un numero q appartiene ad x allora vi
appartengono tutti i numeri inferiori
(iii) x non ha un elemento massimo, cioè un numero
più alto di tutti quelli dell'insieme
(6)
I numeri
razionali sono definiti come classi di equivalenza di coppie di interi. Il
numero razionale 3/4 è ad esempio rappresentato indifferentemente dalle coppie
(3,4), (6,8), (9,12), ecc. perché si ha:
3/4 = 6/8 = 9/12,
ecc.
La coppia (a,b) è
in relazione di equivalenza con la coppia (c,d) ogniqualvolta si ha a ⋅ d = b ⋅ c. Questa relazione è riflessiva,
simmetrica e transitiva. I sottoinsiemi di ℤ x ℤ costituti da coppie equivalenti
rappresentano ciascuno uno stesso numero razionale. E' possibile definire
facilmente delle operazioni tra classi di equivalenza con le proprietà delle
operazioni usuali tra numeri razionali.
(7)
I numeri interi
(cioè i naturali con segno) sono definiti come classi di equivalenza di coppie
di numeri naturali. Il numero –3 è ad esempio rappresentato indifferentemente
dalle coppie (1,4), (2,5), (3,6), ecc. perché si ha:
–3 = 1 – 4 = 2 –
5 = 3 – 6, ecc.
La coppia (a,b) è
in relazione di equivalenza con la coppia (c,d) ogniqualvolta si ha a + b = b +
c. Come nel caso dei razionali, è possibile definire tra tali classi di
equivalenza delle operazioni (addizione, moltiplicazione, ecc.) con le
proprietà delle usuali operazioni tra numeri interi.
(8)
La definizione di
Frege è ricorsiva. Il numero zero è l'insieme che contiene gli insiemi che non
hanno elementi. Esiste un solo insieme di tal genere, l'insieme vuoto ∅, quindi il numero zero è l'insieme
che contiene l'insieme vuoto: {∅}. Dato un numero n, il successore è definito come:
n + 1 = {B | ∃A (A ∈ n & A ⊆ B & B\A ∈ 1}
e cioè:
n + 1 = {B | esiste
un A che appartiene ad n ed è incluso in B ed è tale che B senza A ha solo un
elemento}
(9)
Una catena in un insieme S con un ordine
debole parziale è un sottoinsieme C non vuoto di S e in esso la relazione
d'ordine risulta anche lineare.
(10)
Dato un insieme S
con una relazione R di ordine debole, un elemento c di S è un confine superiore di un sottoinsieme X
se y R c per tutti gli y di X
(11)
Dato un insieme S
con una relazione R di ordine debole, un elemento m di P è un elemento massimale di P se non c'è
nessun x ∈ P diverso da m tale che x R m.
(12)
Per capire cosa
sia la topologia, consideriamo una superficie costituita da un foglio di carta
perfettamente piano. Se arrotoliamo in forma cilindrica il foglio di carta o lo
appallottoliamo, abbiamo distrutto le sue qualità di forma, ma non le sue
qualità metriche, date dalle distanze reciproche tra i punti, che vengono
mantenute sia sul cilindro che sul foglio appallottolato. A questa distinzione
può essere dato significato matematico rigoroso.
Si consideri una
superficie rappresentata in un sistema di coordinate xyz in forma parametrica:
x = x(h1,h2)
y = y(h1,h2)
z = z(h1,h2)
dove h1
e h2 sono i due parametri che contrassegnano ogni punto della
superficie (si pensi alla latitudine e longitudine della superficie terrestre).
Le proprietà
metriche o di distanza della superficie vengono determinate dalla conoscenza,
punto per punto, dei coefficienti E,F,G della espressione (detta prima forma fondamentale):
E ⋅ dh1 ⋅ dh1 + 2F ⋅ dh1 ⋅ dh2 + G ⋅ dh2 ⋅ dh2
che fornisce la
lunghezza del vettore derivata direzionale in R3 nel punto
considerato secondo il vettore di componenti (dh1,dg2)
dello spazio dei parametri h1h2
Per la
determinazione delle proprietà di forma, indipendentemente dalla posizione nel
sistema di coordinate xyz è necessario invece conoscere i coefficienti L, M, N
della seconda forma fondamentale, che
fornisce la componente della variazione del vettore normale alla superficie
nella direzione della derivata direzionale secondo il vettore (dh1,dh2):
L ⋅ dh1 ⋅ dh1 + 2M ⋅ dh1 ⋅ dh2 + N ⋅ dh2 ⋅ dh2
Se eliminiamo
anche le proprietà metriche, ma lasciamo le proprietà di posizione reciproca
dei punti, abbiamo sostituito al foglio di carta un foglio di gomma sottile che
possiamo deformare come vogliamo, ma in cui i punti mantengono sempre la stessa
posizione reciproca. Sono rimaste solo le proprietà topologiche.
Per studiare
queste proprietà Felix Hausdorff introdusse il concetto di topologia su un
insieme.
Una topologia su un insieme X è una classe T
di sottoinsiemi di X con le seguenti caratteristiche:
(i) ∅, l'insieme vuoto, appartiene a T e
T stesso appartiene a T
(ii) L’unione e la intersezione di insiemi di T
appartiene a T
Gli elementi di T
sono chiamati gli insiemi aperti (o aperti) e un insieme dotato di topologia è
detto spazio topologico.
(13)
Ecco la
classificazione topologica dei punti di un insieme:
Sia
dato un insieme X dotato di una topologia T
INSIEME APERTO
è un insieme che appartiene alla topologia
INSIEME CHIUSO
è il complemento in X di un insieme aperto
INTORNO DI UN PUNTO
è qualsiasi insieme che contenga un aperto contenente il punto (incluso
l’aperto stesso)
PUNTO INTERNO: dato un sottoinsieme S di X, P è un punto interno di S se
esiste un intorno di P contenuto in S
PUNTO ESTERNO: dato un sottoinsieme S di X, P è un punto esterno ad S se
esiste un intorno di Q contenuto nel complemento di S in X
PUNTO DI FRONTIERA: dato un sottoinsieme S di X, P è un punto di frontiera di S
se in ogni intorno di P cadono sia punti di S che punti del complemento di S in
X
PUNTO ISOLATO: dato un sottoinsieme S di X, P è un punto isolato di S se
esiste un intorno di P che, a parte P, non contiene punti di S
PUNTO DI ACCUMULAZIONE o PUNTO LIMITE: dato un sottoinsieme S di X, P è
un punto di accumulazione di S se in ogni suo intorno cadono punti di S
INTERNO DI UN INSIEME è l'insieme dei suoi punti interni
INSIEME DERIVATO di un insieme S incluso in X è l'insieme di tutti i suoi
punti di accumulazione