Negli anni Venti e Trenta del Novecento, logici e matematici come Hilbert, Gödel, Church e Turing cercavano un modello rigoroso di “procedura effettiva” (ossia di algoritmo) per affrontare il cosiddetto Entscheidungsproblem (problema della decisione): esiste un metodo meccanico per decidere la verità o falsità di qualunque enunciato matematico?

Per rispondere, occorreva chiarire cosa significhi calcolare in modo puramente meccanico: come descrivere formalmente una sequenza di operazioni che, dato un valore iniziale, produca un risultato.

Il matematico statunitense Alonzo Church sviluppò allora un formalismo minimale che prendeva come unica base il concetto di funzione matematica, in quanto una funzione può essere rappresentata come un processo che, dato un certo input, restituisce un certo output. La sua intuizione fu di considerare le funzioni non più soltanto come relazioni immutabili tra insiemi, ma come oggetti matematici manipolabili, su cui fondare una nuova branca della matematica: ecco quindi la nascita del $λ$ -calcolo.

Definizione: $λ$ -calcolo

Il $λ$ -calcolo è un sistema formale formulato a partire dagli anni Trenta dal matematico americano Alonzo Church, sviluppato per esprimere formalmente il procedimento di computazione di una funzione matematica espressa per mezzo di un linguaggio formale i cui termini possono essere usati per rappresentare calcoli in modo astratto.

Il $λ$ -calcolo essenzialmente permette di “calcolare” con le funzioni matematiche così come è possibile calcolare normalmente con i numeri: avendo anticipato così il concetto di linguaggio di programmazione prima dell’avvento stesso dei computer (che arriveranno solo negli anni Quaranta), il $λ$ -calcolo viene considerato uno dei primi linguaggi di programmazione della storia ma utilizzabile solo “sulla carta” (perché, appunto, non esistevano ancora i computer lol).

Dal $λ$ -calcolo, inoltre, nasce uno dei primi paradigmi di programmazione della storia: quello funzionale, che prende il nome proprio dal concetto delle funzioni matematiche su cui è costruito.

Per intenderci, guarda questa espressione apparentemente senza senso:

λn . n (λ f . λa . λ x . f ((λ x . λ y . λ z . x (y z)) a x) ((λn . λ f . λ x . f (n f x)) x)) (λ x . λ y . x) (λ f . λ x . f x) (λ f . λ x . f x)

Sentiti liber* di crederci o no, ma questa espressione, che chiameremo termine, rappresenta il “codice” in $λ$ -calcolo per calcolare il fattoriale di un numero naturale $n$ qualsiasi.

Ma come fa a essere questo ammasso di lettere casuali un codice? Se sei curios* di saperlo, benvenut* nel magico mondo del $λ$ -calcolo.

(Attent*! Stai per finire in un rabbit-hole da cui potresti non uscirne più. Io ti ho avvertit*…)

Termini del $λ$ -calcolo

Prima di arrivare a capire cosa sono gli oggetti principali con cui opera il $λ$ -calcolo, cioè i termini, vediamo come sono nati.

Astrazioni

Durante il processo di definizione del $λ$ -calcolo, Alonzo Church decise in primis di modificare la notazione classica della definizione di una funzione:

f : A \to B a \mapsto b

Il signor Church, per rendere la notazione più scorrevole e, soprattutto, il più astratta possibile (in modo da poterci fare operazioni più comodamente), scelse di evitare di indicare per ogni funzione il suo nome (in questo caso $f$ ) e gli insiemi posti in relazione ( $A$ e $B$ ), valorizzando in particolare proprio la trasformazione che avviene grazie alla funzione ( $a \mapsto b$ ).

La nuova notazione di Church rappresenta le funzioni introducendole con un $λ$ (da qui il nome del $λ$ -calcolo) per indicare l’inizio della definizione di una funzione, seguito dalle due variabili separate da un punto:

λa . b

Questo modo di definire “astrattamente” una funzione viene detto astrazione.

Definizione: astrazione

Nel $λ$ -calcolo, un’astrazione (anche detta $λ$ -astrazione) è una definizione di una funzione anonima, cioè una funzione che non ha un nome ma è identificata direttamente dalla sua regola di trasformazione.

Un’astrazione ha la forma:
$λ x . M$
dove:

$x$ è una variabile che rappresenta l’argomento della funzione e

$M$ è un termine del $λ$ -calcolo che rappresenta il corpo della funzione.

Applicazioni

Con l’astrazione abbiamo capito come possiamo definire una funzione e il suo comportamento, ma concretamente come facciamo a “utilizzarla” dandole in input un certo numero?

Il mitico Alonzo decise di adottare quindi la seguente notazione: presa un’astrazione $λ x . M$ , questa viene posta tra parentesi tonde e viene seguita dal numero $n$ che vogliamo sostituire all’argomento dell’astrazione:

(λ x . M) n

Per esempio, data un’astrazione $λ x . M$ dove $M$ indica la somma di $1$ a $x$ (quindi $x + 1$ ) e $n$ è uguale a $3$ , potremmo scrivere (seppur effettuando in questo caso un abuso di notazione, perché nel $λ$ -calcolo non è possibile usare direttamente i numeri in questo modo):

(λ x . x + 1) 3

Ciò ci indica che, alla variabile di input $x$ che rappresenta l’argomento dell’astrazione, noi dobbiamo sostituire il numero $3$ , in modo da ottenere come risultato $4$ : a questa notazione Church diede il nome di applicazione.

Definizione: applicazione

Nel $λ$ -calcolo, un’applicazione (anche detta $λ$ -applicazione) è l’operazione che consiste nell’utilizzare una funzione su un argomento.

Un’applicazione ha la forma:
$(M N)$
dove:

$M$ è un’espressione del $λ$ -calcolo che rappresenta una funzione e

$N$ è un’espressione del $λ$ -calcolo che rappresenta l’argomento su cui la funzione viene applicata.

Termini

Ora che abbiamo definito cosa sono un’astrazione e un’applicazione, potremmo dire che questi due sono gli oggetti fondamentali con cui andremo a operare nel $λ$ -calcolo: i nostri termini, quindi, possono assumere una di queste forme sintattiche possibili tra un’astrazione, un’applicazione e una semplice variabile.

Definizione: termine nel $λ$ -calcolo

Nel $λ$ -calcolo, un termine $T$ (anche detto $λ$ -termine o $λ$ -espressione) è una stringa ben formata a partire dalla seguente grammatica espressa in BNF:
$T ::= x ∣ (λ x . T) ∣ (T T)$
dove:

$x$ è una variabile,

$(λ x . T)$ è un’astrazione con argomento $x$ e corpo $T$ e

$(T T)$ è un’applicazione in cui la funzione $T$ viene applicata all’argomento $T$ .

Ognuna di queste 3 forme che può assumere un termine è detta forma sintattica.

Esempi di termini

Ecco qualche esempio di termini del $λ$ -calcolo correttamente espressi:

$x$ è un termine che rappresenta una semplice variabile $x$ .

$(λ x . x)$ è un termine che rappresenta un’astrazione con argomento $x$ e corpo $x$ .

$((λ x . (x x)) (λ y . (y y)))$ è un termine che rappresenta un’applicazione della funzione $(λ x . (x x))$ all’argomento $(λ y . (y y))$ . A loro volta, possiamo analizzare questi “sotto-termini”:

$(λ x . (x x))$ è un termine che rappresenta un’astrazione con argomento $x$ e corpo $(x x)$ . A sua volta:

$(x x)$ è un termine che rappresenta un’applicazione della funzione $x$ all’argomento $x$ .

$(λ y . (y y))$ è un termine che rappresenta un’astrazione con argomento $y$ e corpo $(y y)$ . A sua volta:

$(y y)$ è un termine che rappresenta un’applicazione della funzione $y$ all’argomento $y$ .

$(λ f . (λ x . (f (f x))))$ è un termine che rappresenta un’astrazione con argomento $f$ e corpo $(λ x . (f (f x)))$ . A sua volta:

$(λ x . (f (f x)))$ è un termine che rappresenta un’astrazione con argomento $x$ e corpo $(f (f x))$ . A sua volta:

$(f (f x))$ è un termine che rappresenta un’astrazione con argomento $f$ e corpo $(f x)$ . A sua volta:

$(f x)$ è un termine che rappresenta un’applicazione della funzione $f$ all’argomento $x$ .

Riscrittura dei termini

È possibile riscrivere i termini eliminando alcune parentesi per migliorare la leggibilità.

Notazione: omissione delle parentesi più esterne di un termine

In un termine è possibile omettere le parentesi più esterne.

Per esempio, un termine $T = (λV . T)$ che rappresenta un’astrazione con argomento $V$ e corpo $T$ si può riscrivere come $T = λV . T$ .

Allo stesso modo, un termine $T^{'} = (U V)$ che rappresenta un’applicazione della funzione $U$ all’argomento $V$ si può riscrivere come $T^{'} = U V$ .

Notazione: omissione delle parentesi in un'astrazione

In un termine $T = λV . T^{'}$ che rappresenta un’astrazione con argomento $V$ e corpo $T$ si possono eliminare le parentesi più esterne del sotto-termine $T^{'}$ .

Per esempio, un termine $T = λV . (X (λ y . Z))$ si può riscrivere come $T = λV . X (λ y . Z)$ . Semplicemente, se non sono presenti delle parentesi, tutto quello a destra del punto viene considerato come il corpo dell’astrazione (che in questo caso corrisponderebbe a $X (λ y . Z)$ ).

Notazione: omissione delle parentesi in un'applicazione

In un termine $T = U V$ che rappresenta un’applicazione della funzione $U$ all’argomento $V$ si possono eliminare le parentesi più esterne della funzione $U$ .

Per esempio, un termine $T = (M_{1} M_{2} ) (M_{3} M_{4} )$ si può riscrivere come $T = M_{1} M_{2} (M_{3} M_{4} )$ , ma NON come $T = M_{1} M_{2} M_{3} M_{4} $ perché $(M_{3} M_{4} )$ è l’argomento dell’applicazione.

Esercizio 1 sulla riscrittura dei termini

Rimuovere il più possibile le parentesi, senza cambiare il significato, del seguente termine:
$(λ x . ((x x) x))$

Soluzione

È possibile innanzitutto rimuovere le parentesi più esterne del termine:
$λ x . ((x x) x)$
A questo punto, avendo un’astrazione con argomento $x$ e corpo $((x x) x)$ , è possibile rimuovere le parentesi nel corpo:
$λ x . (x x) x$
Il corpo $(x x)$ x è un’applicazione della funzione $(x x)$ all’argomento $x$ , quindi possiamo rimuovere le parentesi della funzione:
$λ x . x x x$

Variabili libere e legate in un termine

Prima di cominciare a effettuare operazioni con i termini, ci serve definire un ultimo concetto che ci permette di capire quale valore hanno le variabili all’interno dei termini stessi: per esempio, nell’astrazione $λ x . M$ e nell’applicazione $x M$ la variabile $x$ non ha lo stesso “peso”, perché nel primo caso è “legata” al termine $M$ (essendo un argomento di quella funzione), mentre nel secondo caso è “libera” e non ha alcun particolare legame con $M$ .

Fare questa distinzione è importante perché, svolgendo operazioni sui termini, dobbiamo assicurarci che il loro significato non venga modificato andando a toccare quelle variabili “legate”.

Definiamo formalmente quindi questa differenza.

Definizione: variabili libere e legate

L’insieme delle variabili libere di un termine $T$ , denotate con $fv (T)$ (dall’inglese free variables), è definito induttivamente sulla struttura di $T$ come segue:

Quando il termine $T$ è una variabile $x$ :
$fv (T) = fv (x) = def {x}$

Quando il termine $T$ è un’astrazione $λ x . M$ :
$fv (T) = fv (λ x . M) = def fv (M) ∖ {x}$

Quando il termine $T$ è un’applicazione $M N$ :
$fv (T) = fv (M N) = def fv (M) \cup fv (N)$

Una variabile contenuta in $T$ si dice libera se è presente in $fv (T)$ , legata altrimenti.

Esempi di variabili libere e legate

Ecco qualche esempio di variabili libere e legate in diversi termini:

$x$ : la variabile $x$ è libera perché non è vincolata da alcuna astrazione:
$fv (x) = {x}$

$λ x . x$ : la variabile $x$ è legata perché è vincolata dall’astrazione (essendo un suo argomento):
$fv (λ x . y) = fv (x) ∖ {x} = {x} ∖ {x} = \emptyset$

$λ x . y$ : la variabile $x$ è legata perché è vincolata dall’astrazione (essendo un suo argomento), ma la variabile $y$ no:
$fv (λ x . y) = fv (y) ∖ {x} = {y} ∖ {x} = {y}$

$λ x . λ y . y z x$ : le variabili $x$ e $y$ sono legate perché vincolate dalle rispettive astrazioni (essendo loro argomenti), ma la variabile $z$ no:

$fv (λ x . λ y . y z x) = fv (λ y . y z x) ∖ {x} = (fv (y z x) ∖ {y}) ∖ {x} = ((fv (y) \cup fv (z) \cup fv (x)) ∖ {y}) ∖ {x} = (({y} \cup {z} \cup {x}) ∖ {y}) ∖ {x} = ({y, z, x} ∖ {y}) ∖ {x} = {z, x} ∖ {x} = {z}$

Osservazione: variabili libere e legate come visibilità nei linguaggi di programmazione

La distinzione tra variabili libere e legate è utile a farci capire, trasportando questo concetto sui linguaggi di programmazione, a capire qual è la visibilità delle variabili che usiamo:

Le variabili legate possono essere pensate come variabili “locali” della funzione, utilizzabili unicamente all’interno di quella funzione e senza bisogno di altre informazioni dall’esterno per capire a cosa servono.

Le variabili libere possono essere pensate come variabili “globali” della funzione, usate al suo interno ma in realtà dichiarate all’esterno della funzione e, quindi, il loro valore dipende dal contesto in cui si trova la funzione.

Definizione: cattura di una variabile libera

Una cattura è l’operazione con cui una variabile libere diventa legata.

Combinatori

Un concetto strettamente collegato a quello di variabili libere e che ci tornerà utile più tardi è quello dei combinatori.

Definizione: combinatore

Un combinatore (o termine chiuso) è un termine $T$ senza variabili libere:
$fv (T) = \emptyset$

Relazioni tra termini

Sostituzione

Come abbiamo visto, un’applicazione $M N$ rappresenta essenzialmente la sostituzione delle variabili contenute in $M$ con i valori di $N$ . Ma ciò non è un’operazione banale: le uniche variabili sostituibili sono quelle libere e questa è una cosa di cui bisogna tener conto per evitare catture. Definiamo quindi correttamente come deve funzionare una sostituzione in un termine.

Definizione: sostituzione

Nel $λ$ -calcolo, una sostituzione è un’operazione binaria tra due termini $T$ ed $N$ in cui una variabile libera $y$ di $T$ viene sostituita con $N$ . Viene denotata come $T [N / y]$ ed è definita induttivamente sulla struttura di $T$ come segue:

Quando il termine $T$ è una variabile $x$ :
$T [N / y] = x [N / y] = def {N x x = y x \neq = y$

Quando il termine $T$ è un’astrazione $λ x . M$ :
$T [N / y] = (λ x . M) [N / y] = def ⎩ ⎨ ⎧ λ x . M λ x . M [N / y] λ z . M [z / x] [N / y] x = y x \neq = y \land x \in / fv (N) x \neq = y \land x \in fv (N)$
con $z \in Var ∖ (fv (M) \cup fv (N))$

Quando il termine $T$ è un’applicazione $M_{1} M_{2}$ :
$T [N / y] = (M_{1} M_{2}) [N / y] = def M_{1} [N / y] M_{2} [N / y]$

$α$ -conversione

Abbiamo detto che le funzioni matematiche sono quindi un modo per rappresentare in maniera generica una relazione tra due insiemi.

Per esempio, la relazione che associa a ogni numero naturale $x$ il suo quadrato $x^{2}$ (anch’esso nell’insieme dei numeri naturali $N$ ) possiamo rappresentarla con la funzione

f : N \to N x \mapsto x^{2}

Ma al posto di $x$ potremmo usare un’altra variabile per descrivere la funzione mantenendo invariato il suo significato, per esempio $y$ :

f : N \to N y \mapsto y^{2}

Oppure anche un simbolo che non è una lettera, come il simbolo $⋆$ (si legge star, ossia stella):

f : N \to N ⋆ \mapsto ⋆^{2}

Queste tre rappresentazioni sono perfettamente equivalenti e, nell’ambito del $λ$ -calcolo, Alonzo Church decise di chiamare il processo di rinominare le variabili di una funzione con il nome di $α$ -conversione.

Definizione: $α$ -conversione

L’ $α$ -conversione, denotata con $\equiv_{α}$ , è una relazione binaria tra due astrazioni $λ x . M$ e $λ y . M$ che permette di rinominare la variabile legata $x$ in un’altra variabile legata $y$ senza alterare il significato del termine:
$y \in / fv(M) ⟺ λ x . M \equiv_{α} λ y . M [y / x]$
Le due astrazioni $λ x . M$ e $λ y . M$ si dicono $α$ -equivalenti.

$β$ -riduzione

In matematica abbiamo che, data per esempio una funzione $f (x) = x^{2} + 2 x + 1$ , allora $f (5) = 5^{2} + 2 \cdot 5 + 1 = 36$ .

Nell’ambito del $λ$ -calcolo, applicare un’astrazione $λ x . M$ a un argomento $N$ significa valutare il corpo della funzione $M$ in cui ogni occorrenza della variabile libera $x$ è stata sostituita da $N$ . Per intenderci, nell’esempio di prima abbiamo valutato $f (x)$ applicandola all’argomento $5$ .

Questa idea è alla base della $β$ -riduzione.

Definizione: $β$ -riduzione

La $β$ -riduzione, denotata con $\to_{β}$ , è l’operazione che permette di sostituire in un’applicazione $(λ x . M) N$ l’argomento $x$ dell’astrazione con l’argomento $N$ :
$(λ x . M) N \to_{β} M [N / x]$
In particolare, diciamo che:

$(λ x . M) N$ è un $β$ -redex (da reducible expression, in italiano espressione riducibile) o, in alcuni casi, ricalcato in italiano come redesso e

$M [N / x]$ è il suo ridotto.

L’operazione inversa, cioè quella che dal ridotto ci fa risalire al redesso, viene detta $β$ -espansione e viene denotata con $\leftarrow_{β}$ :
$M [N / x] \leftarrow_{β} (λ x . M) N$

Esempi di $β$ -riduzione

Ecco qualche esempio di $β$ -riduzione correttamente svolta:
$(λ x . x) M \to_{β} x$ $(λ x . x x) (λ y . y) \to_{β} (λ y . y) (λ y . y) \to_{β} λ y . y$ $(λ f . λ x . f (f x)) M \to_{β} λ x . M (M x)$ $(λ f . λ g . λ x . f (g x)) M N \to_{β} (λ g . λ x . M (g x)) N \to_{β} λ x . M (N x)$ $(λ x . λ y . x) M N \to_{β} (λ y . M) N \to_{β} M β -riduzione$

$η$ -riduzione

Prendiamo un esempio di $β$ -riduzione:

(λ x . M x) N \to_{β} M N

Dal momento che l’applicazione della funzione $(λ x . M x)$ all’argomento $N$ e l’applicazione della funzione $M$ all’argomento $N$ generano in entrambi i casi $M N$ , per il principio di estensionalità delle funzioni potremmo dire che $(λ x . M x)$ e $M$ sono due funzioni equivalenti, quindi l’una deve essere trasformabile nell’altra attraverso una $β$ -riduzione.

Tuttavia, però, non in tutti i casi può valere la $β$ -riduzione che da $(λ x . M x)$ ci porta a $M$ o viceversa (attenzione: per poter applicare la $β$ -riduzione e ottenere $M$ ci serve avere $(λ x . M) x$ che non è equivalente a $(λ x . M x)$ !):

(λ x . M x) \neq \to_{β} M M \neq \to_{β} (λ x . M x)

Ciò ci fa pensare che, per continuare a far valere correttamente il principio di estensionalità delle funzioni, la $β$ -riduzione da sola non ci basta (come, per esempio, in questi casi appena visti): abbiamo bisogno di introdurre quindi una nuova operazione, la $η$ -riduzione.

Definizione: $η$ -riduzione

L’ $η$ -riduzione, denotata con $\to_{η}$ , è l’operazione che permette di ridurre un’astrazione $λ x . M x$ nel termine $M$ :
$λ x . M x \to_{η} M$
In particolare, diciamo che:

$λ x . M x$ è un $η$ -redex (da reducible expression, in italiano espressione riducibile) o, in alcuni casi, ricalcato in italiano come redesso e

$M$ è il suo ridotto.

L’operazione inversa, cioè quella che dal ridotto ci fa risalire al redesso, viene detta $η$ -espansione e viene denotata con $\leftarrow_{η}$ :
$M \leftarrow_{η} λ x . M x$

Riduzione singola e multipla

Durante lo svolgimento di $β$ -riduzioni ed $η$ -riduzioni è comodo alcune volte “generalizzare” il concetto di riduzione senza specificare quale delle due si sta applicando: per questo motivo, chiamiamo riduzione singola, denotata con →, l’uso generale di una delle due riduzioni tra la $β$ -riduzione e l’ $η$ -riduzione.

Definizione: riduzione singola

Una riduzione singola (o, più semplicemente, riduzione), denotata con $\to$ , è un singolo passo di $β$ -riduzione o di $η$ -riduzione.

$M$ si dice riducibile in $N$ .

Avendo definito formalmente la riduzione singola, possiamo ora generalizzare ulteriormente più passi di riduzione in una sola operazione, senza avere la necessità di esplicitarli tutti: definiamo quindi la riduzione multipla.

Definizione: riduzione multipla

Una riduzione multipla, denotata con $\Rightarrow$ (o, in alcuni casi, con $\to^{⋆}$ ), è una chiusura riflessiva e transitiva della relazione di riduzione singola, ossia la più piccola relazione tale che:

Riflessività (zero passi sono ammessi): $M ⟹ M$ .

Un passo è ammesso: $(M \to N) ⟹ (M \Rightarrow N)$ .

Transitività (più passi sono ammessi): $(M \Rightarrow N \land N \Rightarrow O) ⟹ (M \Rightarrow O)$ .

$M$ si dice riducibile in zero o più passi in $N$ .

Convertibilità

La riduzione multipla è una relazione tra due termini che può essere interpretata come una sorta di “equivalenza” tra di essi: se abbiamo che $M \Rightarrow N$ , allora possiamo dedurre che in qualche modo dal termine $M$ si può arrivare al termine $N$ , seppur con più di qualche passaggio di riduzione singola. Viceversa, facendo lo stesso discorso per le espansioni, cioè $β$ -espansione ed $η$ -espansione, si potrebbe dire che da $N$ possiamo risalire a $M$ . Insomma, si potrebbe dire che $M$ ed $N$ sono uguali semanticamente, cioè rappresentano la stessa funzione.

A questa intercambiabilità tra termini collegati da una riduzione multipla diamo il nome di convertibilità.

Definizione: convertibilità

Sia $Λ$ l’insieme di termini del $λ$ -calcolo. La relazione binaria $\Leftrightarrow \subseteq Λ \times Λ$ è detta convertibilità ed è definita come segue:
$\forall M, N \in Λ (M \Leftrightarrow N ⟺ (M \Rightarrow N \lor N \Rightarrow M))$

Forma normale e strategie di riduzione

Osservazione: $β$ -riduzioni che non terminano

Consideriamo il seguente esempio di $β$ -riduzione:
$(λ x . x x) (λ y . y y) \to_{β} (λ y . y y) (λ y . y y) \to_{β} (λ y . y y) (λ y . y y) \dots$
Come possiamo notare, ogni passo di $β$ -riduzione non ci permette di ridurre ulteriormente il termine ma ci fa ritornare puntualmente allo stato in cui è nella forma $(λ x . x x) (λ y . y y)$ : da ciò possiamo evincere che la $β$ -riduzione in alcuni casi può anche non terminare mai.

Questo particolare termine $(λ x . x x) (λ y . y y)$ è un combinatore (perché ha solo variabili legate) e scopriremo più tardi che è un combinatore molto famoso, ossia il combinatore di punto fisso $Y$ .

Intanto, ai termini che prima o poi arrivano a un certo punto in cui non possono essere più ridotti diciamo che sono in forma normale.

Definizione: forma normale

Nel $λ$ -calcolo, un termine $M$ si dice che è in forma normale e si denota con $M \neq \to$ se non può più essere ridotto, ovvero se non esiste un altro termine $N$ tale che $M \to N$ :
$\forall M \in Λ ((M \neq \to) ⟺ \neq \exists N \in Λ (M \to N))$
dove $Λ$ è l’insieme di termini del $λ$ -calcolo.

Confluenza

Teorema della confluenza

Sia $Λ$ l’insieme di termini del $λ$ -calcolo. Dati tre termini $M, N_{1}, N_{2} \in Λ$ , con $M \Rightarrow N_{1}$ e $M \Rightarrow N_{2}$ , allora esiste un termine $N \in Λ$ tale che $N_{1} \Rightarrow N$ e $N_{2} \Rightarrow N$ .
$\forall M, N_{1}, N_{2} \in Λ ((M \Rightarrow N_{1} \land M \Rightarrow N_{2}) ⟹ \exists N \in Λ (N_{1} \Rightarrow N \land N_{2} \Rightarrow N))$

Corollario del teorema della confluenza

La forma normale di un termine $M$ , se esiste, è unica (a meno di $α$ -conversioni).

In termini matematici, per ogni termine $M$ , se esistono due termini $N_{1}$ ed $N_{2}$ in forma normale ( $N_{1} \neq \to$ e $N_{2} \neq \to$ ) nei quali $M$ può essere ridotto ( $M \Rightarrow N_{1}$ e $M \Rightarrow N_{2}$ ), allora $N_{1}$ ed $N_{2}$ sono $α$ -equivalenti ( $N_{1} \equiv_{α} N_{2}$ ):
$\forall M \in Λ, \exists N_{1}, N_{2} \in Λ (((M \Rightarrow N_{1} \neq \to) \land (M \Rightarrow N_{2} \neq \to)) ⟹ (N_{1} \equiv_{α} N_{2} ))$
dove $Λ$ è l’insieme di termini del $λ$ -calcolo.

Strategie di riduzione

Definizione: ordine applicativo

L’ordine applicativo è una strategia di riduzione in cui applicare una funzione a un argomento significa prima valutare l’argomento e poi sostituire il valore ottenuto nel corpo della funzione. In altre parole, in un termine del tipo
$(λ x . x) ((λ y . y) z)$
viene scelto il $β$ -redex più a sinistra e più interno, ossia in questo caso $(λ y . y) z$ :
$(λ x . x) ((λ y . y) z ) \to_{β} (λ x . x) z$
I linguaggi funzionali che utilizzano l’ordine applicativo sono detti linguaggi zelanti (in inglese eager languages).

Definizione: ordine normale

L’ordine normale è una strategia di riduzione in cui applicare una funzione a un argomento significa sostituire l’argomento nel corpo della funzione. In altre parole, in un termine del tipo
$(λ x . x) ((λ y . y) z)$
viene scelto il $β$ -redex più a sinistra e più esterno, ossia in questo caso l’intero termine:
$(λ x . x) ((λ y . y) z) \to_{β} (λ y . y) z$
I linguaggi funzionali che utilizzano l’ordine applicativo sono detti linguaggi pigri (in inglese lazy languages).

Osservazione: cosa scegliere tra ordine applicativo e ordine applicativo

Le due strategie di riduzione viste, ossia l’ordine applicativo e l’ordine normale, non sono equivalenti, e spesso conviene usare una al posto dell’altra.

Prendiamo come esempio il seguente termine:
$(λ x . y) ((λ z . z) (λ z . z))$
Se eseguito con l’ordine applicativo, otteniamo le seguenti $β$ -riduzioni:
$(λ x . y) ((λ z . z) (λ z . z)) \to_{β} (λ x . y) (λ z . z) \to_{β} y $
Se invece viene eseguito con l’ordine normale, otteniamo la seguente $β$ -riduzione:
$(λ x . y) ((λ z . z) (λ z . z)) \to_{β} y$
Notiamo quindi che in questo caso l’ordine normale conviene, perché in questo modo l’argomento $x$ non viene proprio valutato.

Al contrario, consideriamo il seguente termine:
$(λ x . x x) ((λ y . y) (λ z . z))$
Se eseguito con l’ordine applicativo, otteniamo le seguenti $β$ -riduzioni:
$(λ x . x x) ((λ y . y) (λ z . z) ) \to_{β} (λ x . x x) (λ z . z) \to_{β} (λ z . z) (λ z . z) \to_{β} λ z . z $
Se invece viene eseguito con l’ordine normale, otteniamo le seguenti $β$ -riduzioni:
$(λ x . x x) ((λ y . y) (λ z . z)) \to_{β} ((λ y . y) (λ z . z) ) ((λ y . y) (λ z . z)) \to_{β} (λ z . z) ((λ y . y) (λ z . z)) \to_{β} (λ y . y) (λ z . z) \to_{β} λ z . z $
Possiamo notare come invece, in questo caso, convenga usare l’ordine applicativo perché l’argomento $x$ viene usato due volte e in quest’ultimo caso viene valutato entrambe le volte in due step diversi.

Normalizzazione

Teorema della normalizzazione

Dati due termini $M, N$ , se $M$ è convertibile in $N$ (cioè $M \Leftrightarrow N$ ) ed $N$ è in forma normale ( $N \neq \to$ ), allora esiste una riduzione multipla composta da $β$ -riduzioni in ordine normale (che indichiamo con $\Rightarrow_{no} $ ) che porta da $M$ a $N$ :
$(M \Leftrightarrow N \land N \neq \to) ⟹ (M \Rightarrow_{no} N)$

Osservazione: teorema della normalizzazione non vale per l'ordine applicativo

Il teorema della normalizzazione vale solo se le $β$ -riduzioni vengono eseguite secondo l’ordine normale, mentre non vale se si usa l’ordine applicativo. Un esempio di ciò è dato dal seguente termine:
$(λ x . y) ((λ x . x x) (λ x . x x))$
Se eseguito con l’ordine applicativo, abbiamo:
$(λ x . y) ((λ x . x x) (λ x . x x) ) \to_{β} (λ x . y) (x x) [(λ x . x x) / x] = (λ x . y) ((λ x . x x) (λ x . x x) ) \dots $
Possiamo notare che il termine, con questa strategia di riduzione, non raggiunge mai la sua forma normale. Al contrario, con l’ordine normale abbiamo:
$(λ x . y) ((λ x . x x) (λ x . x x)) \to_{β} y [((λ x . x x) (λ x . x x)) / x] = y $
Con l’ordine normale raggiungiamo subito la forma normale.

Currying

Abbiamo notato che nelle astrazioni possiamo passare come parametri una singola variabile, il che sembra abbastanza limitante se abbiamo bisogno di usare funzioni che necessitano più parametri.

Possiamo tuttavia usare un piccolo trucchetto sfruttando le funzioni di ordine superiore. Prendendo per esempio due variabili $x$ e $y$ che devono essere passate come parametri alla stessa funzione $x + y$ , possiamo creare un’astrazione che ha come parametro $x$ e nel suo corpo prende un’altra astrazione che ha come parametro $y$ e come corpo $x + y$ :

λ x . λ y . x + y

In questo modo, applicando a quest’astrazione i due valori per i parametri $x$ e $y$ (per esempio, passiamo rispettivamente i valori $2$ e $3$ ), tramite la $β$ -riduzione possiamo verificare che otterremo proprio quel che vogliamo:

(λ x . λ y . x + y) 2 3​ \to_{β} ​ (λ y . x + y) [2/ x] 3 = (λ y .2 + y) 3 \to_{β} ​ (2 + y) [3/ y] = 2 + 3 = 5 ​

Questo metodo di passare molteplici parametri alla stessa astrazione venne chiamato currying, in onore del matematico Haskell Curry per il suo apporto al $λ$ -calcolo.

Definizione: currying

Il currying è una tecnica che permette di applicare a un’astrazione con corpo $L$ più valori $M, N, \dots, O$ per ognuno dei suoi argomenti $x, y, \dots, z$ :
$(λ x . λ y . \dots . λ o . L) M N \dots O \Leftrightarrow L [M / x] [N / y] \dots [O / z]$

Fonti

🏫 Corso di Laurea in Informatica (L-31 R) presso l’Università di Torino:

Corso di Linguaggi e Paradigmi di Programmazione, A.A. 2020-21 (pagina Moodle):

Prof. Luca Padovani, slide del corso:

Introduzione ai paradigmi di programmazione e breve storia dei linguaggi funzionali.

Sintassi del $λ$ -calcolo.

Semantica operazionale del $λ$ -calcolo.

Confluenza e strategie di riduzione.

Prof. Luca Padovani, videoregistrazioni del corso:

Introduzione ai paradigmi di programmazione e breve storia dei linguaggi funzionali.

Sintassi del $λ$ -calcolo.

Semantica operazionale del $λ$ -calcolo.

Confluenza e strategie di riduzione.

Corso di Linguaggi e Paradigmi di Programmazione, A.A. 2025-26 (pagina Moodle):

Prof. Viviana Bono, lezioni del corso.

📹 Eyesomorphic, Programming with Math | The Lambda Calculus su YouTube.

🌐 Lambda-calcolo su Wikipedia in lingua italiana, URL consultato l’ultima volta e archiviato il 25 novembre 2025.

🌐 Simply typed lambda calculus su Wikipedia in lingua inglese, URL consultato l’ultima volta e archiviato il 25 novembre 2025.

🧠 Consultazione di ChatGPT.

🪴 Giardino Digitale di Rexus752

Vista grafo

Indice

Lambda-calcolo

Termini del $λ$ -calcolo

Astrazioni

Applicazioni

Termini

Riscrittura dei termini

Variabili libere e legate in un termine

Combinatori

Relazioni tra termini

Sostituzione

$α$ -conversione

$β$ -riduzione

$η$ -riduzione

Riduzione singola e multipla

Convertibilità

Forma normale e strategie di riduzione

Confluenza

Strategie di riduzione

Normalizzazione

Currying

Indice

🪴 Giardino Digitale di Rexus752

Vista grafo

Indice

Lambda-calcolo

Termini del λ-calcolo

Astrazioni

Applicazioni

Termini

Riscrittura dei termini

Variabili libere e legate in un termine

Combinatori

Relazioni tra termini

Sostituzione

α-conversione

β-riduzione

η-riduzione

Riduzione singola e multipla

Convertibilità

Forma normale e strategie di riduzione

Confluenza

Strategie di riduzione

Normalizzazione

Currying

Indice

Termini del $λ$ -calcolo

$α$ -conversione

$β$ -riduzione

$η$ -riduzione