Premessa

Portale di appartenenza: Basi di dati.

Cosa troverai in questa nota:

Un’introduzione ai concetti alla base dell’algebra relazionale.

Come effettuare la composizione di operatori relazionali.

Come risolvere le interrogazioni con negazioni essenziali.

Come usare creativamente l’algebra relazionale per effettuare determinate operazioni.

Prerequisiti: per comprendere pienamente il contenuto di questa nota, oltre le conoscenze minime che do per scontato che tu sappia già, ti consiglio di aver letto in precedenza queste altre note:

Modello relazionale.

Buona lettura! ☝️🤓

Definizione: algebra relazionale

L’algebra relazionale è un linguaggio formale di tipo procedurale, formalizzato da Edgar F. Codd per manipolare e interrogare dati nei database basati sul modello relazionale da lui stesso sviluppato attraverso l’uso di operatori relazionali coordinati da predicati.

Definizione: predicato

Un predicato $Θ$ è un’espressione booleana costituita da uno o più confronti del tipo $A_{i} φ k$ oppure $A_{i} φ A_{j}$ dove:

$A_{i}$ e $A_{j}$ sono attributi di uno schema $A$ .

$φ$ è un operatore matematico di confronto nell’insieme ${=, \neq =, >, \geq, <, \leq}$ .

Eventuali confronti multipli vengono composti tra di loro attraverso l’uso dei tradizionali connettivi logici come la congiunzione $\land$ , la disgiunzione $\lor$ o la negazione $\neg$ .

Definizione: operatore relazionale

Un operatore relazionale è un operatore matematico che riceve, come argomenti, una o più relazioni e producono, in uscita, sempre relazioni, attraverso l’uso di predicati che ne regolano il comportamento.

Notazione: abuso di notazione sulle istanze come argomenti e risultati

In alcuni casi, quando si opererà con istanze che fanno esplicitamente riferimento ognuna a una determinata relazione $R (A)$ , si potrà passare come argomento all’operatore l’istanza stessa e si considererà, come risultato dell’operazione, non una relazione ma un’altra istanza.

Gli operatori relazionali si dividono in operatori di base e operatori derivati da quelli di base attraverso la loro composizione.

1 - Composizione di operatori

L’algebra relazionale è composizionale, ovvero si possono costruire espressioni di algebra relazionale componendo insieme gli operatori relazionali.

Definizione: composizione di operatori relazionali

Dati due operatori relazionali $⋆$ e $⋄$ , la loro composizione consiste nel dare come argomento dell’operatore $⋄$ il risultato dell’operazione di $⋆$ :
$⋄ (⋆)$

Esempio di composizione di due operatori

Supponiamo di avere una relazione $STUDENTI(Nome, Matricola, Corso, Et \overset{a}{ˋ})$ e vogliamo estrarre i nomi degli studenti di $Informatica$ con meno di $25$ anni. Possiamo comporre due operatori:

Selezione per scegliere solo gli studenti di $Informatica$ con meno di $25$ anni:

$σ_{Corso = "Informatica" \land Et \overset{a}{ˋ} < 25} (STUDENTI)$

Proiezione per estrarre i nomi dal risultato della selezione:

$π_{Nome}$
La composizione dei due operatori è la seguente:
$π_{Nome} (σ_{Corso = "Informatica" \land Et \overset{a}{ˋ} < 25} (STUDENTI))$

1.1 - Notazione ad albero sintattico

Per visualizzare comodamente un’interrogazione composta da una composizione di operatori si usa la notazione ad albero sintattico.

Notazione ad albero sintattico di una composizione

Una composizione di operatori relazionali si può rappresentare attraverso un albero sintattico, ossia un albero utile a visualizzare la sequenza di esecuzione delle operazioni. In particolare:

Sul nodo radice viene posto l’operatore eseguito per ultimo nella composizione.

Sui nodi foglia vengono poste le relazioni di partenza su cui vengono eseguite le operazioni.

Ogni nodo interno rappresenta uno degli operatori della composizione applicato al risultato del nodo figlio.

Esempio di notazione ad albero sintattico di una composizione

Supponiamo di avere una relazione $STUDENTI (\underline{Matricola}, Nome, Corso, Et \overset{a}{ˋ})$ e $CORSI (\underline{CodiceCorso}, NomeCorso, Durata)$ e vogliamo estrarre le matricole degli studenti che sono iscritti a un corso con una durata superiore a $50$ ore. Possiamo comporre gli operatori così:

Selezione per scegliere i corsi con durata maggiore di $50$ ore:

$σ_{CORSI.Durata < 50}$

Theta-join tra $STUDENTI$ e il risultato della selezione dei corsi, utilizzando l’attributo $Corso$ in $STUDENTI$ e il campo $\underline{CodiceCorso}$ in $CORSI$ :

$⋈_{STUDENTI.Corso = CORSI. \underline{CodiceCorso}}$

Proiezione per estrarre le matricole dal risultato del theta-join:

$π_{STUDENTI. \underline{Matricola}}$
La composizione degli operatori è quindi la seguente:
$π_{STUDENTI. \underline{Matricola}} (STUDENTI ⋈_{STUDENTI.Corso = CORSI. \underline{CodiceCorso}} (σ_{CORSI.Durata < 50} (CORSI)))$
Questa interrogazione si può tradurre nel seguente albero sintattico:

2 - Risoluzione delle interrogazioni con negazione

Riprendiamo l’esempio della base di dati ospedaliera. Per essa, si potrebbe chiedere, per esempio, di:

Elencare i pazienti non residenti a Torino.
Elencare i medici non primari.

I due esempi contengono rispettivamente una negazione non essenziale e una negazione essenziale.

2.1 - Interrogazioni con negazioni non essenziali

L’esempio “elencare i pazienti non residenti a Torino” rappresenta un’interrogazione con negazione non essenziale.

Definizione: negazione non essenziale

In un’interrogazione, una negazione non essenziale è una negazione che può essere riscritta rendendola positiva senza modificare il significato dell’interrogazione.

Esempio di negazione non essenziale

Ad esempio, “elencare i pazienti non residenti a Torino” si potrebbe riformulare come “elencare i pazienti con residenza diversa da Torino” e usare così una semplice selezione:
$σ_{PAZIENTI.Residenza \neq = "Torino"}$

2.2 - Interrogazioni con negazioni essenziali

L’esempio “elencare i medici non primari” rappresenta un’interrogazione con negazione essenziale.

Definizione: negazione essenziale

In un’interrogazione, una negazione essenziale è una negazione che non può essere rimossa senza cambiare il significato dell’interrogazione.

Per risolvere una negazione essenziale, si segue questo algoritmo.

Algoritmo di risoluzione delle interrogazioni con negazioni essenziali

Definire l’universo del discorso $U$ .

Rispondere alla domanda in forma positiva $P$ .

La risposta $R$ che si vuole ottenere è data dalla differenza tra $U$ e $P$ .

Esempio: risoluzione dell'interrogazione "elencare i medici non primari"

Risolviamo l’interrogazione “elencare i medici non primari” usando l’algoritmo di risoluzione delle interrogazioni con negazioni essenziali appena descritto.

Definire l’universo del discorso $U$ :

$U = MEDICI$

Rispondere alla domanda in forma positiva $P$ (nel nostro caso: “elencare i medici primari”):

$P = π_{\underline{Matricola}, Cognome, Nome, Residenza, Reparto} (MEDICI ⋈_{\underline{Matricola} = Primario} REPARTI)$

La risposta $R$ che si vuole ottenere è data dalla differenza tra $U$ e $P$ :

$R = U - P = MEDICI - π_{\underline{Matricola}, Cognome, Nome, Residenza, Reparto} (MEDICI ⋈_{\underline{Matricola} = Primario} REPARTI)$

Attenzione

Per poter adottare questo algoritmo, gli schemi dell’universo $U$ e della risposta in forma positiva $P$ devono essere uguali, per definizione dell’operatore relazionale della differenza.

Osservazione: l'algoritmo vale anche per le negazioni non essenziali

Si può osservare come l’algoritmo di risoluzione delle interrogazioni con negazioni essenziali si può usare per risolvere, in generale, qualsiasi tipo di negazione, anche quelle non essenziali. Riprendendo il primo esempio “elencare i pazienti non residenti a Torino”, si può usare l’algoritmo così:

Definire l’universo del discorso $U$ :

$U = PAZIENTI$

Rispondere alla domanda in forma positiva $P$ (nel nostro caso: “elencare i pazienti residenti a Torino”):

$P = σ_{Residenza = "Torino"} (PAZIENTI)$

La risposta $R$ che si vuole ottenere è data dalla differenza tra $U$ e $P$ :

$R = U - P = PAZIENTI - σ_{Residenza = "Torino"} (PAZIENTI)$
Risulta ovvio però che, in questo caso, è inutilmente dispendioso usare questo algoritmo al posto del metodo specifico delle negazioni non essenziali.

Esempio: risoluzione dell'interrogazione "elencare i pazienti di Torino che non sono stati mai curati dal primario con codice $203$ "

Risolviamo l’interrogazione “elencare i pazienti di Torino che non sono stati mai curati dal primario con codice $203$ ” usando l’algoritmo di risoluzione delle interrogazioni con negazioni essenziali.

Definire l’universo del discorso $U$ :

$U = σ_{Residenza = "Torino"} (PAZIENTI)$

Rispondere alla domanda in forma positiva $P$ (nel nostro caso: “elencare i pazienti di Torino che sono stati curati almeno una volta dal primario con codice $203$ ”):

$P_{0} = (PAZIENTI ⋈_{PAZIENTI.Codice = RICOVERI.Paziente} RICOVERI) ⋈_{RICOVERI.Reparto = REPARTI.Codice} (σ_{Primario = 203} (REPARTI))$
“Ripuliamo” la relazione $P_{0}$ da tutti gli attributi che non ci servono che abbiamo ottenuto dalle operazioni di equi-join, lasciando solo gli attributi relativi alla relazione $PAZIENTI$ opportunamente rinominati:
$P_{1} = π_{PAZIENTI.Codice, PAZIENTI.Cognome, PAZIENTI.Nome, PAZIENTI.Residenza, PAZIENTI.AnnoNascita} (P_{0}) P = ρ_{Codice, Cognome, Nome, Residenza, AnnoNascita \leftarrow PAZIENTI.Codice, PAZIENTI.Cognome, PAZIENTI.Nome, PAZIENTI.Residenza, PAZIENTI.AnnoNascita} (P_{1})$

La risposta $R$ che si vuole ottenere è data dalla differenza tra $U$ e $P$ :

$R = U - P = MEDICI - π_{\underline{Matricola}, Cognome, Nome, Residenza, Reparto} (MEDICI ⋈_{\underline{Matricola} = Primario} REPARTI)$

Attenzione: ambiguità nelle interrogazioni

Spesso, in un’interrogazione, ci può essere ambiguità riguardo il suo significato: per esempio, l’interrogazione “elencare i pazienti di Torino che non sono stati mai curati dal primario con codice $203$ ” può essere letta come “elencare i pazienti di Torino ricoverati ma mai presi in cura dal primario con codice $203$ “.

Si può notare come, nel secondo caso, cambi l’universo del discorso:
$U = π_{PAZIENTI.Codice, PAZIENTI.Cognome, PAZIENTI.Nome, PAZIENTI.Residenza, PAZIENTI.AnnoNascita} ((σ_{Residenza = "Torino"} (PAZIENTI)) ⋈_{PAZIENTI.Codice = RICOVERI.Paziente} RICOVERI)$

2.3 - Interrogazioni con negazioni nascoste

Esistono interrogazioni che, all’apparenza, non contengono negazioni, ma che in realtà ce le hanno. Per esempio, l’interrogazione “elencare i pazienti con un solo ricovero” equivale a “elencare i pazienti ricoverati almeno una volta ma che non hanno subito due o più ricoveri”.

3 - Uso “creativo” dell’algebra relazionale

L’algebra relazionale può essere usata in modi “creativi” per compiere operazioni particolari sulle relazioni.

3.1 - Interrogazioni con conteggi

In algebra relazionale non è possibile effettuare interrogazioni che prevedano conteggi (per esempio, non è possibile sapere quante volte un valore compare in una relazione), però è possibile rispondere a domande in cui si stabilisce un “limite” di conteggio (per esempio, è possibile sapere quali valori compaiono più o meno di $n$ volte in una relazione).

Come confrontiamo più record della stessa relazione? Per esempio, consideriamo la seguente relazione $VALORI$ con due attributi ( $Numero$ di tipo intero e $Lettera$ di tipo carattere) di cui vogliamo sapere quali sono i valori di $Numero$ che compaiono almeno due volte:

$Numero$	$Lettera$
$5$	$A$
$2$	$B$
$5$	$C$
$7$	$D$
$2$	$E$
$2$	$F$

L’idea è quella di mettere la relazione in theta-join con se stessa:

VALORI ⋈_{Θ} VALORI

Tuttavia, però, è necessario distinguere le nuove coppie di $Numero$ e $Lettera$ che saranno presenti nel risultato, quindi li rinominiamo:

ρ_{N1, L1 \leftarrow Numero, Lettera} (VALORI) ⋈_{Θ} ρ_{N2, L2 \leftarrow Numero, Lettera} (VALORI)

Il predicato $Θ$ deve selezionare i valori di $Numero$ corrispondenti ma associati a lettere diverse:

ρ_{N1, L1 \leftarrow Numero, Lettera} (VALORI) ⋈_{N1 = N2 \land L1 \neq = L2} ρ_{N2, L2 \leftarrow Numero, Lettera} (VALORI))

Il risultato è il seguente:

$N1$	$L1$	$N2$	$L2$
$5$	$A$	$5$	$C$
$5$	$C$	$5$	$A$
$2$	$B$	$2$	$E$
$2$	$B$	$2$	$F$
$2$	$E$	$2$	$B$
$2$	$E$	$2$	$F$
$2$	$F$	$2$	$B$
$2$	$F$	$2$	$E$

Adesso ci basterà soltanto fare una proiezione su $N1$ o $N2$ per far collassare automaticamente le tuple duplicate e ottenere, come risultati, $5$ e $2$ .

E se volessimo controllare quali valori di $Numero$ compaiono almeno tre volte? In questo caso, dovremmo fare un secondo theta-join al risultato dell’interrogazione precedente e, nel predicato, associare i numeri corrispondenti a tutti e tre gli attributi $Numero$ ma con lettere diverse:

R = ρ_{N1, L1 \leftarrow Numero, Lettera} (VALORI) ⋈_{N1 = N2 \land L1 \neq = L2} ρ_{N2, L2 \leftarrow Numero, Lettera} (VALORI))

R ⋈_{N1 = N2 = N3 \land L1 \neq = L2 \neq = L3} ρ_{N3, L3 \leftarrow Numero, Lettera} (VALORI))

Il risultato è il seguente:

$N1$	$L1$	$N2$	$L2$	$N3$	$L3$
$2$	$B$	$2$	$E$	$2$	$F$
$2$	$B$	$2$	$F$	$2$	$E$
$2$	$E$	$2$	$B$	$2$	$F$
$2$	$E$	$2$	$F$	$2$	$B$
$2$	$F$	$2$	$B$	$2$	$E$
$2$	$F$	$2$	$E$	$2$	$B$

Anche in questo caso ci basterà soltanto fare una proiezione su $N1$ . $N2$ o $N3$ per far collassare automaticamente le tuple duplicate e ottenere, come risultato, $2$ .

3.2 - Estrazione del massimo (o minimo)

Tramite l’algebra relazionale, è possibile estrarre un valore massimo (o minimo) da una serie di valori di un attributo di tipo intero. Per esempio, consideriamo la seguente relazione $VALORI$ con un unico attributo $Numero$ di tipo intero di cui vogliamo estrarre il massimo:

$Numero$
$5$
$7$
$2$

Ricordiamo che il massimo di una sequenza di numeri è tale se il numero è maggiore o uguale di tutti gli altri: dall’interrogazione affermativa “estrarre il numero maggiore o uguale di tutti gli altri”, possiamo ottenere l’interrogazione con negazione essenziale “estrarre il numero non minore di tutti gli altri”. Possiamo così usare l’algoritmo di risoluzione delle interrogazioni con negazioni essenziali:

Definiamo l’universo del discorso:

U = VALORI

Rispondiamo alla domanda in forma positiva $P$ (nel nostro caso: “estrarre tutti i numeri minori di qualche altro”).

Per fare ciò, calcoliamo il prodotto cartesiano per poter costruire un confronto tra i numeri:

P_{0} = (ρ_{N1 \leftarrow Numero} (VALORI)) \times (ρ_{N2 \leftarrow Numero} (VALORI))

Otteniamo la seguente relazione $P_{0}$ .

$N1$	$N2$
$5$	$5$
$5$	$7$
$5$	$2$
$7$	$5$
$7$	$7$
$7$	$2$
$2$	$5$
$2$	$7$
$2$	$2$

Selezioniamo quindi solo i record in cui $N1 < N2$ :

P_{1} = σ_{N1 < N2} (P_{0})

Otteniamo la seguente relazione $P_{1}$ .

$N1$	$N2$
$5$	$7$
$2$	$5$
$2$	$7$

Possiamo notare come nella colonna $N1$ ci sono effettivamente solo quei numeri minori di qualche altro numero nella sequenza (ossia $5$ e $2$ ): effettuando una proiezione (e una ridenominazione per rendere lo schema uguale a quello dell’universo $U)$ , possiamo far collassare i valori duplicati:

P = ρ_{Numero \leftarrow N1} (π_{N1} (P_{1}))

Otteniamo la seguente relazione $P$ .

$Numero$
$5$
$2$

La risposta $R$ che vogliamo ottenere è data dalla differenza tra $U$ e $P$ , da cui otteniamo l’unico valore $7$ che è effettivamente il massimo nella sequenza di valori $(5, 7, 2)$ .

Fonti

🏫 Lezioni e slide del Prof. Pensa Ruggero Gaetano del corso di Basi di Dati (canale B), Corso di Laurea in Informatica presso l’Università di Torino, A.A. 2024-25:
- 3. L’algebra relazionale.
- 4. L’algebra relazionale, seconda parte.
🏫 Appunti di Luca Barra del corso di Basi di Dati, Corso di Laurea in Informatica presso l’Università di Torino, A.A. 2022-23 (caricati sul repository GitHub del Collettivo Studentesco Informatica).

🪴 Giardino Digitale di Rexus752

Vista grafo

Indice

Algebra relazionale

1 - Composizione di operatori

1.1 - Notazione ad albero sintattico

2 - Risoluzione delle interrogazioni con negazione

2.1 - Interrogazioni con negazioni non essenziali

2.2 - Interrogazioni con negazioni essenziali

2.3 - Interrogazioni con negazioni nascoste

3 - Uso “creativo” dell’algebra relazionale

3.1 - Interrogazioni con conteggi

3.2 - Estrazione del massimo (o minimo)

Fonti

Indice

$N1$	$L1$	$N2$	$L2$
$5$	$A$	$5$	$C$
$5$	$C$	$5$	$A$
$2$	$B$	$2$	$E$
$2$	$B$	$2$	$F$
$2$	$E$	$2$	$B$
$2$	$E$	$2$	$F$
$2$	$F$	$2$	$B$
$2$	$F$	$2$	$E$

$N1$	$L1$	$N2$	$L2$	$N3$	$L3$
$2$	$B$	$2$	$E$	$2$	$F$
$2$	$B$	$2$	$F$	$2$	$E$
$2$	$E$	$2$	$B$	$2$	$F$
$2$	$E$	$2$	$F$	$2$	$B$
$2$	$F$	$2$	$B$	$2$	$E$
$2$	$F$	$2$	$E$	$2$	$B$

$N1$	$L1$	$N2$	$L2$
$5$	$A$	$5$	$C$
$5$	$C$	$5$	$A$
$2$	$B$	$2$	$E$
$2$	$B$	$2$	$F$
$2$	$E$	$2$	$B$
$2$	$E$	$2$	$F$
$2$	$F$	$2$	$B$
$2$	$F$	$2$	$E$

$N1$	$L1$	$N2$	$L2$	$N3$	$L3$
$2$	$B$	$2$	$E$	$2$	$F$
$2$	$B$	$2$	$F$	$2$	$E$
$2$	$E$	$2$	$B$	$2$	$F$
$2$	$E$	$2$	$F$	$2$	$B$
$2$	$F$	$2$	$B$	$2$	$E$
$2$	$F$	$2$	$E$	$2$	$B$

$N1$	$L1$	$N2$	$L2$
$5$	$A$	$5$	$C$
$5$	$C$	$5$	$A$
$2$	$B$	$2$	$E$
$2$	$B$	$2$	$F$
$2$	$E$	$2$	$B$
$2$	$E$	$2$	$F$
$2$	$F$	$2$	$B$
$2$	$F$	$2$	$E$

$N1$	$L1$	$N2$	$L2$	$N3$	$L3$
$2$	$B$	$2$	$E$	$2$	$F$
$2$	$B$	$2$	$F$	$2$	$E$
$2$	$E$	$2$	$B$	$2$	$F$
$2$	$E$	$2$	$F$	$2$	$B$
$2$	$F$	$2$	$B$	$2$	$E$
$2$	$F$	$2$	$E$	$2$	$B$