Pochi giorni fa rientravo a casa in autobus con alcuni miei amici. Uno di loro mi ha raccontato una storiella che, complici il tempo trascorso, la memoria fallace e il labor limae che impone la scrittura, arriva a quest’articolo più o meno completamente riadattata.

C’era una volta un uomo che doveva raggiungere un campo di grano, da cui un fiume profondo e pericoloso lo divideva. Per giungere alla meta l’uomo dovette muoversi alle rive del fiume, attraversare un ponte e poi costeggiare di nuovo il corso d’acqua. Un corvo doveva arrivare allo stesso campo: poté farlo tranquillamente volando dal punto di partenza fino all’arrivo. Anche un canguro si trovava nella stessa situazione: con un certo numero di salti riuscì a superare il fiume e riunirsi con gli altri.

La storiella è ai limiti del nonsense ma fa capire plasticamente che la distanza tra due punti può essere considerata in molti modi diversi nella realtà, anche in base ai vincoli che sono posti dallo spazio esterno. Il concetto di distanza è altrettanto variegato anche nella sua definizione matematica, in cui si slega dalla nozione di lunghezza per assumere una patina di astrazione. Nonostante ciò per semplicità i prossimi esempi avranno comunque a che fare con la misurazione di lunghezze.

Perché si possa parlare di distanza una funzione deve soddisfare certi criteri (abbastanza ovvi). In primo luogo, una distanza non può essere negativa (e fin qui, ci può stare). In particolare, una distanza sarà nulla solo se il punto di partenza e il punto di arrivo coincidono. Inoltre, una distanza deve essere anche simmetrica: la distanza tra Roma e Bologna deve risultare uguale alla distanza tra Bologna e Roma. Un’altra condizione passa sotto il nome di disuguaglianza triangolare: senza addentrarci troppo nei formalismi,  per spiegarla ci faremo aiutare dalle nostre amiche Baby K e Giusy Ferreri, esperte cartografe. Nella loro hit dell’estate 2015 le due giovani cantanti hanno descritto l’improbabile tragitto “da Milano fino a Hong Kong, passando per Londra”. Osservandola sul planisfero (quindi solo sulla carta, senza considerare la reale forma tridimensionale della Terra) la disuguaglianza triangolare vale, in quanto la distanza Milano-Hong Kong (in blu) è minore della somma delle distanze Milano-Londra e Londra-Hong Kong (in rosso). In breve, la disuguaglianza triangolare stabilisce che il tragitto con lo scalo non è mai più breve del tragitto diretto: prende questo nome perché, visualizzandola in un generico triangolo, la somma della lunghezza di due lati qualsiasi è sempre maggiore della lunghezza del terzo.

distmap

Di distanze matematicamente coerenti con questi criteri ne esistono molte. La più nota è la distanza euclidea, che tra l’altro è proprio quella utilizzata nella mappa. Per collegare due punti si traccia la linea retta che passa per entrambi e il segmento risultante corrisponde alla distanza euclidea. Per assegnare un valore numerico a tale distanza, bisogna considerare le coordinate che i punti assumono, ad esempio, su un piano cartesiano o nello spazio tridimensionale, ma nulla ci vieta (o meglio, il mondo fisico ce lo vieta, ma l’“immaginazione matematica” non si fa certo frenare da così futili grattacapi) di misurare una distanza euclidea in n dimensioni.

Nella pratica quotidiana però, viaggiando sulle strade, la distanza euclidea, ovvero “la distanza in linea d’aria” spesso è poco indicativa: vi sono dei vincoli dovuti ad esempio agli incroci e certamente non si può passare con l’auto nei parchi o negli edifici. In una città a isolati quadrati e regolari, come l’area di Manhattan, allora per andare da A o B come nel grafico sottostante, dove le strade sono segnalate nel reticolato in grigio, non potendo utilizzare la distanza euclidea (in verde) saremmo costretti a raggiungere prima il punto C, distante 5 passi, e poi salire verso B con 3 passi. La distanza totale, uguale a 8, è magggiore della distanza euclidea e viene chiamata alternativamente distanza del taxi o distanza di Manhattan.

euclgrid

Per dimostrare però che il concetto di distanza non per forza deve essere riferito ad una lunghezza, si può considerare un altro problema: determinare la distanza tra due parole. In che senso esiste una distanza tra le parole “dire” e “fare”? Il nostro fido piano cartesiano non ci aiuta più di tanto perché non è semplice definire le coordinate di una parola. Emerge in questo caso la necessità di considerare una distanza come “dissimilarità” tra una parola e un’altra: più due parole saranno simili, più la loro distanza si avvicinerà allo zero.

In questi casi si può utilizzare la distanza di Hamming: date due parole di uguale lunghezza, tale distanza corrisponde al numero di posizioni in cui le due parole hanno lettere diverse. Nel caso del “dire” e del “fare”, la distanza di Hamming è 2 (in quanto in prima e seconda posizione, evidenziate in grassetto, le due parole presentano lettere diverse). Un’altra distanza utilizzabile in questo caso è quella di Damerau-Levenshtein, diretta generalizzazione di quella di Hamming. In questo caso la distanza è il numero minimo di modifiche (in termini di sostituzioni, aggiunte o cancellazioni di un carattere, oppure trasposizione di due caratteri vicini) che si devono compiere per passare da una parola a un’altra. Facendo attenzione a queste operazioni, si può notare che esse rappresentano gli errori più comuni quando scriviamo un messaggio al cellulare o un testo sul computer: per questo tale distanza si chiama anche distanza di edit. Questa distanza si può applicare su qualsiasi tipo di stringhe di caratteri: ad esempio si può usare per valutare la variazione delle basi azotate in due stringhe di DNA.

Il mondo delle distanze è ricco di molti altri esemplari, ma tranne per pochi addetti ai lavori rimane genericamente inesplorato. Nella seconda parte utilizzeremo invece le distanze per mettere le mani in pasta nel campo della statistica.


Tutte le immagini sono state elaborate dall’autore.

L’immagine di copertina, tratta dal video ufficiale del brano “Roma-Bangkok”, raffigura le due cantanti molto indecise sulla direzione da prendere.

Annunci

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...