Da un po' di tempo il blog Mr. Palomar ha traslocato.

Tra pochi secondi sarai reindirizzato alla sua nuova casa sul mio sito personale paoloalessandrini.it.

.

(Se non avviene, clicca qui → Vai al nuovo blog)

Redirect in 5 secondi…

martedì 1 novembre 2016

Macchine che imparano #2: l'importanza dei vicini



Ricordate il problema della determinazione del genere di un autore? Ne avevo parlato nel primo post di questa serie dedicata alle tecniche di apprendimento automatico (in inglese, machine learning), interrotta sul nascere per molti mesi, che da oggi riprenderà tuttavia a camminare con maggiore regolarità.
Qualche volta vi sarà forse capitato di leggere un articolo, un racconto, o un qualsiasi testo, e non conoscendo nome e cognome dell'autore, vi sarete chiesti perlomeno se si tratti di un uomo o di una donna. Certo, questa attribuzione può diventare banale qualora il testo contenga indicazioni autoreferenziali: se a un certo punto si legge qualcosa come "il tale giorno mi sono recata nella tale città" è evidente che a scrivere è una donna e non un uomo. Ma in molti altri casi è molto più difficile determinare il sesso dell'autore, e per farlo ci si deve basare su elementi poco oggettivi e di dubbia interpretazione, come lo stile, la frequenza di certe parole, l’utilizzo di costrutti sintattici.

Può sembrare strano, ma c’è chi si è occupato in modo scientifico di questo tipo di determinazioni. Da alcuni studi, condotti su diverse lingue (non soltanto l'inglese ma, per esempio, anche lo spagnolo), risulta per esempio che gli uomini utilizzano le preposizioni in misura maggiore rispetto alle donne. Una spiegazione psicologica che viene fornita a supporto di questo dato è che gli uomini hanno più bisogno di categorizzare gerarchicamente gli oggetti all'interno dell'ambiente. Viceversa, le donne sembrano adoperare più interiezioni, più pronomi, più determinanti (cioè articoli, pronomi dimostrativi e in certe lingue come l'inglese e il francese anche i possessivi) rispetto agli uomini, probabilmente perché sono più interessate alle relazioni sociali.
Alcune ricerche suggeriscono che le donne si esprimono mediante un linguaggio più emotivamente connotato, e per questo impiegano più aggettivi e più avverbi degli uomini. Inoltre sembra che gli uomini commettano più errori grammaticali delle donne e si servano più spesso di quantificatori. Un paio di articoli su questa area della ricerca sono questo e questo.

Mi piace l’idea di utilizzare il curioso problema della determinazione del genere di un autore come esempio di applicazione delle tecniche di apprendimento automatico. Supponiamo di avere una raccolta di 50 racconti: dei primi 49 conosciamo con certezza il genere dell’autore, ma per il cinquantesimo no. Come possiamo affrontare il problema? Potremmo provare a concentrarci su un insieme ristretto di indicatori che riteniamo significativi per il nostro compito di attribuire un genere all’autore misterioso. Immaginiamo di considerarne soltanto due, per esempio il numero di aggettivi e il numero di determinanti ogni 1000 parole.
A ognuno dei 49 racconti già classificati possiamo assegnare una coppia di numeri, corrispondenti agli indicatori che abbiamo scelto. Per esempio, il primo racconto potrebbe essere costituito complessivamente da 5450 parole, e contenere 409 aggettivi e 703 determinanti. Ciò significa che, mediamente, questo testo contiene circa 75 aggettivi e 129 determinanti ogni 1000 parole. La coppia di numeri da attribuire al primo racconto è quindi (75, 129). 

Potrebbe venire quasi spontaneo, a questo punto, pensare di rappresentare ciascuno dei racconti come un punto sul piano cartesiano, le cui coordinate (x, y) corrispondono ai due numeri caratterizzanti. Il risultato sarà un diagramma costellato di 49 punti, uno per ogni racconto già classificato. Potremmo pensare di rappresentare gli autori maschili come pallini gialli e le scrittrici come pallini viola. A questo punto analizziamo il cinquantesimo racconto, quello scritto dall'autore senza volto, e determiniamo i due indicatori. Il punto che disegneremo sul piano cartesiano avrà una collocazione ben precisa, ma non possiamo sapere se sia un pallino giallo o un pallino viola: il nostro obiettivo è proprio decidere il colore di questo cinquantesimo pallino.

Sgombriamo il campo da un dubbio: la tecnica che descriverò può sperare di risolvere il problema della determinazione del genere, ma è soggetta all'errore. Non c'è alcuna certezza nel successo di questo algoritmo, perché si tratta di una metodologia di predizione incerta per definizione.
L'idea è la seguente: si traccia una circonferenza attorno al pallino senza colore, in modo da comprendere al suo interno un numero prestabilito k di pallini colorati, ovvero di racconti di autore noto. La nostra predizione deve basarsi sul genere prevalente presente tra i k pallini racchiusi dalla circonferenza.
Per esempio, considerando la figura a fianco, con k = 3, abbiamo due pallini viola e un pallino giallo, cioè prevalgono le autrici. In base alla tecnica descritta, dobbiamo prevedere che l'autore del cinquantesimo racconto sia una donna. Che l'algoritmo sia per definizione incerto è dimostrato dal fatto che scegliendo, in alternativa, k = 6, i pallini considerati diventano 4 gialli e 2 viola: elementi che ci guiderebbero ad azzardare una predizione maschile per il cinquantesimo racconto.
Dove sta l'apprendimento automatico in questa procedura? Nella fase di acquisizione delle informazioni relative ai 49 punti associati ai racconti di autore noto: l'algoritmo, infatti, apprende, per ciascuno di questi punti, il genere dell'autore, e questi dati divengono la base di conoscenza su cui si basa la predizione relativa al cinquantesimo racconto. Si dice anche che questi 49 punti sono esempi noti che l'algoritmo utilizza per addestrarsi, in modo da costruire una sua descrizione interna (cioè un modello) del fenomeno, e quindi formulare predizioni.

L'esempio mostrato in figura ci fa osservare che lo stesso algoritmo può portare a predizioni diverse a seconda del valore scelto di k. Variando di poco il valore di k, infatti, cambia totalmente la predizione. Tale fenomeno si verifica perché sono stati scelti, per semplicità, valori molto bassi di k, mentre è evidente che, nella maggior parte dei casi, valori più alti di questo parametro possono garantire accuratezze migliori.
Inoltre, il problema scelto è un problema di classificazione binaria, perché la predizione può consistere esclusivamente in due opzioni: autore maschio o autore femmina. In problemi di tal genere, quando la predizione cambia, cambia di brutto (nel nostro esempio, da maschio a femmina, o viceversa), mentre in problemi di classificazione a più valori i cambiamenti possono essere meno radicali.

Altri due elementi molto importanti per il successo dell'algoritmo sono il numero di indicatori utilizzati e la quantità di dati di esempio impiegati per la fase di addestramento.
Utilizzando più di due indicatori, o, come si dice nel gergo tecnico, features, si può sperare di ottenere predizioni più accurate. Questo non è assicurato, tuttavia, perché se si includono nel modello features non significative, cioè grandezze che non influenzano il valore che si vuole predire, allora l'aumento del numero di features non aumenta la qualità delle predizioni. Aumentare il numero di features significa muoversi non più sul piano cartesiano, ma su un iperspazio a n dimensioni, dove n è il numero delle features selezionate.
Poter disporre di un numero il più alto possibile di esempi già classificati da cui apprendere, invece, è quasi sempre buona cosa. Non a caso il mondo dell'apprendimento automatico è strettamente imparentato con quello dei cosiddetti big data: questo non significa che avere grandi moli di dati sia di per sè sufficiente per costruire modelli vincenti grazie agli algoritmi di machine learning, ma che, al contrario, quasi mai si riesce a predire con buona precisione quando i dati a disposizione sono pochi.
Per inciso, l'algorimo che ho descritto si chiama "k-Nearest Neighbors" (kNN), ed è uno dei più famosi nel campo delle tecniche di classificazione basate sull'apprendimento automatico. Nel prossimo articolo della serie scopriremo un altro algoritmo che può essere impiegato per risolvere problemi simili.

domenica 25 settembre 2016

Mr. Palomar torna a giocare a dadi (al Festival della Statistica 2016)

Ricordate il gioco musicale dei dadi di Mozart?
Ebbene, se volete giocare anche a voi, e contribuire a comporre un vero valzer in forma di minuetto, con battute firmate nientemeno che dal grande Wolfgang Amadeus, dovete venire a Treviso, domenica 9 ottobre alle ore 16, e partecipare allo spettacolo "Un, due, ...re! Giocando a dadi con Mozart".
Questo appuntamento musical-matematico mi vedrà protagonista, assieme al valente pianista Giancarlo Panizzo, e fa parte del programma ufficiale del Festival della Statistica e della Demografia "StatisticAll", in programma a Treviso dal 7 al 9 ottobre prossimi.
Il pubblico potrà lanciare i dadi e comporre un valzer che sarà eseguito a prima vista da Giancarlo Panizzo: un'esecuzione mozartiana che, statisticamente, sarà in prima assoluta mondiale!
Ma non ci sarà soltanto il gioco dei dadi: molte altre sorprese di carattere musicale e matematico vi aspettano!
Il giorno prima, sabato 8 ottobre alle ore 17.30, proporremo un'anteprima dello spettacolo, e anche in quella occasione comporremo un valzer con i dadi!
Non mancate, e passate parola!


lunedì 22 agosto 2016

Gli enigmi di Coelum: "Quadranti galattici"


Nel 1907 Henry Dudeney, grande creatore di rompicapi e giochi matematici, propose il seguente problema: “Fate accomodare le stesse n persone a una tavola rotonda (n-1)(n-2)/2 diverse volte, in modo che nessuna persona abbia per più di una volta gli stessi due vicini”.
L’enigma venne pubblicato, assieme a molti altri, nel libro “The Canterbury Puzzles”, uno dei grandi classici della matematica ricreativa.

L’immagine della tavola rotonda richiama subito alla mente i cavalieri della corte di re Artù, menzionati nelle leggende del ciclo bretone. Nelle diverse versioni, il numero di questi nobili personaggi varia molto, da 12 a oltre 150.
A noi, però, non importa quanti fossero i cavalieri: ci basta chiamare questo numero n.

Il problema di Dudeney suggerisce che esistano (n-1)(n-2)/2 diversi modi di accomodare i cavalieri a tavola, rispettando il vincolo per cui nessuno di loro ritroverà per più di una volta la stessa coppia di colleghi ai suoi due lati. Perché proprio (n-1)(n-2)/2?
Lo possiamo comprendere facilmente.
In quanti modi possiamo riempire il posto alla destra di re Artù? Naturalmente in n-1 modi, perché possiamo collocare chiunque degli n cavalieri tranne lo stesso sovrano. E una volta occupato quel posto, quanti modi abbiamo di piazzare un commensale alla sinistra di Artù? Ovvio: n-2, perché a questo punto abbiamo già escluso 2 persone. Quindi esistono (n-1)(n-2) modi di riempire i due posti vicini all’illustre sovrano.

Ma facciamo attenzione all’esatta formulazione del problema: ciascun cavaliere non deve ritrovarsi più volte la stessa coppia di vicini, indipendentemente dal fatto che siano scambiati di posto. Di conseguenza contando (n-1)(n-2) modi abbiamo in realtà contato ogni configurazione due volte: il numero giusto è quindi (n-1)(n-2)/2.
Per fortuna la matematica è democratica, per cui il ragionamento condotto per re Artù si applica pari pari a tutti i cavalieri. Possiamo allora concludere che il numero di configurazioni proposto da Dudeney è corretto.
Il numero (n-1)(n-2)/2 può essere ricavato anche attraverso un procedimento appena diverso. Il numero di possibili disposizioni degli n cavalieri corrisponde infatti al numero di modi in cui possiamo estrarre 2 elementi da un insieme di n-1 elementi.
Chi mastica un po’ di matematica sa che questo numero è espresso dal coefficiente binomiale “n su 2”, cioè:
Per fortuna abbiamo ritrovato lo stesso numero di prima!
Vabbè: ma adesso, che ce ne facciamo di questo bel numerino? Sapere quanti sono i modi di far sedere i cavalieri non significa conoscere nel dettaglio tutte queste disposizioni.
D’altra parte la determinazione di queste configurazioni costituisce il vero rompicapo di Dudeney.
Il problema è stato risolto per qualsiasi n pari, ma non ha una soluzione generale se n è dispari. Ai tempi di Dudeney (che morì nel 1930), per esempio, non era nota alcuna soluzione per il caso n = 13, che richiama alla memoria l’ultima cena di Gesù.
Lo stesso matematico inglese descrisse in dettaglio tutte le soluzioni dell’enigma per n compreso tra 3 (numero minimo di commensali per il quale il problema ha senso) e 12.
Ad esempio, la figura seguente illustra le soluzioni (uniche) per n uguale a 3, 4, e 5.

  Dagli anni Sessanta in poi, il problema venne preso in grande considerazioni da diversi matematici e risolto per valori più alti di n, anche sfruttando algoritmi informatici.
Ad oggi, il valore più basso di n per il quale non è nota alcuna soluzione è 41: si sa che le configurazioni in questo caso sono (41-1)(41-2)/2 = 780, ma nessuno sa quali siano di preciso.

Anche se ambientato in un contesto fantascientifico e non nello scenario delle leggende anglosassoni, l’enigma del numero 180 di Moebius era una riformulazione del classico problema di Dudeney.
Al posto della tavola rotonda c’è la Via Lattea, e i commensali sono sostituiti dai settori galattici amministrati da altrettanti governatori. 


Con i quattro quadranti alla Star Trek la soluzione è semplice: anzi, l’avete già vista nella figura precedente.
Con n = 4 abbiamo (n-1)(n-2)/2 = (4-1)(4-2)/2 = 3 disposizioni possibili.
Ad esempio, se i governatori sono A, B, C e D, lo schema di rotazione che risolve il problema è il seguente:

A B C D

A B D C

A C B D

Si noti che in ciascuna disposizione l’ultimo governatore (quello indicato a destra) sarà vicino al primo (quello più a sinistra). Questo significa che ad esempio la prima configurazione A B C D può indifferentemente essere scritta anche come B C D A, oppure C D A B, oppure D A B C.
Tenendo conto di questo fatto, potrete constatare che con n = 4 non vi sono altre soluzioni del problema.
Con sei settori, la faccenda si fa più complicata.
Maurizio Carlino, affezionato lettore della rubrica nonché abilissimo risolutore di enigmi, ha inviato un’analisi dettagliata del problema, corredata dalla soluzione e da una spiegazione approfondita del procedimento adottato per ottenerla.
Come si risolve la parte difficile del problema, cioè lo schema di rotazione dei 6 governatori? In questo caso le possibili configurazioni sono (6-1)(6-2)/2 = 10, ma quali sono?
Trovarle “a mano” era possibile, ma non semplice. Un programma informatico sicuramente rappresentava una via più agevole, e non a caso questo è stato il procedimento scelto da Carlino.
Identificando i governatori con le prime 6 lettere dell’alfabeto, la soluzione proposta dal lettore-risolutore è la seguente:

A B C D E F

A B D C F E

A B E D F C

B D E A F C

B D F A C E

A D B F C E

A C D F B E

D C E F B A

C B E F D A

C B F A D E

Nella tabella seguente, inviataci dal nostro lettore, vengono evidenziate le coppie di vicini di ogni governatore in ciascuna delle 10 configurazioni.


Naturalmente questa è una delle molte soluzioni possibili del problema con n = 6: a differenza del caso con n = 4, infatti, la soluzione non è affatto unica.
Non contento di aver comunque risolto il problema “base”, Carlino ha analizzato il numero di spostamenti necessari per passare da una configurazione a quella successiva.
Nella soluzione esposta sopra, questo numero è sempre 3, tranne che per il primo passaggio, nel quale sono necessari 4 spostamenti. Il numero totale di spostamenti è quindi pari a 28.

Scrive Carlino:
Non sono riuscito a trovare una soluzione che presenti un numero inferiore di spostamenti, ma non dispongo di una dimostrazione matematica del fatto che 28 sia il valore minimo. Sarà molto interessante scoprire se qualcun altro è stato capace di produrre una soluzione a ‘costo’ inferiore; al momento posso solo dire che il mio algoritmo non ha trovato soluzioni inferiori a 28 con il vincolo di usare ad ogni passo una nuova configurazione che differisse dalla precedente di al più 4 spostamenti. In particolare non sono riuscito a trovare soluzioni con costo totale = 27 in cui tutte le 9 configurazioni avessero un costo pari a 3 e neppure almeno una soluzione in cui compaia una configurazione di costo 2 seppur teoricamente compatibile con i vincoli del problema.
 
Giro l’interessante sfida ai lettori e ai visitatori.

venerdì 1 luglio 2016

Gli enigmi di Coelum: Moebius dentro Moebius

Con molta calma e lentezza, continuo a ripubblicare su questo blog i miei giochi matematici che trovarono spazio nella prestigiosa rivista Coelum Astronomia.
Dato che per la rubrica era stato scelto il titolo "Möbius", a un certo punto ritenni appropriato dedicare uno degli enigmi al celebre nastro.
Ebbene, questo semplice quanto sconcertante oggetto, di cui ho già raccontato su queste pagine, deve il suo nome ad August Ferdinand Möbius, matematico e astronomo tedesco nato nel 1790. Appassionato di matematica, fisica e astronomia fin da ragazzo, nel 1813 August Ferdinand andò a studiare nella prestigiosa università di Gottinga, dove ebbe il grande Carl Friedrich Gauss come insegnante. Solo tre anni Möbius dopo divenne professore di astronomia e meccanica superiore a Lipsia, dove rimase fino alla morte, avvenuta nel 1868.

Il suo contributo alla matematica è molto notevole, e spazia tra la topologia, la geometria proiettiva e la teoria dei numeri. Pare che abbia affrontato il problema della colorazione delle carte geografiche prima di Francis Guthrie, che di solito viene considerato come il pioniere in questo campo. D’altra parte, il famoso anello di Möbius non è stato descritto per la prima volta da Möbius ma da un altro matematico, Johann Benedict Listing, anche lui allievo di Gauss a Gottinga.

Costruire un nastro di Möbius è semplicissimo: basta prendere una striscia di carta e unirne le estremità dopo aver sottoposto una delle due a un mezzo giro di torsione.
Lo strano oggetto che si ottiene gode di alcune caratteristiche del tutto peculiari. Se si percorre il nastro con un pennarello, partendo da un punto qualsiasi, si scopre di poter percorrere l’intera superficie. L’anello ha quindi una sola faccia! Com’è possibile? Dopo aver percorso un giro attorno al nastro, ci si ritrova dalla parte opposta.
Ma parlare di parte opposta è fuori luogo, perché di facce ce n’è una sola. Dopo aver percorso due giri ci ritroviamo al punto di partenza.

E non basta: se si prova a seguire il bordo della striscia con un dito, ci si ritrova, dopo un giro, sul bordo “opposto”. E anche qui si ha un analogo “paradosso”: non ci sono due bordi, ma un bordo unico.
La caratteristica più sorprendente del nastro di Möbius si scopre tagliando la striscia a metà, in senso longitudinale, cioè parallelamente al bordo. Ci si aspetterebbe forse di ottenere due anelli di Möbius separati, mentre ci si ritrova con un unico anello, caratterizzato però da una torsione intera, e quindi da due bordi e due superfici diverse. Con un secondo taglio si ottengono poi due nastri con torsione intera, l’uno intrecciato all’altro.
Se proviamo a tagliare la striscia a un terzo della sua larghezza, è possibile fare due giri: alla fine si ottengono due anelli concatenati, il primo caratterizzato da una torsione intera e grande la metà del secondo, che invece è un vero nastro di Möbius, con mezza torsione.
Queste meravigliose stranezze giustificano l’interesse che questo oggetto geometrico ha suscitato, non solo tra i matematici, ma anche tra gli artisti.
L’incisore olandese Maurits Cornelis Escher ha spesso utilizzato la superficie di Möbius come fonte di ispirazione per le sue opere.


L’anello di Möbius è presente anche in molte opere letterarie e cinematografiche.
Nel 2006 il divulgatore americano Clifford Pickover ha pubblicato un libro intitolato “Il nastro di Möbius” (Apogeo 2006), interamente dedicato a questa superficie geometrica, mostrandone le innumerevoli connessioni con ogni ambito dello scibile umano.
Una curiosità: fin dall’inizio degli anni Settanta il simbolo universale del riciclo è un nastro di Möbius.

E veniamo all’enigma. Come abbiamo visto, il matematico che ha dato il nome alla nostra bizzarra superficie era anche un astronomo. Ma soprattutto, se parliamo di anelli, non vi vengono in mente quelli di Saturno?
Da un punto di vista geometrico, il sistema di anelli di Saturno assomiglia a una corona circolare, in cui il bordo interno è più corto di quello esterno. Topologicamente, però, la superficie equivale alla superficie laterale di un cilindro, cioè un anello ottenuto a partire da una striscia unendo le estremità senza torsioni.
Se potessimo camminare sull’anello di Saturno, potremmo stare o sulla faccia superiore o su quella superiore, ma per passare da una all’altra dovremmo per forza attraversare uno dei bordi: poco importa che l’anello sia visualizzato com’è in realtà, cioè con un bordo più vicino al pianeta e uno più lontano, oppure come la superficie laterale di un cilindro, in cui c’è una faccia rivolta verso il pianeta e un’altra faccia esposta nel verso opposto.

Ben diversa, invece, diventa la situazione se l’anello viene chiuso effettuando la fatidica mezza torsione di una estremità: si ottiene un mostruoso nastro di Möbius attorno a Saturno, che è possibile percorrere in tutta la sua superficie senza mai attraversare il bordo.

Il citato libro di Clifford Pickover racconta di come sia possibile giocare a scacchi su un nastro di Möbius. Le regole del gioco rimangono invariate, ma occorre fare un po’ più di attenzione, perché diventano possibili alcune mosse a sorpresa: occorre immaginare infatti che uno dei lati della scacchiera sia confinante con il lato opposto, ma in modo speculare.
Pickover rivela le stranezze di un simile modo di giocare a scacchi, e descrive anche la variante (più semplice) della scacchiera ripiegata ad anello ma senza torsione.

Sulle scacchiere e con i pezzi degli scacchi si possono fare partite, ma si possono anche risolvere rompicapi. Uno di questo è famoso come “giro di cavallo”. Su una scacchiera tradizionale 8×8, si tratta di muovere un cavallo partendo da una casella qualsiasi e rispettando le regole del gioco, con l’obiettivo di visitare tutte le caselle della scacchiera, ciascuna una volta sola. Il giro del cavallo può essere chiuso, se, alla fine del suo peregrinare, il quadrupede riesce a tornare alla casella di partenza. Altrimenti il giro viene considerato aperto.
Il problema del giro di cavallo è celebre nel mondo dei rompicapi che possono essere affrontati per via algoritmica, cioè addestrando un programma informatico a risolvere l’enigma. Ad oggi, nessuno sa di preciso quanti diversi giri di cavallo aperti siano possibili su una scacchiera tradizionale.
Si può provare a risolvere il problema anche su scacchiere “esotiche”, ad esempio rettangolari, o anche su scacchiere di Möbius.

L’enigma da me proposto consiste appunto nel trovare un simile percorso su una scacchiera di Möbius di dimensioni 4 x 7, dove il lato corto (di lunghezza 4) è quello che costituisce l’estremità che si torce di mezzo giro e si unisce al lato opposto.
Come ha argutamente osservato Maurizio Carlino, uno dei lettori della rivista che seppero risolvere il problema:

(…) una scacchiera di Möbius 4 x 7 mantiene l’alternanza bianco/nero delle caselle: è un dato che non ho usato esplicitamente per risolvere il problema, ma comunque vale per una scacchiera con un numero di colonne dispari. In altri termini, ogni singola mossa cambia colore alla casella di partenza, proprio come avviene in una scacchiera classica.
Come conseguenza, dopo un numero di mosse dispari, un cavallo che si muova su una scacchiera di Möbius di ordine dispari si troverà su una casella di colore opposto di quella da cui è partito, mentre dopo un numero di mosse pari sarà su una casella di colore identico a quello di partenza.

Nel suo libro Clifford Pickover afferma che una scacchiera di Möbius di dimensioni m x n (con m file e n colonne) consente un giro di cavallo se vale almeno una delle seguenti condizioni:

    m = 1 e n > 0 oppure n = 1 e m = 3, 4 o 5
    m = 2 e n pari, oppure m = 4 e n dispari
    n = 4 e m = 3

Nella nostra scacchiera 4 x 7 abbiamo m=4 e n=7: rientriamo quindi nel caso 2) e il giro di cavallo è possibile. Una delle possibili soluzioni è illustrata nella figura seguente:

Il già citato Carlino, invece, ha affrontato il problema servendosi di un programma in linguaggio C da lui stesso sviluppato, che calcola tutti i possibili giri di cavallo su una scacchiera di dimensione m x n (con m e n non maggiori di 8) a partire da una qualsiasi posizione della scacchiera, sia essa di tipo Möbius o no. L’algoritmo è basato sulla tecnica del “backtracking”, cioè tenta di individuare le soluzioni del problema esplorando tutte le mosse raggiungibili da una certa configurazione e tornando sui propri passi nel caso incontri ostacoli insormontabili. L’approccio sfrutta il meccanismo della ricorsione, ben noto agli informatici. La complessità dell’algoritmo è esponenziale, il che significa che il tempo di calcolo aumenta molto rapidamente al crescere della scacchiera, fino a diventare inservibile sopra una certa soglia di dimensioni.

Una delle soluzioni trovate da Carlino è riportata nella figura qui a fianco.
Il suo programma  ha trovato ben 13.209.800 diverse soluzioni. Modificando l’algoritmo per farlo funzionare su una scacchiera 4 x 7 non di Möbius, le soluzioni sono solo 1.682: dato che una scacchiera classica è un caso particolare della scacchiera di Möbius, queste 1.682 soluzioni sono incluse in quelle precedenti.
Come osserva Carlino, il numero di soluzioni “classiche” molto basso rispetto a quelle möbiussiane si spiega considerando il fatto che, nella maggior parte delle posizioni su una scacchiera classica, le possibili successive mosse di un cavallo sono meno numerose di quelle che può compiere su una scacchiera di Möbius.
Riporto infine un’altra interessante osservazione di Carlino:

Per indagare le proprietà di una scacchiera di Möbius ho provato a individuare almeno una soluzione diversa per ogni possibile posizione di partenza. Ho così scoperto che il programma da me elaborato non è in grado di trovare una soluzione se il cavallo parte dalla seconda o dalla terza riga (posizioni bj e cj con j=1..7) sia nel caso di una scacchiera di Möbius che nel caso classico.
Al momento non so dire se si tratta di un’imperfezione del programma o di una caratteristica intrinseca del problema.
Riporto nel seguito una tabella che riassume il numero di soluzioni trovate con il mio algoritmo per ogni posizione di partenza, per una scacchiera di Möbius 4 x 7 e per quella classica. Mi propongo di continuare a studiare il problema variando le dimensioni della scacchiera e cercando di approfondire la questione sulle posizioni di partenza che sembrano non garantire una soluzione.

Come si vede il numero di soluzioni nel caso di una scacchiera di Möbius è lo stesso a prescindere dalla posizione iniziale, nel caso delle righe 1 e 4 (aj e dj con j=1..7): la situazione è diversa nel caso della scacchiera classica, fermo restando la condizione di simmetria.

La questione posta da Carlino sulle posizioni iniziali “sfortunate” sembra molto interessante: varrebbe la pena di studiarla per capire se si tratti di una caratteristica intrinseca e generale di questo tipo di problema.

domenica 19 giugno 2016

La geometria degli Europei di calcio

I miei lettori si saranno chiesti, nelle ultime settimane, che fine avesse fatto questo blog, tristemente abbandonato da un paio di mesi. Ebbene, inconvenienti e progetti diversi lo hanno frenato per un tempo molto lungo, ma state sereni: ancora per molti anni, Mr. Palomar non intende buttare la spugna, costi quel che costi. E allora beccatevi anche questo nuovo post, di sapore pallonaro.
Da qualche giorno sono in corso gli Europei di calcio, ospitati dai cugini francesi. La nostra Nazionale è riuscita perfino a portare a casa un paio di vittorie, assicurandosi in anticipo l'accesso agli ottavi di finale.
Ma perché parlare di calcio in un blog di matematica? Come sapete, il legame tra queste due realtà mi è molto caro. L'anno scorso 40K ha pubblicato  "La matematica nel pallone", il mio libro sugli aspetti matematici del gioco del calcio.
Uno dei principali temi trattati riguarda la geometria dei palloni da calcio.
"La palla è rotonda", cantava Mina nel 2014, nelle serate del Mondiale brasileiro.


Ma questo non è poi così vero. Tutti i palloni da calcio sono fabbricati cucendo o incollando insieme pezzi di cuoio poligonali ritagliati da un pannello piatto. Il poliedro ottenuto viene poi gonfiato d'aria, facendolo assomigliare il più possibile a una sfera. Ma sfera non è, né può esserlo. Il più classico dei palloni da calcio, per capirci quello fatto a esagoni bianchi e pentagoni neri, altro non è che un icosaedro troncato, come avevo mostrato ampiamente in un vecchio post di 4 anni fa. Da ormai 46 anni, il progresso tecnologico nel settore del pallone è un'esclusiva dell'Adidas, che in occasione di ogni edizione dei Mondiali di calcio sforna un nuovo modello di poliedro pseudo-sferico.

Il "Brazuca" dei Mondiali 2014
Il tradizionale icosaedro troncato bianco e nero fu adoperato per la prima volta in un Mondiale nel 1970, nell'edizione messicana rimasta celebre per "Italia-Germania 4-3". Fino al 2002 tutti i palloni mondiali non si sono discostati granché da quel modello di riferimento.
Nell'edizione del 2006 vinta dall'Italia, in quella sudafricana del 2010 e in quella di due anni fa, sono stati invece impiegati palloni sostanzialmente diversi. In particolare, il "Brazuca" del 2014 era ottenuto cucendo insieme sei pezzi di cuoio uguali tra loro e dalla forma molto particolare. Un po' come un cubo, che notoriamente si costruisce unendo tra di loro sei quadrati uguali. Il "Brazuca" è dunque un pallone cubico? In un certo senso sì. D'altra parte, la possibilità di fabbricare palle come queste trova un solido fondamento matematico in un teorema dimostrato dall'ucraino Aleksei Pogorelov, di cui ho parlato nel mio ebook. Se ritagliate da un "foglio" di cuoio due forme uguali, oppure anche diverse ma caratterizzate da contorni della medesima lunghezza, riuscirete a cucirle insieme e a ottenere un oggetto tridimensionale convesso senza dover fare strappi o pieghe. Sotto particolari condizioni, la cosa funziona anche se le forme sono più di due. Il "Brazuca" ne è un meraviglioso esempio. Qui le forme sono sei: la loro forma non è quadrata, eppure su ogni forma ci sono quattro punti che giocano il ruolo di "pseudo-vertici" del "pseudo-quadrato". Una volta assemblato il pallone, gli pseudo-vertici si sovrapporranno a tre a tre, un po' come in ogni vertice di un cubo si incontrano tre facce quadrate.

Il "Telstar" del 1968
E gli Europei? Le prime due edizioni, quella del 1960 ospitata dalla Francia e quella del 1964 organizzata dalla Spagna, videro l'utilizzo di palloni ben diversi dai moderni e raffinati manufatti Adidas. Queste palle erano molto pesanti e pericolose: non era raro vedere giocatori dell'epoca sanguinanti dopo aver colpito di testa il pallone: la colpa era dei lacci che legavano insieme le strisce di cuoio.
La multinazionale tedesca entrò in scena nel torneo del 1968, ospitata nel nostro Paese: fu in questa edizione che venne lanciato per la prima volta il mitico pallone "Telstar", ovvero l'icosaedro troncato a esagoni e pentagoni.

Il protagonista del Mundial messicano del 1970 venne infatti sperimentato due anni prima in Italia, prima di diventare l'indiscusso modello di riferimento nell'immaginario collettivo e il pallone più famoso della storia del calcio.
Da qui in avanti lo schema di invertì: in ocsasione di ogni edizione dei Mondiali la Adidas avrebbe presentato un nuovo modello di pallone, che sarebbe stato riproposto due anni dopo agli Europei, identico oppure con variazioni trascurabili.
Fu così che alle edizioni 1972 e 1976 degli Europei, organizzate rispettivamente dal Belgio e dalla Jugoslavia, si giocò ancora con varianti del "Telstar".

L'"Europass" del 2008
Nel 1980 gli stadi italiani, nuovamente scelti come location del campionato europeo, videro volare il glorioso pallone "Tango", già testato ad Argentina '78. Ma anche il "Tango" era di fatto il solito icosaedro troncato.
Il nome "Tango" fu adottato per i palloni europei fino al 1988. Nel 1992 fu la volta di "Etrusco Unico", fratello del pallone di Italia '90. Tra il 1996 e il 2004 le palle ufficiali ebbero nomi particolari: "Questra Europa", "Terrestra Silverstream", "Roteiro". Ma geometricamente si trattava sempre di palloni in stile "Telstar": nè più nè meno.
Il pallone "Europass" dell'edizione austro-svizzera 2008 si basava invece sul "Teamgeist" utilizzato ai Mondiali tedeschi del 2006. Questa volta il modello geometrico era un ottaedro troncato.

Il "Tango 12" del 2012
Ancora una volta si adottava un solido archimedeo, variazione di un poliedro platonico, ma non più l'icosaedro troncato: per la prima volta il lungo dominio del "Telstar" e discendenti veniva interrotto.

Nel 2012 la regola del riciclo del pallone mundial conobbe un'eccezione: il famigerato "Jabulani", protagonista dell'edizione ospitata dal Sudafrica, venne decisamente accantonato in seguito alle aspre critiche che lo avevano colpito, e la Adidas sfornò un pallone battezzato "Tango 12" perché esteticamente simile al vecchio "Tango" degli anni Ottanta, ma in realtà geometricamente inedito, in quanto formato non da pezzi esagonali e pentagonali, ma da pannelli quasi-triangolari.


Il "Beau Jeu" del 2016
Ed eccoci arrivati all'edizione di quest'anno.
Il pallone che corre sui campi francesi di Euro 2016 si chiama "Beau Jeu", ovvero "Bel Gioco", ed è una rivisitazione del Brazuca di due anni fa.
Il rosso e il blu che lo adornano richiamano il tricolore transalpino.

Molti esperti di calcio hanno affermato che il "Beau Jeu" si comporta in modo superlativo in termini di grip, stabilità e controllo di palla, grazie alle caratteristiche geometriche del "Brazuca" per l'occasione ulteriormente perfezionate anche grazie alla collaborazione tra Adidas e Covestro, azienda che produce il poliuretano di cui è fatto il pallone.
Buoni Europei a tutti, dunque. E non dimenticate che c'è molta geometria e molta matematica dietro le traiettorie magiche che vi entusiasmeranno in queste serate europee.

venerdì 15 aprile 2016

Carnevale della Matematica #96 su MaddMaths!

Puntuale come ogni mese, il Carnevale della Matematica è giunto ieri mattina, generoso di contributi e di spunti e introdotto dal verso gaussiano Canta, canta, canta, canta, canta il merlo.
Questa edizione n. 96, come la tradizione impone a tutte le edizioni del mese di aprile, è stata allestita da MaddMaths! seguendo le celebrazioni americane del "Mathematical Awareness Month", organizzato dal Joint Policy Board for Mathematics (JPBM). Il tema proposto quest'anno è "Il futuro delle previsioni".
Fare una previsione vuol dire vedere il futuro: se poi parliamo di "futuro delle previsioni", ci spingiamo doppiamente nel futuro. Mai fu visto un Carnevale così lungimirante e futuribile!

Cito direttamente dal post di MaddMaths!:

Yogi Berra, famoso giocatore e allenatore di baseball americano, noto per i suoi aforismi, disse una volta, parafrasando Niels Bohr: "È difficile fare previsioni, specialmente sul futuro." In questo Mese della Consapevolezza Matematica 2016 siamo tutti invitati a esplorare come la matematica e la statistica siano il vero futuro delle previsioni, fornendo idee e guidando l'innovazione. La pagina del sito americano del Mese della Consapevolezza Matematica e il nostro Carnevale della Matematica dovrebbero aiutarci a capire il ruolo della matematica e della statistica nel comprendere e prevedere il futuro. E ricordatevi che la domanda fondamentale da farsi sempre è: Cosa c'è dopo?

Tra i (pochi ma buoni?) contributi a tema, incredibile dictu, c'è quello di Mr. Palomar, primo post di una serie dedicata alle "Macchine che imparano", ovvero alle tecniche di apprendimento automatico.
Numerose e solluccherose le segnalazioni in generale.
Complimenti a tutti i partecipanti, buona lettura ad aficionados e non, e appuntamento all'edizione di maggio!

domenica 3 aprile 2016

Macchine che imparano #1: autori e autrici

Qualche anno fa frequentai un corso di scrittura creativa. Ad ogni appuntamento il docente, che tra l'altro era uno scrittore e poeta piuttosto noto, ci assegnava, come compito per la lezione successiva, la stesura di un racconto su un tema fissato.
Una volta uno di noi gli domandò se fosse in grado di capire, leggendo un racconto anonimo, di determinare il genere dell'autore (cioè se fosse uomo o donna). Il docente rispose che sì, con un po' di esercizio e di intuito si riesce abbastanza facilmente. Non fummo abbastanza cattivi da metterlo alla prova con alcuni nostri racconti privati dell'indicazione dell'autore.
 Ora, un compito di questo tipo sembra richiedere una tale dose di intuizione e di sensibilità, doti squisitamente umane, che difficilmente potremmo pensare di affidarlo a una macchina.
Eppure qualcuno ci ha pensato, e in rete si trova persino una pagina in cui potete verificare l'abilità del computer in questo difficile esercizio.

L'identificazione del genere dell'autore di un testo è infatti uno degli innumerevoli campi in cui sono state applicate le tecniche di apprendimento automatico (in inglese "machine learning").

A partire da questo post comincerò a esplorare questo vastissimo ambito dell'intelligenza artificiale di cui oggi si sente parlare sempre di più e sul quale università e aziende stanno investendo in misura sempre maggiore.

L'idea alla base dell'apprendimento automatico è molto semplice: affinché un computer riesca a risolvere un tipo di problema particolarmente difficile, come quello descritto sopra, la strategia migliore è la stessa che gli insegnanti utilizzano spesso con i propri studenti: mostrare alcuni esercizi svolti, e poi verificare se gli alunni sono in grado di risolvere da soli altri problemi dello stesso tipo.

Nel panorama odierno dell'intelligenza artificiale il machine learning è la tendenza di gran lunga dominante. Sono da un bel po' considerati old-style gli approcci utilizzati da metodologie come i sistemi di produzione o i sistemi esperti: programmi la cui ambizione era possedere fin dall'inizio l'intera base di conoscenza relativa a un dato argomento, ed essere così capaci di risolvere ogni problema di un certo tipo in maniera diretta, sulla base di deduzioni logiche.
La debolezza dei sistemi esperti era la loro incapacità di imparare dall'esperienza.
Negli anni Settanta e Ottanta, per esempio, si realizzarono sistemi esperti il cui compito era effettuare diagnosi di malattie in funzione dei sintomi segnalati dai pazienti. Anche ammettendo di poter introdurre in un simile sistema tutte le conoscenze dei migliori luminari del pianeta, il programma, una volta confezionato, poteva iniziare a formulare diagnosi, magari anche azzeccate, ma era destinato a restare un medico artificiale sempre uguale a se stesso: in altre parole, non era in grado di imparare dalla propria esperienza, cioè dai propri successi e dai propri errori.

Tratto da http://eecs.wsu.edu/~cook/ml
Una persona, prima di iniziare a lavorare, deve andare a scuola per un po' di anni: analogamente, un algorimo di apprendimento automatico, prima di cominciare a emettere le sue risposte, deve essere addestrato, cioè deve analizzare un grande numero di problemi dello stesso tipo, ciascuno completo di soluzione preconfezionata. Il programma, sulla base di questi esempi, impara, cioè costruisce e via via perfeziona un proprio "modello" interno del problema, che viene poi adoperato quando sarà il momento di lavorare davvero senza conoscere in anticipo la risposta.

Questo approccio si è rivelato ottimale per un insieme innumerevole di problemi, soprattutto quelli molto complessi per i quali non esiste una formula esatta per determinare a colpo sicuro le risposte e le predizioni desiderate.
In altre parole, a causa della complessità di questi problemi, non possiamo più ambire alla perfezione assoluta, ma dobbiamo anzi accettare una percentuale di errore (comunque limitata).
Le tecniche di un tempo, fondate su schemi rigidi di deduzione, cercherebbero di risolvere questi problemi in modo esatto, ma impiegherebbero tempi biblici prima di produrre qualcosa, il che francamente non è quello che desideriamo.

Uno dei modi per superare questa empasse è il machine learning. Un altro filone algoritmico di cui ho già parlato in passato (ad esempio qui e qui), è costituito dai metodi euristici: anche questi, seppure attraverso un percorso un po' diverso, soddisfano il bisogno di meccanismi meno rigidi, che accettano l'approssimazione e che si avvicinano alla soluzione del problema attraverso una ricerca graduale.
I due mondi, apprendimento automatico e tecniche euristiche, non sono tra di loro separati in modo netto, ma si intersecano reciprocamente in molti casi.

La necessità di ricorrere a metodologie "soft", non rigide ma basate su paradigmi "moderni" (euristici, evolutivi, di apprendimento, e così via) è resa ancora più stringente dal fatto che i dati da elaborare arrivano spesso in quantità molto grandi, a grande velocità, e con formati molto eterogenei (i famosi "big data").
Da queste confuse e furiose basi di conoscenza si vorrebbe poter estrarre informazioni pregiate, che purtroppo se ne stanno solitamente ben nascoste come minuscoli aghi d'oro nello sterminato pagliaio informativo. Le numerose tecniche basate sull'idea dell'apprendimento automatico escono spesso vincitrici in questo genere di sfida, a condizione che i dati vengano inizialmente "puliti" e resi omogenei, che venga scelto l'algoritmo più appropriato per il problema da risolvere, e che il programma sia ben addestrato nella fase iniziale.

L'esempio con cui ho aperto questo post è emblematico. Per poter sviluppare un programma capace di riconoscere se un racconto è stato scritto da uno scrittore o da una scrittrice, possiamo certamente pensare ad un approccio di tipo "machine learning". Certo, occorre prendere oculatamente alcune decisioni importanti, per esempio scegliere  un algoritmo di apprendimento che si presti a questo ingrato compito. Nella prossima puntata di questa serie entreremo nel merito matematico di una di queste tecniche di apprendimento, e vedremo di applicarla al problema dell'identificazione del genere dell'autore. 

giovedì 24 marzo 2016

Mr. Palomar in tour (nel Trevigiano)

Se qualcuno avesse voglia di sentirmi parlare dei miei due e-book, "La matematica dei Pink Floyd" e "La matematica nel pallone", terrò tre presentazioni in provincia di Treviso, nei prossimi tre venerdì:
  • venerdì 25 marzo, ore 21, presso il Mirik Cafè di Carbonera, presenterò "La matematica dei Pink Floyd", con le improvvisazioni musicali di Stefano Zamuner (vedi locandina qui a fianco);
  •  venerdì 1° aprile, ore 20.45, presso l'Auditorium di Villa Olivi a Breda di Piave, presenterò "La matematica nel pallone";
  • venerdì 8 aprile, ore 21, presso il Mirik Cafè di Carbonera, presenterò "La matematica nel pallone".
Per chi non fosse pratico di questi luoghi del Trevigiano, qui è spiegato come raggiungere l'incantevole e accogliente Mirik Cafè, e qui è spiegato come arrivare a l'Auditorium di Villa Olivi, accanto al quale trova posto la specialissima Biblioteca Comunale.

Le mie presentazioni non sono classici incontri con l'autore, ma piccoli "science show" in cui il libro diventa il pretesto per parlare di matematica in modo multimediale, multidisciplinare e "pop".
In altre parole, venite che ci si diverte.

domenica 20 marzo 2016

Carnevale della Matematica #95 su DropSea



Mi autoassolvo sempre dicendo “Meglio tardi che mai”, ma questa volta il ritardo è davvero imperdonabile, lo so. Be’, lo dico lo stesso: lunedì scorso è uscito il Carnevale della Matematica n. 95, ricco di contributi e di spunti.
Così come il Carnevale di febbraio è tradizionalmente assegnato ai Rudi Mathematici, quello di marzo è ormai una prerogativa di Gianluigi Filippelli e del suo blog DropSea.
Introdotto dal verso gaussian-popinghiano "Tra i cespugli nella luce" e dalla cellula melodica preparata da Flavio Ubaldini, il Carnevale marzolino ha rilanciato con sapiente leggiadria i contributi dei blogger.
Il tema di marzo, si sa, non è un tema qualunque: dato che il Carnevale esce il giorno 14, non si potrebbe parlare che del pi greco. Anzi, tutti i Carnevali escono il 14 proprio per questo motivo, ragion per cui l'edizione di marzo è in qualche modo la madre di tutte le edizioni carnevalizie.
Complimenti a tutti i partecipanti (tra i quali questo stesso blog che ha contribuito parlando di scacchi, astronomia e... Kama Sutra), e appuntamento all'edizione di aprile
Lunga vita al Carnevale e naturalmente a π!

L'ultimo post di Mr. Palomar, anzi no

Sono trascorsi quasi 14 anni da quel Capodanno del 2011, quando Mr. Palomar  vide la luce. Da allora, molta acqua è passata sotto i ponti, c...