un sito di notizie, fatto dai commentatori

I limiti della codifica Unicode [EN]

10 commenti

su suggerimento di @fed.

La codifica Unicode, la più utilizzata su internet, che permette ai computer di capire i sistemi di scrittura, è da anni in continua evoluzione e contiene la maggior parte dei caratteri esistenti, dalle emoji alle lingue morte e antiche, ma ad oggi presenta alcune lacune piuttosto eclatanti.
L’autore dell’articolo, Aditya Mukerjee, nota ironicamente: “Posso inviare un messaggio con un emoji che rappresenta una montagna di cacca sorridente, ma non posso scrivere il mio nome correttamente”.
La codifica infatti non prevede molti dei caratteri di uso comune in lingue quali Cinese, Hindi o Bengali, e questo impone l’utilizzo di una serie di espedienti. Un esempio? Per scrivere ৎ si usa questa espressione: ত + ্ + ‍ .

Su Gizmodo alcuni commenti all’articolo sono piuttosto interessanti (e divertenti).

Immagine da Wikimedia Commons.


Commenta qui sotto e segui le linee guida del sito.