Xël a écrit:
Je crois que j'ai compris mais je suis pas sûr
Bon pour faire simple

Les messages sont rentrés dans une base de données (qui stocke un tas d'autres informations genre l'adresse des avatars, le nom du posteur, l'historique de modifications, le n° et le nom du topic,...).
Ils sont rentrés dans des "champs" (un type de cases pour faire simple) de type "text" (qui servent à stocker du text, parfois on fait des choses claires en informatique). Ce champs "text" accepte des textes ayant une longueur de stockage de 2^16 bytes - 2 bytes.
1 byte = 1 octet = 8 chiffres binaires.
sur 1 byte, on a 256 possibilités (2 ^ 8) différentes. Avec ça, on peut encoder tout l'alphabet classique (latin) et une bonne dose de caractères bizarres en plus (genre % " - _ # @ € )
Avec d'autres alphabets, on doit augmenter sensiblement le nombre de possibilités. Pour ajouter le cyrillique par exemple, on passe sur 2 bytes, soit (2 ^ 16 possibilités).
Si on rajoute le Thaïlandais, l'Indien, le Japonais (enfin un des alphabets japonais) et le Chinois simplifié, nous sommes obligés de passer à 4 bytes (soit 2 ^ 32 possibilités). -pour info, le Chinois traditionnel force le 16 bytes-
Nous avons donc 2^16 = 65536 - 2 = 65534 bytes de stockage disponibles dans notre champs "text".
Sur base d'un alphabet latin classique, nous avons stockons en 1 byte/caractères. Nous avons donc 65 534 caractères autorisés par message.
Si nous étions en Chinois simplifié, nous serions sur 4 bytes/caractères; et donc seulement 8 190 caractères stockables !
C'est plus clair ?
