go-back Retour

Types et valeurs de base

📝 Mini-cours GRATUIT

Présentation

Les ordinateurs et la manipulation de données

Les ordinateurs et les programmes que nous utilisons permettent de mémoriser, de transmettre et de transformer des nombres, des textes, des images, des sons, des vidéos, etc.

Le fonctionnement à petite échelle

À une plus petite échelle, ces ordinateurs ne manipulent que des objets beaucoup plus simples : des 0 et des 1.

La mémoire des ordinateurs

La mémoire des ordinateurs est constituée d'une multitude de petits circuits électroniques qui, chacun, ne peuvent être que dans deux états.

Comme il fallait donner un nom à ces états, on a décidé de les appeler 0 et 1.

Définitions importantes

Une telle valeur, 0 ou 1, s'appelle un booléen, un chiffre binaire ou encore un bit (binary digit).

EN RÉSUMÉ

Notation à position et bases de numération

La notation décimale à position

Depuis le Moyen Âge, on écrit les nombres entiers naturels en notation décimale à position. C'est-à-dire, pour écrire le nombre entier naturel $n$, on commence par imaginer $n$ objets, que l'on groupe par paquets de dix, puis on groupe ces paquets de dix objets en paquets de dix paquets, etc.

Principe de groupement

À la fin, il reste entre zéro et neuf objets isolés, entre zéro et neuf paquets isolés de dix objets, entre zéro et neuf paquets isolés de cent, etc.

Chacun de ces nombres étant compris entre zéro et neuf, seuls dix chiffres sont nécessaires : $0$, $1$, $2$, $3$, $4$, $5$, $6$, $7$, $8$ et $9$.

Exemple concret

Exemple

L'écriture $1~964$ exprime un entier naturel formé de $4$ unités, $6$ dizaines, $9$ centaines et $1$ millier.

$$1~964 = 4\times10^0 + 6\times10^1 + 9\times10^2 + 1\times10^3$$

Caractère arbitraire de la base

Le choix de faire des paquets de dix est arbitraire : on aurait pu tout aussi bien décider de faire des paquets de deux, de cinq, de soixante, etc.

EN RÉSUMÉ

La base deux

Les nombres en base deux

Les nombres exprimés en base deux utilisent deux chiffres : $0$ et $1$.

Conversion de la base deux vers la base dix

Pour convertir un nombre binaire en nombre décimal, on utilise les puissances de 2.

Exemple

Le nombre binaire $11101$ est égal au nombre en base $10$ : $1\times2^0 + 0\times2^1 + 1\times2^2 + 1\times2^3 + 1\times2^4 = 1 + 0 + 4 + 8 + 16 = 29$.

Conversion de la base dix vers la base deux

Pour convertir un nombre décimal en nombre binaire, on décompose le nombre en somme de puissances de 2.

Exemple

Le nombre en base $10$ : $1964$ est égal au nombre en base $2$ : $11110101100$ car $1964 = 2^2 + 2^3 + 2^5 + 2^7 + 2^8 + 2^9 + 2^{10}$.

EN RÉSUMÉ

La base seize

La base hexadécimale

La base seize est mathématiquement assez proche du binaire, ce qui est pratique pour les ordinateurs. Elle est plus facile à écrire/retenir pour un humain que le binaire, ce qui en fait une base intermédiaire entre binaire (machine) et décimal (humain).

Les chiffres de la base hexadécimale

Les nombres exprimés en base seize, aussi appelé base hexadécimale, utilisent seize chiffres : $0$, $1$, $2$, $3$, $4$, $5$, $6$, $7$, $8$ et $9$ puis $\rm A$, $\rm B$, $\rm C$, $\rm D$, $\rm E$ et $\rm F$.

Correspondance avec le binaire

Chaque groupe de 4 chiffres binaires correspond exactement à 1 chiffre hexadécimal.

Exemples
  • $5$ en hexadécimal correspond à $0101$ en binaire 
  • $\rm B$ en hexadécimal correspond à $1011$ en binaire.

Conversion entre décimal et hexadécimal

Exemples de conversion entre décimal et hexadécimal

Le nombre en base $\rm 16~ 3B8$ est égal au nombre en base $10$ : $952$ car $\rm 3B8 = 3 \times 16^2 + 11 \times 16^1 + 8 \times 16^0 = 768 + 176 + 8 = 952$.

Conversion entre binaire et hexadécimal

Exemples de conversion entre binaire et hexadécimal
  • Le nombre binaire $11000101$ est égal au nombre en base $16$ : $\rm C5$ car $1100$ correspond $12$ soit $\rm C$ en hexadécimal, et $0101$ correspond à $5$.
  • Le nombre en base $\rm 16~ E93$ est égal au nombre en base $2$ : $111010010011$ car $\rm E$ correspond à $14$, soit $1110$ en binaire, $9$ donne $1001$ et $3$ donne $0011$.

EN RÉSUMÉ

Notion d’octet

Les circuits mémoires et les octets

Les circuits mémoires un bit sont souvent groupés par huit : les octets et on utilise souvent des nombres exprimés en notation binaire, c'est-à-dire en base deux, sur un, deux, quatre ou huit octets, soit $8$, $16$, $32$ ou $64$ bits.

Représentation des nombres selon le nombre d'octets

Ce qui permet de représenter les nombres :

  • Sur un octet : De $0$ à $\overline{1111~1111}$ $= 2^8 – 1 = 255$
  • Sur deux octets : De $0$ à $\overline{1111~1111~1111~1111}$ $= 2^{16}– 1 = 65~535$
  • Sur trois octets : De $0$ à $\overline{1111~1111~1111~1111~1111~1111}$ $= 2^{24} – 1 = 16~777~215$
  • Sur quatre octets : De $0$ à $\overline{1111~1111~1111~1111~1111~1111~1111~1111}$ $= 2^{32} – 1 = 4~294~967~295$

EN RÉSUMÉ

La représentation des entiers relatifs en complément à 2

Représentation des entiers relatifs

On représente un entier relatif par un entier naturel.

Représentation avec des mots de 16 bits

Si on utilise des mots de 16 bits, on peut représenter les entiers relatifs compris entre $–32~ 768$ et $32~ 767$ :

  • On représente un entier relatif $x$ positif ou nul comme l'entier naturel $x$.
  • Et un entier relatif $x$ strictement négatif, comme l'entier naturel $x + 2^{16} = x + 65~536$, qui est compris entre $32~768$ et $65~535$.

Ainsi les entiers naturels de $0$ à $32~767$ servent à représenter les entiers relatifs positifs ou nuls, et les entiers naturels de $32~ 768$ à $65~535$ les entiers relatifs strictement négatifs.

Notation en complément à deux

Cette manière de représenter les entiers relatifs s'appelle la notation en complément à deux.

Avec des mots de seize bits, on peut donc représenter les entiers relatifs compris entre $– 2^{15} = – 32~768$ et $2^{15} – 1 = 32~767$.

Généralisation

Plus généralement, avec des mots de n bits, on peut représenter les entiers relatifs compris entre $– 2^{n-1}$ et $2^{n-1} – 1$.

EN RÉSUMÉ

La représentation des nombres à virgule

Représentation des nombres à virgule flottante

On utilise une représentation similaire à la notation scientifique sauf qu'elle est en base deux et non en base dix.

Format général

Un nombre est représenté sous la forme $\rm s$ $\rm m$ $\rm 2^n$ où $s$ est le signe du nombre, $\rm n$ son exposant et $\rm m$ sa mantisse.

Le signe est $+$ ou $–$, l'exposant est un entier relatif et la mantisse est un nombre à virgule, compris entre $1$ inclus et $2$ exclu.

Répartition des bits

Par exemple, quand on utilise $\rm 64~bits$ pour représenter un nombre à virgule, on utilise :

  • $\rm 1~bit$ pour le signe
  • $\rm 11~bits$ pour l'exposant
  • $\rm 52~bits$ pour la mantisse

Représentation du signe

Le signe $+$ est représenté par $0$ et le signe $–$ par $1$.

Représentation de l'exposant

L'exposant $\rm n$ est un entier relatif compris entre $–1~024$ et $1~023$, on le représente comme l'entier naturel $\rm n + 1~023$, qui est compris entre $1$ et $2~046$.

Les deux entiers naturels $0$ et $2~047$ sont réservés pour des situations exceptionnelles ($+\infty$, $–\infty$, $\rm NaN$).

Représentation de la mantisse

La mantisse $\rm m$ est un nombre binaire à virgule compris entre $1$ inclus et $2$ exclu, comprenant $52$ chiffres après la virgule.

EN RÉSUMÉ

La représentation des caractères

Représentation des caractères dans un texte

Un texte est une suite de caractères. Les caractères sont composés essentiellement de lettres minuscules et majuscules, de chiffres, de signes de ponctuation et de symboles mathématiques.

Pour représenter ces caractères, on attribue un nombre à chacun.

Le code ASCII

Code ASCII : American Standard Code for Information Interchange - codage de 127 caractères

Le code ASCII est prévu initialement pour l'anglais. Il est peu adapté pour d'autres langues dont le français qui utilisent des caractères latins (accents, cédille, etc.).

Extension du code ASCII

Une extension du code ASCII, le code latin-1, a été créé qui contient 191 caractères pour les caractères latins.

Le format Unicode

Pour représenter les textes écrits dans d'autres alphabets (grec, russe, chinois, japonais, etc.), un format universel a été créé : Unicode.

Unicode recense près de 110 000 caractères et associe un nom et un numéro à chacun. A priori, ce numéro se code sur 32 bits (UTF-32) ou moins avec compression (UTF-8).

EN RÉSUMÉ

La représentation des textes

Les textes numériques et leur manipulation

Nature des textes numériques

Les textes en ASCII ou en Unicode sont des suites de caractères. Les éditeurs de texte sont les logiciels qui manipulent ces suites de caractères.

Modifications possibles dans un éditeur de texte

Dans un éditeur de texte on peut aussi modifier :

  • La police de caractères – Times, Courier, etc. –,
  • La taille des caractères – 11 points, 12 points, etc. –,
  • Leur forme – romain, italique, etc. –,
  • Leur graisse – maigre, gras, etc.

Traitements de texte avancés

Les traitements de texte permettent des mises en pages élaborées (découpage en chapitres, sections, etc ….) caractéristiques que ne permettent pas les codages ASCII ou Unicode.

Méta-données

On peut également donner des informations sur le texte : son titre, ses auteur(s), sa date de création, sa langue, etc. Ces informations sur le texte, et non du texte, sont appelées des méta-données.

Format HTML

L'un de ces formats enrichis, qui est utilisé notamment pour écrire des pages web est appelé le format HTML (Hyper Text Markup Langage).

EN RÉSUMÉ

📄 Annale PREMIUM

PREMIUM

Sujet zéro — Numérique et sciences informatiques

📄 Annale PREMIUM

PREMIUM

Sujet zéro — Numérique et sciences informatiques

NOMAD EDUCATION

L’app unique pour réussir !