Home About us Products Services Contact us Bookmark
:: wikimiki.org ::
Compression De Données

Compression de données

ko:데이터 압축 ja:データ圧縮 simple:Data compression th:การบีบอัดข้อมูล Compression de donnees Catégorie:Format de données numériques On peut classifier les méthodes de compressions en deux types, compression avec perte -- également dite non conservative -- et compression sans perte.

Compression sans perte

La compression est dite sans perte lorsqu'il n'y aucune perte de données sur l'information d'origine. Il y a autant d'information après la compression qu'avant, elle est seulement réécrite d'une manière plus concise (c'est par exemple le cas de la compression gzip). La compression sans perte est dite aussi compactage. L'information à compresser est vue comme la sortie d'une source de symboles qui produit des textes finis selon certaines règles. Le but est de réduire la taille moyenne des textes obtenus après la compression tout en ayant la possibilité de retrouver exactement le message d'origine (on trouve aussi la dénomination codage de source en opposition au codage de canal qui désigne le codage correcteurs d'erreurs). Les formats de fichier de compression sans perte les plus courants sont :
- bz, bz2
- rar
- Z (sur stations sun)
- zoo
- zip
- gzip, gz (qui est en fait un fichier zip à une seule entrée).
- lzh
- arj
- arc
- 7z
- ace Les standards ouverts les plus courants sont décrits dans plusieurs RFCs :
- RFC 1950 (ZLIB, flux de données compressées)
- RFC 1951 (système de compression par blocs « DEFLATE », utilisé par zip et gz)
- RFC 1952 (format de fichier compressé GZIP)

Codage Huffman

L'idée qui préside au codage de Huffman est voisine de celle utilisée dans le code Morse : coder ce qui est fréquent sur peu de place, et coder en revanche sur des séquences plus longues ce qui revient rarement. En morse le e, lettre très fréquente, était codé par un simple point, le plus bref de tous les signes. L'originalité de David A. Huffman est qu'il fournit un procédé d'agrégation objectif permettant de constituer son code dès lors qu'on possède les statistiques d'utilisation de chaque caractère. Le Macintosh d'Apple Computer codait les textes dans un système inspiré de Huffman : les 15 lettres les plus fréquentes (dans la langue utilisée) étaient codées sur 4 bits, et la 16 combinaison était un code d'échappement indiquant que la lettre était codée en ASCII sur les 8 bits suivants. Ce système permettait une compression des textes voisine en moyenne de 30% à une époque où la mémoire était extrêmement chère par rapport aux prix actuels (compter un facteur 1000).

Codage RLE

Les lettres RLE signifient Run-length encoding. Il s'agit d'un mode de compression parmi les plus simples : toute suite de bits ou de caractères identiques est remplacée par un couple (nombre d'occurrences ; bit ou caractère répété).

Lempel-Ziv-Welch (LZW)

La compression Lempel-Ziv-Welch est dite de type dictionnaire. Elle est basée sur le fait que des successions de caractères se retrouvent plus souvent que d'autres et qu'on peut donc les remplacer par un nouveau caractère. Le dictionnaire est construit dynamiquement d'après les caractères rencontrés. Voir l'article Lempel-Ziv-Welch

Transformation de Burrows-Wheeler ou BWT

Il s'agit d'un mode de réorganisation des données et non un mode de compression, par contre il tend à regrouper les caractères identiques ensemble, ce qui fait qu'une compression adéquate appliquée aux données produites permet souvent une compression très efficace.

Compression CCITT

C'est une compression d'images utilisée pour le fax. Elle peut être de type RLE (on code les suites de pixels blancs et de pixels noirs) ou bidirectionnelle (on déduit une ligne de la précédente). Il existe plusieurs types de compressions ("groupe") suivant l'algorithme utilisé et le nombre de couleurs du document (monochrome, niveau de gris, couleur).

Compression avec pertes

Utilisée pour compresser des photos, des bandes musicales, des films, ... Cette technique est fondée sur une idée simple : seul un sous-ensemble très faible de toutes les images possibles (à savoir celles que l'on obtiendrait par exemple en tirant les valeurs de chaque pixel par un générateur aléatoire) possède un caractère exploitable et informatif pour l'œil. Ce sont donc ces images-là qu'on va s'attacher à coder de façon courte. Dans la pratique, l'œil a besoin pour identifier des zones qu'il existe des corrélations entre pixels voisins, c'est-à-dire qu'il existe de zones contiguës de couleurs voisines. Les programmes de compression s'attachent à découvrir ces zones et à les coder de la façon aussi compacte que possible. Le JPEG 2000, par exemple, arrive typiquement à coder des images photographiques sur 1 bit par pixel sans perte visible de qualité sur un écran, soit une compression d'un facteur 24 à 1. De même, seul un sous-ensemble très faible de sons possibles est exploitable par l'oreille, qui a besoin de régularités engendrant elles-mêmes une redondance (coder avec fidélité un bruit de souffle n'aurait pas grand intérêt). Un codage éliminant cette redondance et la restituant à l'arrivée reste donc acceptable, même si le son restitué n'est pas en tout point identique au son d'origine. Une compression avec pertes suivie de décompression déjoue également les risques de stéganographie. Il y a moins d'information après la compression qu'avant, l'information retranchée étant sélectionnée d'après des critères fixés selon le type de données traitées. La compression d'une image en format jpeg est un exemple de compression avec perte. Puisque l'œil ne perçoit pas nécessairement tous les détails d'une image, il est possible de retrancher des données, dans l'espace des fréquences, de telle sorte que le résultat soit très ressemblant à l'original, voire pareil, pour l'œil. Le tout est de savoir quelles données retrancher. L'image finale n'étant pas, numériquement parlant, identique à l'image initiale, il s'agit d'une compression avec perte. On peux distinguer trois grandes familles de compression avec perte :
- Compression basée sur une version numérique de la transformée de Fourier la DCT (compression JPEG)
- Compression basée sur la transformée en ondelette discrète utilisée dans le format JPEG 2000 (compression par ondelettes)
- Compression basée sur la récurrence fractale de motifs (Compression fractale)

Récapitulatif

|----- bgcolor="#33ee33" | rowspan="2" |Domaines || colspan="3" | sans pertes | colspan="3" | avec pertes |----- bgcolor="#aaaaaa" | Huffmann || Dictionnaire || Autre || DCT || Ondelette || Autre |----- | Général
binaires/données || | 7z, LZW, Z, gzip, bzip2, zip | RLE (Run-Length Encoding) || || | |----- | Audio || || || FLAC, Wavpack | MP3, Ogg Vorbis, Speex | || |----- | Image || | GIF, PNG | PCX (RLE), ILBM? (ou IFF), IMG?, CCITT | JPEG || JPEG2000, SPIHT || |----- | Vidéo || || | || MJPEG, MPEG, MPEG-2? | MJPEG2000 || MPEG-4? |{

Catégorie:Théorie de l'information

Information Catégorie:Informatique théorique

Article principal


- Théorie de l'information

Catégorie connexe


- Cryptologie

Gzip

Gzip, pour GNU zip, est un logiciel libre, utilitaire de compression, qui a été créé pour remplacer le programme compress d'Unix. Gzip est basé sur l'algorithme deflate, qui est une combinaison des algorithmes LZ77 et Huffman. 'Deflate' a été développé en réponse à des problèmes de brevet couvrant LZW et autres algorithmes de compression, limitant ainsi les utilisations possibles de compress et autres programmes d'archivage populaires. De manière à simplifier les développements de logiciels utilisant la compression, la bibliothèque zlib a été créée. Elle supporte le format de fichier gzip et l'algorithme de compression deflate. Cette bibliothèque est très largement utilisée, grâce à sa taille réduite, son efficacité et sa souplesse d'utilisation. Gzip comme zlib ont été écrits par Jean-Loup Gailly et Mark Adler. Depuis la fin des années 90, bzip2 prend le relais puisqu'il produit des fichiers considérablement plus petits. Le format de donnée compressée zlib, l'algorithme deflate et le format de fichier compressé Gzip ont été standardisés avec les RFC 1950, RFC 1951 et RFC 1952. L'extension usuelle des fichiers « gzipé » est « .gz ». Les logiciels UNIX sont souvent distribués avec des fichiers terminés par .tar.gz ou .tgz, appelés tarball. Ce sont des fichiers archivés avec tar et ensuite compressés avec gzip. Ils peuvent être décompressés avec gzip -d file.tar.gz ou décompactés avec tar xzf file.tar.gz. De nos jours, de plus en plus de logiciels sont distribués à la place en archives .tar.bz2 parce que bzip2 permet de meilleurs taux de compression que gzip, et ce malgré un temps de compression plus long. AdvanceCOMP implémente une compression deflate au format gzip qui fournit des taux de compressions encore meilleurs que gzip.

Liens externes


- [http://www.gzip.org/ Site officiel]
  - [http://www.gzip.org/index-f.html En français]
- [http://www.gnu.org/software/gzip/gzip.html Page sur gnu.org] Catégorie:GNU ja:Gzip

Gzip

Gzip, pour GNU zip, est un logiciel libre, utilitaire de compression, qui a été créé pour remplacer le programme compress d'Unix. Gzip est basé sur l'algorithme deflate, qui est une combinaison des algorithmes LZ77 et Huffman. 'Deflate' a été développé en réponse à des problèmes de brevet couvrant LZW et autres algorithmes de compression, limitant ainsi les utilisations possibles de compress et autres programmes d'archivage populaires. De manière à simplifier les développements de logiciels utilisant la compression, la bibliothèque zlib a été créée. Elle supporte le format de fichier gzip et l'algorithme de compression deflate. Cette bibliothèque est très largement utilisée, grâce à sa taille réduite, son efficacité et sa souplesse d'utilisation. Gzip comme zlib ont été écrits par Jean-Loup Gailly et Mark Adler. Depuis la fin des années 90, bzip2 prend le relais puisqu'il produit des fichiers considérablement plus petits. Le format de donnée compressée zlib, l'algorithme deflate et le format de fichier compressé Gzip ont été standardisés avec les RFC 1950, RFC 1951 et RFC 1952. L'extension usuelle des fichiers « gzipé » est « .gz ». Les logiciels UNIX sont souvent distribués avec des fichiers terminés par .tar.gz ou .tgz, appelés tarball. Ce sont des fichiers archivés avec tar et ensuite compressés avec gzip. Ils peuvent être décompressés avec gzip -d file.tar.gz ou décompactés avec tar xzf file.tar.gz. De nos jours, de plus en plus de logiciels sont distribués à la place en archives .tar.bz2 parce que bzip2 permet de meilleurs taux de compression que gzip, et ce malgré un temps de compression plus long. AdvanceCOMP implémente une compression deflate au format gzip qui fournit des taux de compressions encore meilleurs que gzip.

Liens externes


- [http://www.gzip.org/ Site officiel]
  - [http://www.gzip.org/index-f.html En français]
- [http://www.gnu.org/software/gzip/gzip.html Page sur gnu.org] Catégorie:GNU ja:Gzip

Codage de Huffman

Définition

Le codage de Huffman est un algorithme de compression qui fut mis au point en 1952 par David Huffman. C'est une compression de type statistique qui grâce à une méthode d'arbre que nous allons détailler plus loin permet de coder les octets revenant le plus fréquemment avec une séquence de bits beaucoup plus courte que d'ordinaire. Cet algorithme offre des taux de compression démontrés les meilleurs possible dans un codage de texte octet par octet. Pour aller plus loin, il faut passer par des méthodes plus complexes détectant et codant dynamiquement des séquences de plusieurs octets et tirant profit de cette redondance supplémentaire (Lempel-Ziv, etc.). Voir également : MP3, bzip2..

Principe

Le principe du codage de Huffman repose sur la création d'un arbre composé de nœuds. Supposons que la phrase à coder est « Wikipédia ». On recherche tout d'abord le nombre d'occurrences de chaque caractère (ici les caractères 'a', 'd', 'é', 'k', 'p' et 'w' sont représentés chacun une fois et le caractère 'i' trois fois). Chaque caractère constitue une des feuilles de l'arbre à laquelle on associe un poids valant son nombre d'occurrences. Puis l'arbre est créé suivant un principe simple : on associe à chaque fois les deux nœuds de plus faibles poids pour donner un nœud dont le poids équivaut à la somme des poids de ses fils jusqu'à n'en avoir plus qu'un, la racine. On associe ensuite à chaque branche la plus faible d'un nœud le code 0 et la plus forte le code 1, comme sur le schéma suivant: Image:arbre_huffman.png Pour obtenir le code binaire de chaque caractère, on remonte l'arbre à partir de la racine jusqu'aux feuilles en rajoutant à chaque fois au code un 0 ou un 1 selon la branche suivie. Il est en effet nécessaire de partir de la racine pour obtenir les codes binaires car lors de la décompression, partir des feuilles entraînerait une confusion lors du décodage. Ici, pour coder 'Wikipédia', nous obtenons donc en binaire : 101 11 011 11 100 010 001 11 000, soit 24 bits. Il existe trois variantes de l'algorithme de Huffman, chacune d'elle définissant une méthode pour la création de l'arbre : #statique : chaque octet a un code prédéfini par le logiciel. L'arbre n'a pas besoin d'être transmis, mais la compression ne peut s'effectuer que sur un seul type de fichier (ex: un texte en français, où les fréquences d'apparition du 'e' sont énormes; celui-ci aura donc un code très court, rappelant l'alphabet morse). #semi-adaptatif : le fichier est d'abord lu, de manière à calculer les occurences de chaque octet, puis l'arbre est construit à partir des poids de chaque octet. Cet arbre restera le même jusqu'à la fin de la compression. Il sera nécessaire pour la décompression de transmettre l'arbre. #adaptatif : c'est la méthode qui offre a priori les meilleurs taux de compression car l'arbre est construit de manière dynamique au fur et à mesure de la compression du flux. Cette méthode représente cependant le gros désavantage de devoir reconstruire l'arbre à chaque fois, ce qui implique un temps d'exécution énorme.

Anecdote

Les premiers Macintoshs de la société Apple Computer utilisaient un code inspiré de Huffman pour la représentation des textes : les 15 caractères les plus fréquents d'une langue étaient codés sur 4 bits, et la 16ème configuration servait de préfixe au codage des autres sur octet (ce qui faisait donc tantôt 4 bits, tantôt 12 bits par caractère, et n'observait plus de frontières d'octet). Cette méthode simple se révélait économiser 30% d'espace sur un texte moyen, à une époque où la mémoire vive restait encore un composant coûteux. Catégorie:Format de données numériques ja:ハフマン符号 ko:허프만 코딩 th:รหัสฮัฟแมน และ รหัสแชนนอน-ฟาโน

Code Morse

L'alphabet morse, ou code morse, est un système représentant les lettres, nombres et signes de ponctuation à l'aide d'un code envoyé par intermittence. Il a été inventé en 1835 par Samuel Morse pour la télégraphie et est considéré comme le précurseur des communications numériques. Le code peut être transporté via un signal radio permanent que l'on allume et éteint (onde continue), une impulsion électrique à travers un câble télégraphique, un signal mécanique ou visuel (flash lumineux). Deux types de code morse ont été utilisés, chacun avec leurs propres différences quant à la représentation des symboles de l'anglais écrit. Le code morse américain a été utilisé dans le système télégraphique à l'origine de la première télécommunication à longue distance. Le code morse international est le code le plus communément utilisé de nos jours. Parallèlement au code morse, des codes commerciaux plus élaborés ont été créés codant des phrases complètes en un seul mot (groupe de 5 lettres). Les opérateurs de télégraphie conversaient alors en utilisant des mots tel que BYOXO (« Are you trying to crawl out of it ? »), LIOUY (« Why do you not answer my question? ») et AYYLU(« Not clearly coded, repeat more clearly. »). L'intention de ces codes était d'optimiser le coût des câbles. Les radioamateurs utilisent toujours des codes appelés Code Q et Code Z, ils étaient et sont utilisés par les opérateurs afin de s'échanger des informations sur la qualité du lien, les changements de fréquences et les télégrammes.

Le code morse international

C'est en 1838 que naquit l'alphabet « morse » que nous connaissons. Deux types d'impulsions sont utilisés. Les impulsions courtes (notées «. ») qui correspondent à une impulsion électrique de 1/25 de seconde et les longues (notées « - ») à une impulsion de 3/25 de seconde. Le code morse international est toujours utilisé aujourd'hui (certaines parties du spectre radio sont toujours réservées aux seules transmission en morse). Utilisant un simple signal radio non modulé, il demande moins d'équipement pour envoyer et recevoir que d'autres formes de communications radio. Il peut être utilisé avec un bruit de fond important, un signal faible et demande peu de bande passante. Jusque dans les années 1990, pour obtenir la licence de radio amateur (de la FCC) il fallait être capable d'envoyer 5 mots encodés en morse par minute. La licence avec le plus de droits exigeait 20 mots par minute. Les opérateurs radios militaires et radio amateurs entraînés peuvent comprendre et enregistrer jusqu'à 40 mots par minute.

Représentation et cadence

On utilise deux symboles appelés point et tiret ou ti et ta. La durée d'émission d'un tiret détermine la vitesse à laquelle le message est envoyé, elle est utilisée en tant que cadence de référence. Un message simple serait écrit :
-
- -
- --- -
  -
- / -- ---
- -
-
    -
- C O D E (espace) M O R S E
Où « - » représente ta et «
- » représente ti. Voici la cadence du même message (« = » signifie signal on, «. » signifie signal off, chacun ayant pour durée un ti) :

.=.

.=...

.

.

...

.=.=...=.......

.

...

.

.

...=.

.= ^ ^ ^ ^ ^ | ti ta | espace entre les mots | espace entre les lettres | espace entre les symboles
Conventions de cadence : Un ta est conventionnellement 3 fois plus long qu'un ti. L'espacement entre les ti et ta dans une lettre ont la longueur d'un ti. L'espacement entre les lettres d'un mot ont pour longueur un ta (3 ti). L'espacement entre les mots est de 7 ti. Les personnes familières du morse écriraient donc CODE MORSE ainsi : -
- -
- --- -
  -
- / -- ---
- -
-
    -
- Et le prononcerait: tatitati tatata tatiti ti, tata tatata titati tititi ti.

Tables

Voici quelques tables récapitulant l'alphabet morse et quelques signes communément utilisés : Les lettres: Il existe un moyen mnémonique assez simple pour apprendre les 26 lettres de l'alphabet en Morse. Partant du principe que pour chaque lettre correspond un mot traduisant le codage morse et que celui-ci commence par la lettre en question. Pour chaque syllabe du mot on a un ti ou un ta. Le ta sera représenté pour une syllabe à consonance « o » ou « on » et le ti pour toutes les autres syllabes. On obtiendra ainsi: Les nombres: La ponctuation: Codes spéciaux: Une erreur fréquente est de considérer le code de détresse international comme la succession des lettres S O S et de l'envoyer en tant que tel (=.=.=...

.

.

...=.=.=). La bonne façon de l'envoyer est en enchaînant les 9 éléments comme s'ils formaient une seule lettre (=.=.=.

.

.

.=.=.=). Extensions du code morse (liées à un langage ou une nation):

Voir aussi

Articles connexes


- Alphabet radio
- Chiffre Pollux
- Télégraphe

Sites internets


- [http://justlearnmorsecode.com Just Learn Morse Code]
- [http://lingvo.org/morso Morso pour l'espéranto] Catégorie:Télécommunications Morse ja:モールス信号

David A. Huffman

Huffman, David A. Le professeur David A. Huffman (9 août 1925 - 7 octobre 1999) fut un pionnier dans le domaine de l'informatique. Il mourut à l'âge de 74 ans après un combat de dix mois contre le cancer. Durant toute sa vie, Huffman apporta des contributions importantes à l'étude des machines à états finis. Mais Huffman est principalement connu pour son légendaire codage de Huffman : une méthode optimale de codage sans perte et de longueur variable. Le codage de Huffman est utilisé dans presque toutes les applications qui impliquent la compression et la transmission de données digitales comme les fax, les modems, les réseaux informatiques et la télévision à haute définition.

Détails

Né le 9 août 1925 en Ohio, Huffman obtint son baccalauréat en ingéniérie électrique de l'université de l'Ohio à l'âge de 18 ans. Puis il travailla pour la Marine militaire des États-Unis d'Amérique en tant qu'officier chargé de la maintenance des radars à bord d'un destroyer qui détruisait les mines dans les mers du Japon et de la Chine après la seconde Guerre mondiale. Il obtint ensuite le grade de Master à l'université de l'Ohio et son Doctorat du MIT en 1953. En 1967, il alla à Santa Cruz en tant que membre de la faculté du « Computer Science Department ». Il joua un rôle majeur dans le développement des programmes académiques du département et dans le recrutement des étudiants de la faculté, qu'il présida de 1970 à 1973. Il se retira en 1994 mais resta actif en tant que professeur, enseignant la théorie de l'information et l'analyse des signaux. Huffman contribua beaucoup au développement de différents domaines, notamment dans la théorie de l'information et l'encodage, où il a été un pionnier dont les découvertes sont à la base des compressions informatiques dans toutes les machines de nos jours. Il a aussi étudié les signaux pour les radars et les applications en communication, et des procédures pour la synchronisation logique des circuits. Comme supplément à son travail sur les propriétés mathématiques de la « courbure nulle » des surfaces, Huffman a aussi développé sa propre technique pour plier du papier dans des formes inhabituelles. Ce que Huffman a accompli lui a valu de nombreuses récompenses. Il reçut la « Médaille Richard W. Hamming 1999 » de l'institut des ingénieurs en électronique et électricité (IEEE) en reconnaissance de ses exceptionnelles contributions dans l'information scientifique. Il reçut également la « Médaille Louis E. Levy » de l'institut Franklin pour sa thèse de doctorat sur les circuits à « switch séquentiels », un « Distinguished Alumnus Award » de l'université de l'Ohio, et le « W. Wallace McDowell Award ».

Voir aussi

Articles connexes


- Codage de Huffman

Liens externes


- [http://www.sgi.com/misc/grafica/huffman/ Geometric Paper Folding] : Origami de Huffman

Apple Computer

Apple Computer, Inc. (anglais : Ordinateurs Pomme, Société) est une société multinationale dont l'activité principale était de fabriquer et de vendre des ordinateurs (y compris le système d'exploitation) ; cette activité, longtemps majoritaire dans le chiffre d'affaire de la marque, est en recul depuis l'année 2001 par rapport aux activités annexes (voir [http://www.cuk.ch/redac/totheend/imgtxt25/profit_segment_b.jpg ce graphique] publié par le site cuk.ch). Depuis le premier trimestre fiscal 2005 (de septembre à décembre pour Apple), la vente de logiciels (notamment dans les domaines de l'édition vidéo et musicale) d'accessoires (dont l'iPod), et de services (dont l'iTunes Music Store), initialement destinés à enrichir les possibilités de la plate-forme, sont devenus majoritaires dans le chiffre d'affaires de la marque.
La marque est à l'origine de nombreux concepts qui ont révolutionné l'informatique. Elle doit à ses débuts sa fortune à l'Apple II qui a connu un énorme succès au début des années 1980 et s'est vendu à plusieurs millions d'exemplaires. Apple II

Histoire

Voir aussi : Chronologie d'Apple Computer Chronologie d'Apple Computer]]

Les débuts

Apple a été fondée par Steve Jobs et Steve Wozniak le 1 avril 1976 pour lancer l'ordinateur Apple I construit par Wozniak. L'Apple I était fabriqué par Steve Jobs et Steve Wozniak dans leur garage et vendu grâce au bouche à oreille. C'était le premier ordinateur individuel (en fait une carte dotée de divers composants électroniques) à être conçu pour être combiné à un clavier et à un moniteur pour l'affichage. Environ deux cent unités furent produites et vendues à 666,66 $ l'unité, mais le succès fut tel qu'ils ne purent honorer toute la demande. Les caractéristiques de l'Apple I étaient limitées par le peu d'argent dont disposaient Jobs et Wozniak (pour construire le prototype, l'un avait dû revendre sa voiture et l'autre sa calculatrice programmable !). Mais avec l'argent gagné grâce à la vente de l'Apple I, ils purent commencer à penser une machine bien plus ambitieuse : l'Apple II. L'idée était de concevoir un ordinateur que tout le monde pourrait utiliser. Wozniak eut l'idée d'inclure dans la machine de la mémoire vidéo pour gérer un affichage en couleur, tandis que Jobs imagina d'intégrer tous les composants dans un boîtier anodin en plastique pour le rendre plus convivial. Mais concevoir une telle machine demandait beaucoup d'argent, ce qu'ils n'avaient pas. Aucune banque ne voulut se risquer dans un tel projet : un ordinateur utilisable par le grand public paraissait absurde à l'époque ! Ronald Wayne, qui avait aidé Jobs et Wozniak à concevoir l'Apple I, était sceptique sur les chances de réussite d'un tel projet (il avait souvenir d'une entreprise ratée quelques années auparavant) et abandonna la compagnie. Jobs rencontra finalement Mike Markkula en 1977, qui apporta son expertise en affaires et un chèque de 250 000 $ au capital d'Apple. Il fournit aussi par la même occasion son premier PDG à Apple, Michael Scott (il prendra lui même la tête de l'entreprise en 1981).

L'Apple II et le succès

L'Apple II fut finalement présenté au public en avril 1977 et devint l'ordinateur qui est généralement crédité d'avoir créé le marché de l'informatique personnelle. À cette occasion Apple changea de logo pour la pomme colorée, qui rappelait que l'Apple II est l'un des premiers ordinateur à pouvoir afficher en couleurs. L'Apple II fut immédiatement un immense succès. À la mi 1979, Apple présente l'Apple II+, une évolution du premier Apple II dotée notamment de plus de mémoire (48 Ko extensible à 64 Ko !) et du langage de programmation Basic. Tandis que l'Apple II connaissait un succès croissant, trois nouvelles machines étaient déjà en projet chez Apple : Sara, Lisa et Macintosh. Sara devait être une évolution de l'Apple II, une machine de transition avant les Lisa et Macintosh qui seraient un tout nouveau type de machines. Pour le successeur de l'Apple II, Steve Jobs voulait une machine plus avancée encore pour concourir dans le marché de l'informatique d'entreprise. Les ingénieurs devaient donc se conformer à des objectifs très ambitieux voire quelquefois presque irréalisables (un thème récurrent dans l'histoire d'Apple...), d'autant plus que la période de développement de cette machine était courte (un peu moins d'un an). En effet Apple sentait que l'Apple II arrivait en fin de vie et qu'il faudrait présenter son successeur le plus vite possible. Sara fut finalement présenté en mai 1980 sous le nom d'Apple III. Malheureusement certains choix techniques, parmi lesquels l'omission d'un ventilateur, eurent raison de beaucoup d'exemplaires qui grillèrent parfois même avant d'être livrés. Des milliers d'Apple III durent être rappelés pour être remplacés. Quelques mois plus tard, en novembre 1981, Apple sortit une nouvelle version de l'Apple III, qui corrigeait tous les gros problèmes de la version initiale. Un Apple III+ sortit même en 1983. Mais les problèmes à ses débuts découragèrent les acheteurs et eurent raison de l'Apple III, qui devint le premier grand échec commercial d'Apple. Seuls 65 000 exemplaires auront finalement étés vendus, alors qu'Apple comptait en vendre des millions comme l'Apple II. Les machines qui sortirent dans les années suivantes reprirent d'ailleurs le nom d'Apple II (IIe en janvier 1983, IIc en 1984, etc.) pour oublier les déboires de l'Apple III. Pendant ce temps, différentes équipes chez Apple travaillaient sur les projets Lisa et Macintosh, qui étaient un tout nouveau type d'ordinateur, utilisant des technologies avancées comme l'interface graphique, la souris, la programmation orientée objet ou encore les réseaux. Des gens comme Jef Raskin ou Bill Atkinson conjuraient Steve Jobs d'accorder plus d'attention à leurs travaux. Ce n'est que lorsqu'ils l'emmenèrent voir les travaux réalisés au Xerox PARC, en décembre 1979 que Jobs décida que l'avenir serait dans ces machines à interface graphique, et il apporta dès lors son soutien aux équipes Lisa et Macintosh et prit la direction du projet Lisa. Malgré les objections de quelques chercheurs au PARC, Xerox autorisa aux ingénieurs d'Apple l'accès aux locaux du PARC durant trois jours, en échange d'un million de dollars d'actions Apple lorsqu'elle sortira en bourse. Cette visite historique eut un énorme impact sur les futurs ordinateurs d'Apple. Le 12 décembre 1980, Apple entra en bourse. Jusqu'à présent, seuls des employés d'Apple possédaient des parts de l'entreprise. En quelques minutes, les 4,6 millions d'actions furent vendues à 22 dollars l'unité, augmentant instantanément de 100 millions de dollars le capital d'Apple. Du même coup des dizaines d'employés chez Apple se retrouvèrent millionnaires. En 1981 Mike Markkula prit le poste de PDG d'Apple. Il licencia Steve Jobs de l'équipe Lisa, lui reprochant de mal gérer l'équipe (le projet prenait alors beaucoup de retard). Jobs se rabattit alors sur le projet Macintosh. Le Lisa sortit finalement début 1983, et devint le premier ordinateur personnel utilisant une interface graphique et une souris. Malgré son caractère révolutionnaire, le Lisa se vendit très mal, principalement à cause de son prix très élevé : 10 000 $. Alors qu'Apple subissait les échecs de l'Apple III et du Lisa, Mike Markkula démissionna de la direction d'Apple en 1983. Le poste de PDG fut proposé à John Sculley, alors président de Pepsi. Il refusa d'abord le poste ; pour le convaincre Steve Jobs lui posa cette profonde question : « Préférez-vous passer le reste de votre vie à vendre de l'eau sucrée ou avoir une chance de changer le monde ? ». John Sculley accepta finalement et devint le troisième PDG d'Apple.

Le Macintosh

De son côté, le projet Macintosh avait pris beaucoup de retard. Dès son arrivée dans l'équipe, Steve Jobs voulut tout changer et commença à renouveler l'équipe. Ces manières ne furent pas du goût de Jef Raskin, l'initiateur et responsable du projet, qui finit par quitter Apple en 1981, supplanté par Steve Jobs. Jobs voulait faire du Macintosh une machine plus abordable et simple à utiliser pour le grand public que le Lisa. À mesure que le projet arrivait à terme, Apple sentait que le Macintosh serait un événement historique. 15 millions de dollars furent alors dédiés à la promotion de la machine lors de la sortie. Le 22 janvier 1984, une publicité historique dévoila le Macintosh lors de la mi-temps de la finale du Super Bowl américain, le plus grand événement sportif de l'année aux États-Unis. Intitulée 1984, cette publicité deviendra ce qui est certainement le spot télévisé le plus célèbre dans le monde. Avant le lancement du Macintosh, plusieurs prototypes avaient été donnés en 1983 à Bill Gates, co-fondateur et PDG de Microsoft, pour le développement de logiciels pour le Macintosh. En 1985, Microsoft lance Windows, son interface graphique pour IBM PC, qui utilisait de nombreux éléments de Mac OS. Cela conduisit à une longue bataille judiciaire entre Apple et Microsoft. Le résultat du jugement autorisa Microsoft à copier tous les éléments qu'il voulait sur l'interface graphique du Macintosh. C'est alors que, en étudiant le système des IBM PC, beaucoup de sociétés purent fabriquer des Compatibles IBM PC. Bien que la première version de Windows était technologiquement inférieure au Macintosh, un clone PC pouvait être vendu bien moins cher. C'est la raison pour laquelle, grâce à la nature ouverte de la plate-forme PC, il y a toujours eu plus de logiciels disponibles pour Windows. Malgré quelques défauts au début, comme le manque de logiciels, l'écran en noir et blanc uniquement et l'architecture fermée, le Macintosh fut finalement un succès (qui continue encore aujourd'hui). Plus de 100 000 unités furent vendus dans les six mois suivant son lancement. Certains arguent néanmoins qu'il aurait pu être un bien plus grand succès. Apple n'autorisa pas d'autres sociétés à vendre des clones de Macintosh avant les années 1990, soit bien après que Microsoft ait dominé le marché avec son large programme de licences. Dès lors il fut trop tard pour Apple pour réussir à regagner les parts de marché perdues et les clones furent interdits après quelques années seulement en 1998. Le Macintosh, bien qu'étant un bien meilleur produit que l'Apple II, ne le remplaça pas totalement dans la gamme Apple. Il s'agissait de deux plate-formes séparées et incompatibles, et Apple les destinait à des marchés très différents : le Macintosh pour les universités, les étudiants et les travailleurs intellectuels, et l'Apple II pour les écoles publiques et la maison. Ainsi Apple continua à commercialiser de nouvelles versions de l'Apple II jusqu'au début des années 1990. LApple IIc sortit deux mois après le Macintosh, en avril 1984. L'Apple IIgs sortit en 1986 et était un produit hybride qui utilisait une souris et un système ressemblant à celui du Macintosh. Enfin un ultime modèle fut lancé en 1988, l'Apple IIc+, avant l'abandon du développement de la plate-forme Apple II. Apple préférait continuer à tirer partie du succès et de la renommée de l'Apple II le plus longtemps possible pour ne pas se risquer à miser tout sur le Macintosh dont le succès n'était pas encore assuré. Parallèlement aux Apple II, des nouveaux modèles de Macintosh se succédèrent à un rythme de plus en plus soutenu : Le Macintosh 512K fut lancé six mois après le macintosh original, qui corrigeait son plus gros défaut : le manque de mémoire. En 1986 apparaissent le Macintosh 512Ke et le Macintosh Plus qui était le premier macintosh évolutif, puis en mars 1987 le Macintosh SE qui intégrait des slots d'extension internes, et le Macintosh II qui était le premier Macintosh au format « boîte à pizza », très évolutif et puissant. Steve Jobs est contraint à quitter Apple en 1985 (il y avait incompatibilité avec Sculley), et crée alors la société NeXT. Sculley prépare aussi un plan de restructuration d'Apple : 1200 personnes sont licenciées, soit environ 20 % des effectifs totaux. En septembre 1989, Apple lance le Macintosh Portable. Cet ordinateur était en fait plus un « transportable » qu'un « portable » : il pesait plus de 7 kg. Contrairement aux PC portables de l'époque, il disposait d'une batterie lui autorisant une très grande autonomie, et était doté d'un dispositif permettant de le mettre en veille sans avoir à l'éteindre. L'autonomie était ainsi de 10 heures en fonctionnement et passait à un mois en veille ! La même année, Apple met fin à la commercialisation du Lisa, qui n'aura jamais connu le succès. Au début des années 1990, les véritables nouveautés deviennent plus rares chez Apple : on se contente de sortir de nouveaux modèles de plus en plus puissant, plus évolutifs (Quadra) ou plus abordables (Macintosh Classic et Famille Macintosh LC), et les versions de Mac OS stagnent . Tandis qu'Apple a un peu reculé du devant de la scène, Microsoft présente Windows 3 en 1990. L'action d'Apple s'effondre aussitôt. Même s'il restait largement inférieur à Mac OS, Windows 3 s'en inspirait encore plus largement et apportait aux PC une énorme avancée en terme d'interface graphique. Tous les constructeurs de PC l'adoptent immédiatement. Apple se rend alors compte que la guerre des systèmes est définitivement perdue, John Sculley le reconnaîtra lui-même : « Dans ce monde, ce n'est pas le meilleur qui gagne, mais celui qui sait s'allier avec les développeurs de logiciels, et proposer un système ouvert et riche, même s'il est inférieur techniquement. » Pour essayer de contrer Microsoft, Apple lance le projet StarTrek avec le soutien de Novell et Intel, visant à rendre Mac OS compatible avec les PC à architecture x86. Ce projet sera arrêté plus tard, trop coûteux pour Apple qui mettait toute sont énergie au développement du PowerPC, un processeur très prometteur.

Les années difficiles

Devant la concurrence grandissante des PC offrant des machines aux prix de plus en plus réduits, Apple a du mal a augmenter ses ventes. Apple est forcée de diminuer ses marges pour que les Macintosh restent compétitifs. La toute nouvelle ligne Performa est destinée au grand public pour essayer de le reconquérir. Sculley annonce de nouveaux licenciement : 345 personnes dans une usine en Californie. Tout cela ne suffit pas, et John Sculley est démis de son poste de PDG par le conseil d'administration en juin 1993, après dix ans de règne. Il est remplacé par Michael Spindler. Celui-ci prend aussitôt les choses en main pour maintenir les bénéfices : 2500 postes sont supprimés. Pour assurer la survie de la plate-forme Macintosh, il lève l'interdiction de vendre des « clones ». Mais peu d'entreprises se lancent dans les Mac compatibles et peu de licences sont vendues, le marché trouvant les accords de licence Apple trop restrictifs. Ainsi, le marché Mac ne fut que peu augmenté par les clones. La sortie des Power Macintosh, à base de processeur PowerPC, en 1994 permet à Apple de retrouver sa capacité d'innovation, qui a toujours été le moteur des ventes. Le PowerPC est le fruit de trois ans de collaboration entre Apple, IBM et Motorola (alliance AIM). Alors que tous les ordinateurs jusqu'alors était de type CISC, IBM avait conçu un processeur RISC. Le résultat est que les PowerPC étaient particulièrement rapides, tournant à des fréquences d'horloge très élevées et permettant aux nouveaux Power Macintosh de dépasser en vitesse les PC à base de processeur Intel les plus puissants. Très rapidement le PowerPC se généralise à toute la gamme : les Performa en avril 1995 et les PowerBook en août de la même année avec le PowerBook 5300. Mais depuis un an les clones se sont multipliés, et commencent à grignoter une partie non négligeables des ventes de Macintosh. Autorisés pour permettre la survie du Mac, les clones sont devenues pour Apple un grand danger. Pour résister face à cette nouvelle concurrence, Apple est obligée de réduire ses coûts de production et cela se ressent sur les nouvelles machines : certains modèles souffrent de défauts de fabrication ou de bugs de conception. Des modèles doivent retourner en SAV. Le PowerBook 5300 est révelateur de cette situation : de nombreuses machines brûlent à cause de leur batterie, le capot en plastique s'avère ne pas résister aux chocs... Apple doit finalement rappeler tous les PowerBook 5300 pour en changer la batterie. La réputation d'Apple est entachée, la légendaire fiabilité des Mac n'est plus. Parallèlement, et alors que les évolutions de Mac OS stagnent (le système 7 commence à s'éterniser), Microsoft lance Windows 95, qui imite plus que jamais l'interface graphique des Mac. C'est un immense succès, aidé par une campagne de publicité pharaonique. Au second trimestre 1995, Spindler commet une énorme erreur stratégique : il mise tout sur les Performas au détriment des Power Mac. La conséquence est qu'Apple finit par ne vendre que des machines d'entrée de gamme à très faibles marges. Certes le nombre de Mac vendus n'a jamais été aussi élevé (4,5 millions sur l'année 1995), mais les bénéfices sont quasi inexistants et Apple subit une perte de 68 millions de dollar au dernier trimestre 1995. De plus, Apple n'arrivait pas à honorer toutes les commandes : l'équivalent de un milliard de dollars de commandes était en attente en juin 1995, soit autant de recette perdue. Spindler est poussé à démissionner, Gil Amelio est appelé à la rescousse pour tenter de sauver Apple. Il prend son poste de PDG d'Apple en janvier 1996. Amelio hérite d'une société en piteux état financier, et il sait que la tâche sera dure. Il prépare un plan draconien : 3500 postes sont supprimés, soit plus du quart des effectifs totaux d'Apple. Il arrête le développement de la console Pippin et se sépare de la filiale Newton. Il impose à tous les fournisseurs d'Apple une baisse des tarifs de ventes de leurs composants, rompant le contrat avec ceux qui refusent. Les effets de cette politique d'économie commencent à porter leurs fruits : de 740 millions de dollars au premier trimestre 1996, Gil Amelio réussit à ramener les pertes à 33 millions au deuxième trimestre. Les bénéfices reviennent au troisième trimestre 1996 (30 millions de dollars net). Du coté de Mac OS, le développement de Copland stagne malgré tout l'argent investi, et est abandonné. Le choix est fait de chercher ailleurs le successeur du Système 7. Alors que tout le monde s'attendait au rachat de BeOS, Apple surprend en rachetant NeXT (la société créée par Steve Jobs après avoir été viré d'Apple...) pour 400 millions de dollars en décembre 1996. Amelio annonce lors de la Macworld Expo de janvier 1997 que le nouveau système d'exploitation, fruit de la fusion entre Mac OS et NeXTSTEP, s'appellera Rhapsody et sortira en 1998. Steve Jobs, qui a rejoint Apple par le rachat de NeXT dont il était le PDG, est nommé assistant de haut niveau de Gil Amelio. Le remplacement du vieillissant Système 7.5, le 7.6, arrive enfin au début de l'année 1997 et Amélio annonce Mac OS 7.7, nom de code Tempo (qui sera renommé Mac OS 8). Il fait aussi disparaître la gamme Performa, qui fusionne avec la gamme Power Mac, pour clarifier la gamme. Apple subit malgré tout de nouveau des pertes records aux premier et deuxième trimestre 1997. La sentence tombe : Gil Amelio est remercié par le conseil d'administration. Steve Jobs refuse le poste de PDG d'Apple, préférant un poste de dirigeant « intérimaire ». Pour combler le trou, Fred Anderson est nommé responsable de la gestion de la société. Mais Steve Jobs a réellement le pouvoir de faire ce qu'il veut...

L'iMac : le début du renouveau

Le retour de Steve Jobs est très bien accueilli par les partisans d'Apple qui y voient le signe du renouveau. Il ne seront pas déçus : quelques mois après son retour, Steve Jobs présente son
bébé, l'iMac (designer : Jonathan Ives). Ce produit est une grosse rupture pour le Macintosh, tant par ses choix techniques innovants comme l'USB, l'absence de lecteur de disquettes et de ventilateur, que par son design original avec ses coques colorées et translucides. L'iMac est une petite révolution dans le monde de la micro-informatique en étant le premier produit à accorder une importance première au design. Pour la première fois les designers imposaient des contraintes aux ingénieurs et non le contraire. Steve Jobs étant opposé aux clones, il changea le nom du système 7.8 en 8, car les licences ne portaient que sur la version 7. La fusion entre Mac OS et NeXTSTEP (connu aussi sous le nom d'OPENSTEP, le système d'exploitation de NeXT, donnera naissance à Mac OS X (ex-Rhapsody), qui sortira le 24 mars 2001 après avoir été plusieurs fois reporté. Le passage de Mac OS 9 à Mac OS X est une évolution significative. Ce nouveau système d'exploitation est conçu sur une base POSIX (UNIX), ce qui lui permet, outre les programmes spécifiquement écrits pour lui, de bénéficier de la logithèque libre — devenue populaire avec Linux et ses interfaces graphiques. Les programmes développés pour les versions antérieures fonctionnent toujours en émulation grâce à un programme appelé Classic.

L'iPod et la diversification

La marque s'est depuis diversifiée : en effet, elle a ouvert un magasin de vente de musique en ligne, l'iTunes Music Store (ITMS) en avril 2003. Ce magasin virtuel est intégré au logiciel iTunes et est conçu comme un produit d'appel pour ses ordinateurs et son baladeur numérique iPod. La sortie de l'iPod a donné naissance à un nouveau procès avec la société
Apple jadis fondée par les Beatles et s'occupant d'édition musicale, cette dernière marque étant déposée pour tout ce qui concerne la musique. Un premier procès avait déjà eu lieu entre les deux sociétés au sujet d'une carte son commercialisée par Apple Computer. L'iPod est assujetti en France à la taxe Tasca au mégaoctet concernant le droit de copie privée d'audiogrammes sur support numérique. Apple a protesté officiellement contre cette taxe. Depuis la sortie de l'iPod, la part du chiffre d'affaire d'Apple réalisé dans la vente des Mac diminue peu à peu (plus que 50 % du chiffre d'affaire fin 2004, contre 12 % début 2000). Un nouvel iPod est sorti en septembre 2005, l'iPod Nano. Il remplace l'iPod Mini, en étant 7 fois moins épais que le premier iPod. Un nouveau concept de Macintosh, le Mac Mini, est apparu. De dimensions réduites (inférieures à celles d'un boitier 3,5" externe) et vendu à un prix minimaliste (à partir de $499 aux USA, 529 Eur en France), il a pour but de constituer le "chaînon manquant" entre des possesseurs d'iPod jusqu'alors dépourvus d'ordinateur et le magasin de musique en ligne iTunes Music Store.

La transition vers les processeurs Intel

iTunes Music Store Dix ans après le passage de la famille de microprocesseurs 68000 au PowerPC, après l'évolution vers le nouveau système Mac OS X, Steve Jobs annonce le 6 juin lors de la
Conférence mondiale des développeurs Apple 2005 (WWDC 2005) que sa société aborde un nouveau virage en adoptant le microprocesseur Pentium pour les nouveaux modèles qui seront diffusé à partir juin 2006 et que cette transition serait terminée en 2007 où tous les Mac embarqueront un processeur Intel. A cette occasion, il confirme que depuis la première version de Mac OS X, le système du Mac a été aussi développé parallèlement pour le processeur d'Intel. A cette occasion, il fait la démonstration des nouveautés aux développeurs sur une machine à base de Pentium, ce qu'il révèle au moment de l'annonce de la mutation. On notera que lors de la présentation, il fera une référence à Wikipédia en montrant un widget Dashboard exploitant l'encyclopédie tout en disant "This is my favorite one. It's an open-source and Free Encyclopedia…" (« Celui-ci est mon préféré. C'est une encyclopédie libre, gratuite et open-source… ») [http://www.apple.com/quicktime/qtv/wwdc05/ ici la vidéo complète de la keynote]

Les rencontres avec le public

Il y a trois grandes messes Apple annuelles. Chacune est ouverte par une
keynote ou Steve Jobs présente généralement de nouveaux produits.

MacWorld Expo de San Francisco

Se déroule en janvier.

Conférence mondiale des développeurs (WWDC)

Événement annuel de première importance, c'est à cette occasion qu'Apple dévoile les principales nouveautés de l'année. Elle a lieu généralement courant juin.

Apple Expo

Se déroule à Paris, en septembre. Premier rendez-vous Mac en Europe et premier événement IT et numérique en France, [http://www.apple-expo.com Apple Expo] est un événement en constante évolution illustrant le changement de toute notre société vers un monde numérique, et ponctué d'animations originales pour étonner, informer et former les visiteurs professionnels et le grand public.

Le logo d'Apple

Dashboard La première version du logotype représentait Isaac Newton sous un arbre duquel pendait une pomme. Très rapidement, il est remplacé par une pomme aux couleurs de l'arc-en-ciel mordue sur le côté droit, imaginée par Rob Janoff. Les caractéristiques visuelles de ce logo apparaissent comme le résultat d'un contre-pied systématique fait à partir du logo d'IBM, firme concurrente d'Apple à l'époque. En effet, la silhouette de la pomme donne au logo Apple une configuration simple et comprise en un bloc général, alors que IBM se présente sous la forme d'un triptyque. Deuxièmement, les formes du fruit sont entièrement construites à partir de courbes, IBM est construit de droites. Troisièmement, la séquence chromatique est de type ABBA chez Apple : les couleurs chaudes au centre, insistant sur le croquement de la pomme, froides à l'extérieur. La séquence dans le cas d'IBM est répétitive (ABAB) et monochromatique : les bandes disjointes sont de couleurs froides comme le bleu. Malgré les dénégations officielles de Steve Jobs, nombre de gens pensent que ce deuxième logo serait un hommage au mathématicien britannique Alan Turing, un des précurseurs de l'informatique. En effet, suite à une condamnation à la castration chimique pour homosexualité, Alan Turing se serait suicidé en mangeant une pomme empoisonnée au cyanure. Le logo rappelerait l'objet du suicide, et le fond arc-en-ciel l'homosexualité de Turing. En 2001 ce logo change à nouveau : la forme reste la même (même si elle se pare parfois d'un léger effet de relief) mais le motif arc-en-ciel est remplacé par un ton monochrome variant selon le produit qui la porte. Le combat avec IBM était fini. Apple se veut désormais un symbole facile à retenir, comme l'est Sony ou Nike. Ce changement est destiné à donner de l'entreprise une image plus en adéquation avec ses ambitions sur le marché professionnel. La pomme multicolore, évoquant le mouvement hippie, les sons à l'ouverture de fenêtres ou le « Mac qui sourit » (autrefois affiché au démarrage du Macintosh) étaient passés de mode.

Les dirigeants d'Apple


- 1976-1981 : Michael Scott
- 1981-1983 : Mike Markkula
- 1983-1993 : John Sculley
- 1993-1996 : Michael Spindler
- 1996-1997 : Gil Amelio
- depuis 1997 : Steve Jobs qui possède 6,22% de la société

Parts de marché

|+Ventes de micro-ordinateurs
(en italiques les chiffres qui correspondent à l'année fiscale Apple et non à l'année civile) ! rowspan=2 width=80| Année ! colspan=2 width=150| Monde ! colspan=2 width=150| France ! width=100| États-Unis |- align=center bgcolor=#CCCCCC ! unités vendues ! PdM ! unités vendues ! PdM ! PdM |- align=center |2005 (Q3) | 1 236 000 | 2,3 % | | | 4,3 % [http://www.idc.com/getdoc.jsp?containerId=prUS00259505] |- align=center |2005 (Q2) | 1 182 000 | 2,5 % | | | 4,5 % [http://www.idc.com/getdoc.jsp?containerId=prUS00194105] |- align=center |2005 (Q1) | 1 070 000 | 2,3 % | | | 3,9 % [http://www.idc.com/getdoc.jsp?containerId=pr2005_04_14_170722] |- align=center | 2004 | 3 507 000 | 2,0 % | | 2,2 % | 3,3 % [http://www.idc.com/getdoc.jsp?containerId=pr2005_01_17_202135] |- align=center | 2003 | 3 098 000 | 2,0 % | | | 3,2 % [http://www.idc.com/getdoc.jsp?containerId=pr2005_01_17_202135] |- align=center | 2002 | 3 098 000 | 2,2 % | | 2,8 % | |- align=center | 2001 | 3 215 000 | 2,4 % | 147 759 | 3,2 % [http://www.idc.com/france/about/cp_barometre_microq42001.jsp] | |- align=center | 2000 | 3 733 000 | 3,5 % | 186 500 | 4,0 % [http://www.idc.com/france/about/cp_barometre_microq42001.jsp] | |- align=center | 1999 |
3 448 000 | 3,4 % | | | |- align=center | 1998 | 2 763 000 | 2,6 % | | | 4,9 % |- align=center | 1997 | 2 874 000 | 3,2 % | | | 5,5 % |- align=center | 1996 | 3 960 000 | 5,3 % | | | 7,8 % |- align=center | 1995 | 4 500 000 | 7,9 % | | | 14,1 % |- align=center | 1994 | 3 800 000 | 8,3 % | | | 14,7 % |- align=center | 1993 | 3 300 000 | 9,4 % | | | |- align=center | 1992 | 2 500 000 | | | | |- align=center | 1991 | 2 100 000 | | | | |- align=center | 1990 | 1 300 000 | | | | |- align=center | 1989 | 1 100 000 | | | | |- align=center | 1988 | 900 000 | | | | |- align=center | 1987 | 550 000 | 15 % | | | |- align=center | 1986 | 380 000 | | | | |- align=center | 1985 | 200 000 | | | | |- align=center | 1984 | 372 000 | | | | |{{{{{{{{{{{{{{{{{{{{{{{{{{{{{{

Run-length encoding

Catégorie:Algorithme Compression de données Le run-length encoding est un algorithme de compression de données en informatique. Le système s'applique essentiellement à des documents scannés en noir et blanc : au lieu de coder un bit par point, on dispose d'un compteur — en général sur un octet — indiquant combien de points blancs ou noirs se suivent. Comme il est rare de ne pas avoir au moins 8 pixels noirs ou 8 pixels blancs qui se suivent, et que 256 ne sont pas rares sur les endroits vierges ou les à-plats noirs, le système a bien pour effet une compression. S'il y a plus de 256 bits de la même couleur, on peut placer ensuite un octet spécifiant 0 bit de la couleur opposée, puis coder le nombre de bits qui restent... Par exemple, considérons un écran de texte noir sur fond blanc. Il sera constitué de longues séquences de pixels blancs pour le fond, et de courtes séquences de pixels noirs pour le texte. Représentons une ligne d'un tel écran, avec B pour les pixels noirs et W pour les pixels blancs : WWWWWWWWWWWWBWWWWWWWWWWWWWWBBBWWWWWWWWWWWWWWWWWWWWWWWBWWWWWWWWWWW Un encodage RLE consiste alors à indiquer pour chaque suite de pixels d'une même couleur, le nombre de pixels de cette séquence. Le résultat comporte en général moins de caractères, bien que ce ne soit pas une obligation. On obtient par exemple pour la ligne précédente : 12W1B14W3B23W1B11W

Applications

Les formats d'images utilise cette compression en considérent que toutes les lignes de pixels sont jointes pour former une unique séquence de couleur.
- Le format BMP de Windows et OS/2 permet d'utiliser la compression RLE pour les images en 1, 4 et 8 bits/pixel (respectivement noir & blanc, 16 couleurs et 256 couleurs)
- Le format PCX utilise également le principe de la compression RLE pour les images en 8 et 24 bits/pixel. Dans le cas des images en 24 bits/pixel, l'image est en fait découpée en trois plans de couleur (rouge, vert et bleu) où chaque plan est encodé comme une image en 8 bits/pixel ja:連長圧縮 ko:반복 길이 부호화

Lempel-Ziv-Welch

Définition

LZW (pour Lempel-Ziv-Welch) est un algorithme de compression de données. Il s'agit d'une amélioration des algorithmes LZ77 (1977) et LZ78 (1978), tous les deux écrits par Abraham Lempel et Jacob Ziv. LZW fut créé en 1984 par Terry Welch, d'où son nom. L'algorithme LZW a été breveté par la société Unisys. Il a été utilisé dans les modems (norme V42 bis) et est encore utilisé dans le format d'image numérique GIF.

Principe

Cet algorithme est appelé « à dictionnaire », car il se base sur la répétition de chaînes de caractères dans un même flux. Les fenêtres coulissantes de LZ77 et LZ78 ont elles disparues, remplacées par un tampon, mais le dictionnaire est lui toujours présent. Ce dernier se chargera d'enregistrer les chaînes de caractères rencontrées et de leur associer un indice. Tout d'abord on initialise le dictionnaire en donnant au code '0' l'indice 1, le code '1' l'indice 2.....etc jusqu'à '255' (ce qui correspond aux 256 valeurs différentes que peut prendre un octet). L'indice 0 sera reservé pour un usage ultérieur. On charge un premier caractère dans le tampon. La compression se passe alors comme suit : 1) On charge un nouveau caractère dans le tampon sans effacer les précédents 2) On recherche si la chaîne de caractères présente dans le tampon est présente dans le dictionnaire. Si elle l'est, on retourne à l'étape 1). Si elle ne l'est pas, on la rajoute dans le dictionnaire avec un nouvel indice et l'on émet la séquence allant du début du tampon jusqu'à l'avant-dernier caractère inclus, on supprime les caractères émis, et l'on retourne à l'étape 1). Notons que les codes binaires sont tout d'abord généralement émis sur 8 bits, jusqu'à ce que ces 8 bits ne suffisent plus à coder l'indice que l'on désire(par exemple l'indice 256, qu'il est nécessaire de coder sur 9 bits). On émet alors l'indice 0 pour signifier que l'on augmente le nombre de bits émis de 1. Prenons un exemple. Supposons que la phrase à coder soit « repetition ». À chaque lettre est associé son code ASCII. Le dictionnaire est inititialisé et associe l'indice 1 au code '0', l'indice 2 au code '1'.....etc jusqu'à l'indice 256 qui correspond au code '255'. ETAPE TAMPON EMIS RAJOUT AU DICTIONNAIRE 1 '114'+'101' '115' 257 : '114'+'101' 2 '101'+'112' '102' 258 : '101'+'112' 3 '112'+'101' '113' 259 : '112'+'101' 4 '101'+'116' '102' 260 : '101'+'116' 5 '116'+'105' '117' 261 : '116'+'105' 6 '105'+'116' '106' 262 : '105'+'116' 7 '116'+'105' '0' 8 '116'+'105'+'111' '261' 263 : '116'+'105'+'111' 9 '111'+'110' '112' 264 : '111'+'110' 10 '110' '111' Au début de la compression, les codes binaires seront émis sur 8 bits. À l'étape 1), on charge dans le tampon les 2 premiers caractères. Cette suite n'est pas présente dans le dictionnaire, donc on la rajoute. On émet ensuite sur 8 bits le code '115' (car le code '114' à pour indice '115' dans le dictionnaire) et l'on supprime du tampon les caractères émis. À l'étape 2), un charge un nouveau caractère dans le tampon et comme cette chaîne n'est pas présente, on la rajoute au dictionnaire. Puis on émet le code '102' que l'on supprime ensuite du tampon. Les étapes suivantes fonctionnent sur le même principe. Arrivé à l'étape 7), la chaîne '116'+'105' étant déjà présente dans le dictionnaire (indice 261), on émet le code '0' car 261 ne peut se coder sur 8 bits, il nécessite un minumum de 9 bits. Les codes émis seront donc désormais émis sur 9 bits. À l'étape 8), on charge un nouveau caractère dans le tampon. La chaîne n'est pas présente dans le dictionnaire, donc on la rajoute. On émet ensuite l'indice de la chaîne '116'+'105' (261) et on la supprime du dictionnaire. Les étapes suivantes suivent logiquement. Catégorie:Algorithme Catégorie:Théorie de l'information ja:LZW

Stéganographie

Catégorie:Imagerie numérique Catégorie:Cryptologie Si la cryptographie est l'art du secret, la stéganographie est l'art de la dissimulation : l'objet de la stéganographie n'est pas de rendre un message inintelligible à autre que qui de droit mais de le faire passer inaperçu. Si on utilise le coffre-fort pour symboliser la cryptographie, la stéganographie revient à enterrer son argent dans son jardin. Bien sûr, l'un n'empêche pas l'autre, on peut enterrer son coffre dans son jardin. C'est un mot issu du grec Stéganô, signifiant Je couvre et Graphô, signifiant J'écris. On retrouve une idée de dissimulation dans le nom de la technique.

Histoire

Dans son Enquête, l'historien grec Hérodote (484-445 av. J.-C.) rapporte ainsi une anecdote qui eut lieu au moment de la seconde guerre médique. En 484 avant l'ère chrétienne, Xerxès, fils de Darius, roi des Perses, décide de préparer une armée gigantesque pour envahir la Grèce (Livre VII, 5-19). Quatre ans plus tard, lorsqu'il lance l'offensive, les Grecs sont depuis longtemps au courant de ses intentions. C'est que Démarate, ancien roi de Sparte réfugié auprès de Xerxès, a appris l'existence de ce projet et décide de transmettre l'information à Sparte (Livre VII, 239) : « il prit une tablette double, en gratta la cire, puis écrivit sur le bois même les projets de Xerxès ; ensuite il recouvrit de cire son message : ainsi le porteur d'une tablette vierge ne risquait pas d'ennuis ». Un autre passage de la même œuvre fait également référence à la stéganographie : au paragraphe 35 du livre V, Histiée incite son gendre Aristagoras, gouverneur de Milet, à se révolter contre son roi, Darius, et pour ce faire, « il fit raser la tête de son esclave le plus fidèle, lui tatoua son message sur le crâne et attendit que les cheveux eussent repoussé ; quand la chevelure fut redevenue normale, il fit partir l'esclave pour Milet ». En Chine on écrivait le message sur de la soie, qui ensuite était placée dans une petite boule recouverte de cire. Le messager avalait ensuite cette boule. Dès le , Pline l'Ancien décrit comment réaliser de l'encre invisible. Les enfants de tous les pays s'amusent à le faire en écrivant avec du lait ou du jus de citron : le passage de la feuille écrite sous un fer à repasser chaud révèle le message. Durant la Seconde Guerre mondiale, les agents allemands utilisaient la technique du micropoint de Zapp, qui consiste à réduire la photo d'une page en un point d'un millimètre ou même moins. Ce point est ensuite placé dans un texte normal. Le procédé est évoqué dans une aventure de Blake et Mortimer, SOS météores. Un couple célèbre utilisait l'art de dissimuler un texte dans un texte. George Sand, maîtrisant parfaitement l'écriture, écrivait des poèmes à Alfred de Musset : Je suis très émue de vous dire que j'ai bien compris, l'autre jour, que vous avez toujours une envie folle de me faire danser. Je garde un souvenir de votre baiser et je voudrais que ce soit là une preuve que je puisse être aimée par vous. Je suis prête à vous montrer mon affection toute désintéressée et sans cal- cul. Si vous voulez me voir ainsi dévoiler, sans aucun artifice mon âme toute nue, daignez donc me faire une visite. Et nous causerons en amis et en chemin. Je vous prouverai que je suis la femme sincère capable de vous offrir l'affection la plus profonde et la plus étroite amitié, en un mot, la meilleure amie que vous puissiez rêver. Puisque votre âme est libre, alors que l'abandon où je vis est bien long, bien dur et bien souvent pénible, ami très cher, j'ai le cœur gros, accourez vite et venez me le faire oublier. À l'amour, je veux me sou- mettre entièrement. Votre poupée. A priori, si vous n'avez pas compris que cette lettre en cache une autre, c'est beau, plein de poésie... Maintenant, lisez la première ligne et ensuite une ligne sur deux... Alfred de Musset a répondu ceci : Quand je vous jure, hélas, un éternel hommage Voulez-vous qu'un instant je change de langage Que ne puis-je, avec vous, goûter le vrai bonheur Je vous aime, ô ma belle, et ma plume en délire Couche sur le papier ce que je n'ose dire Avec soin, de mes vers, lisez le premier mot Vous saurez quel remède apporter à mes maux. Maintenant, relire les premiers mots de chaque vers. De la même manière George Sand a répondu ceci : Cette grande faveur que votre ardeur réclame Nuit peut-être à l'honneur mais répond à ma flamme. Un autre couple célèbre d'artistes de music-hall des années 1950, Myr et Myroska communiquait les yeux bandés, en apparence par transmission de pensée, et en réalité par un astucieux procédé stéganographique à base de phrases codées (dont en particulier des variantes de la phrase : « Myroska, êtes-vous avec moi ? »). Le principe alors utilisé est toujours largement repris aujourd'hui, entre autres par Edouard et Sarah réalisant un show télévisé de transmission de pensée.

Méthodes

Supposons, pour notre exemple, que, durant la Seconde Guerre mondiale, une résistante, Alice, doive envoyer tous les jours le nombre de bateaux en rade de Marseille à son correspondant à Paris, Bob. Ils conviennent qu'Alice enverra tous les jours à Bob les prix moyens de divers fruits observés sur le marché de Marseille. Il faut, bien sûr, qu'un agent ennemi, Oscar,
- ne puisse découvrir le contenu caché,
- ne puisse même savoir qu'un contenu est caché,
- ne puisse empêcher la transmission d'un contenu caché éventuel,
- ne puisse envoyer une fausse information en se faisant passer pour Alice.

Création d'un contenu ad hoc

Alice peut envoyer un message contenant : Poires : 0 Cerises : 0 Pommes : 1 Tomates : 3 Courgettes : 2 Bob découvrira qu'il y a, ce jour là, 132 bateaux. La technique informatique citée ci-dessous comme Codage sous forme d'une apparence de spam s'apparente à cette méthode. L'avantage de la méthode est qu'Alice pourra envoyer à Bob une information très longue. Toutefois, la méthode ne peut être utilisée que une seule fois car Oscar pourra rapidement se rendre compte du procédé.

Modifications mineures d'un contenu existant

Alice peut envoyer un message contenant : Poires : 4.00 Cerises : 12.00 Pommes : 5.01 Tomates : 3.23 Courgettes : 10.02 Les techniques informatiques décrites ci-dessous dans les rubriques Usage des bits de poids faible d'une image (LSB) et Modulation fine d'un texte écrit correspondent à cette technique. L'avantage de la méthode est qu'Alice pourra envoyer à Bob une information relativement longue. Toutefois Oscar pourrait comparer les prix transmis avec les prix réels (dans le cas du procédé LSB, faire une comparaison bit à bit), pourrait s'étonner d'une précision superflue, pourrait interdire une trop grande précision (cf. plus bas : stérilisation)

Dissimulation dans un élement annexe au contenu

Alice peut, le lundi, envoyer un message contenant : Poires : 4 Cerises : 12 Pommes : 5 Tomates : 3 Courgettes : 10 et, le mardi, dans un ordre différent (Alice étant fantasque) mais avec des prix parfaitement exacts : Cerises : 11 Poires : 3 Tomates : 3 Pommes : 6 Courgettes : 10 Le contenu réel du message est dissimulé dans la variation de l'ordre des fruits par rapport à l'ordre de la veille. L'inconvénient de la méthode est que le message est relativement limité en taille. Si Alice se limite à 5 fruits, elle peut transmettre chaque jour à Bob une valeur comprise entre 0 et 120 (factorielle de 5). L'avantage réside dans la difficulté pour Oscar de répérer l'existence du procédé stéganographique. Une technique informatique correspondante consiste à maintenir une image intacte mais à y incorporer une table des couleurs ou palette construite dans un ordre qui paraît arbitraire. Le contenu caché peut être une clef donnant accès à un message plus long. En outre, le contenu doit normalement inclure un procédé (généralement un checksum) permettant de vérifier sa validité. L'image qui sert de vecteur à un contenu caché peut être un extrait d'une image connue mais ne peut jamais être sa reproduction exacte, au risque de permettre par comparaison de révéler l'utilisation d'une technique stéganographique.

Contre-mesures

Une société qui désire contrer l'usage de la stéganographie essayera d'empêcher la transmission ou la diffusion de contenus arbitraires, abstraits, interprétables, nuancés, fantaisistes, fantasques, poétiques, etc. Elle imposera le respect de critères formels stricts. Dans l'exemple ci-dessus, elle supprimera l'usage de décimales, imposera un ordre alphabétique, interdira les messages dont le contenu ou la langue ne sont pas compris par un préposé, etc.

Techniques rendues possibles par l'ordinateur

Usage des bits de poids faible d'une image

L'idée est de prendre un message et de le modifier de manière aussi discrète que possible afin d'y dissimuler l'information à transmettre. Le message original est le plus souvent une image. La technique de base --- dite LSB pour Least Significant Bit --- consiste à modifier le bit de poids faible des pixels codant l'image : une image numérique est une suite de points, que l'on appelle pixel, et dont on code la couleur a l'aide d'un triplet d'octets par exemple pour une couleur RGB sur 24 bits. Chaque octet indique l'intensité de la couleur correspondante --- rouge, vert ou bleu (Red Green Blue) --- par un niveau parmi 256. Passer d'un niveau n au niveau immédiatement supérieur (n+1) ou inférieur (n-1) ne modifie que peu la teinte du pixel, or c'est ce que l'on fait en modifiant le bit de poids faible de l'octet.

Exemple

Donnons un exemple, considérons l'image Chaque entrée de ce tableau représente un pixel couleur, nous avons donc une toute petite image 2×2. Chaque triplet de bits (0 ou 1) code la quantité de l'une des trois couleurs primaires du pixel (une image couleur aura dans presque tous les cas des groupes de 8 bits, appelés octets, mais on n'utilise que 3 bits pour clarifier l'exemple). Le bit le plus à droite de chaque triplet est le fameux bit de poids faible --- LSB. Si on souhaite cacher le message 111 111 101 111, l'image est modifiée de la façon suivante le bit de poids faible du i octet est mis à la valeur du i bit du message, ici on obtient : Cette technique de stéganographie très basique s'applique tout particulièrement au format d'image BMP, format sans compression destructive, avec codage des pixels entrelacé sur 3 octets comme énoncé ci-dessus. Réciproquement, tout procédé de compression-décompression d'images avec pertes est susceptible de détruire un message stéganographique codé de cette façon. On parle alors de stérilisation. Un pays totalitaire pourrait stériliser à tout hasard toute image BMP entrant ou sortant de son territoire, moyennant les ressources techniques nécessaires.

Manipulation de la palette de couleurs d'une image


- TODO!

Modulation fine d'un texte écrit

Décaler une lettre de quelques pixels ne pose aucun problème sur une imprimante à laser et est pratiquement invisible à l'œil nu. En jouant sur les interlettrages d'un texte très long et à raison de deux valeurs d'espacement correspondant à 1 et 0, il est possible de transmettre un message sous forme papier, qui ne révèlera son vrai sens qu'une fois analysé par un scanner ayant une bonne précision. Historiquement, le procédé fut utilisé dès les années 70 en utilisant non pas des imprimantes laser, mais des imprimantes à marguerite Diablo, qui permettaient de jouer sur l'espacement des caractères au 1/120 de pouce près.

Codage sous forme d'une apparence de spam

N'importe quel texte de spam peut servir de base à de la stéganographie, sur la base d'un codage binaire simple de quasi synonymes. Par exemple pactole = 1, fortune = 0; richesse = 1, aisance = 0; succès = 1, réussite = 0; etc. Des sites du Web proposent à titre de curiosité ce genre de codage et de décodage. Des textes écrits en langue de bois ou en style administratif se prêtent particulièrement bien à l'exercice.

Autres possibilités

Il est aussi possible de cacher des informations dans bien d'autres types de fichiers couramment échangés sur des réseaux (vidéo, audio) ou bien dans des textes (ce fut une des premières formes de la stéganographie) ou encore dans des zones d'un disque dur inutilisées par le système de fichiers.

Usage

La stéganographie est exploitable dans un bon nombre de domaines. Elle trouve ainsi comme application commerciale le watermarking (apposition de filigranes électroniques), technique permettant de « tatouer » un fichier électronique (pour y introduire notamment des informations utiles à la gestion des droits d'auteur). Il ne faut pas confondre le watermarking, par essence invisible, avec le fait que certains formats de fichiers offrent la possibilité d'inclure des meta-informations...
- TODO! faire un renvoi vers un article qui parlerait des metadata dans les fichiers images. Après les évènements du 11 septembre 2001, on a prétendu que Oussama Ben Laden transmettait ses ordres en les cachant par des procédés stéganographiques dans des images transmises ou hébergées sur internet. Ces suppositions n'ont jamais été étayées par des éléments concrets. Elles sont du même ordre que ...
- TODO! faire un bref compte rendu de la désinformation dans l'affaire "Washington Post v. Zimmerman" (PGP, env. 18/9/2001) Il faut noter que, si la cryptographie, qui permet de protéger la vie privée et l'activité industrielle sans cacher cette protection, est souvent maltraitée par les états totalitaires et les sociétés démocratiques à tendance sécuritaire, il n'en va pas nécessairement de même pour la stéganographie, qui est pourtant une technique beaucoup mieux adaptée à une activité criminelle éventuelle. Le fait que le watermarking soit une technologie utilisable par les sociétés de diffusion médiatique pourrait ne pas être étranger à cette différence.

Outils

Stéganographie


- http://steghide.sourceforge.net/ voir l'article sur Wikipedia

Stegano-analyse


- http://www.outguess.org/

Articles connexes


- acrostiche

Liens externes

http://www.cs.cmu.edu/~dst/DeCSS/Gallery/Stego/ Une liste d'exemples de stéganographie (en anglais)

DCT

ko:이산 코사인 변환 th:การแปลงโคไซน์ไม่ต่อเนื่อง Catégorie:Analyse fonctionnelle Catégorie:Calcul numérique Catégorie:Imagerie numérique La Transformée en cosinus discret ou TCD (de l'anglais : DCT ou Discrete Cosine Transform) est une transformation basée sur la transformée de Fourier discrète.

Applications

La TCD est utilisée en traitement du signal, notamment en compression avec perte. Cette technique est utilisée pour la compression des images JPEG, des vidéos MJPEG, mais aussi dans les animations MNG et les compressions vidéo de type MPEG. Il est à noter que le format JPEG2000 utilise par contre une technique plus avancée de transformée en ondelette discrète (DWT, (wavelet/SPIHT) en anglais). Les formats de compression de son avec perte AAC, Vorbis et MP3 utilisent une version modifiée de cette technique, la transformée en cosinus discret modifiée, TCDM (MDCT en anglais).

Voir aussi


- Transformée de Fourier
- Compression JPEG - DCT appliquée au format JPEG

JPEG 2000

Catégorie:imagerie numérique Catégorie:Format de données numériques Catégorie:Norme ISO JPEG 2000 est une norme commune de l'ISO et de l'UIT-T de compression d'images définie par le comité Joint Photographic Experts Group. JPEG 2000 est capable de travailler avec ou sans pertes, utilisant une transformation par « ondelettes » (méthode d'analyse mathématique du signal). En compression irréversible, JPEG 2000 est plus performante que la méthode de compression JPEG ISO/CEI 10918-1 (le JPEG classique). On obtient donc des fichiers d'un poids inférieur pour une qualité d'image égale. De plus, les contours nets et contrastés sont mieux rendus. Comme le JPEG est dérivé en MJPEG et en MPEG pour la vidéo, un codec MJPEG2000 existe.

Lien externe


- [http://www.jpeg.org/jpeg2000/index.html?langsel=fr Site officiel en francais] Catégorie:format de données numériques Catégorie:imagerie numérique Catégorie:Norme ISO ja:JPEG 2000

Compression fractale

catégorie:fractalecatégorie:algorithmecatégorie:imagecatégorie:image numérique
- La compression fractale est une méthode de compression d’images encore peu utilisée aujourd’hui. Elle repose sur la détection de la récurrence des motifs, et tend à éliminer la redondance d’informations dans l’image.
- La compression fractale est une méthode de compression destructive puisque l'ensemble des données de départ ne se retrouve pas dans l'image finale. Il exite plusieurs méthodes de compression fractale (subdivision de triangles, Delaunay etc.), mais la compression par la méthode Jacquin et la plus connue.

Illustration par la Méthode Jacquin

récurrence
- La compression fractale consiste tout d'abord à réaliser deux segmentations (appelés aussi pavages, ou partitionnements) sur une image : une segmentation de figures Sources et une segmentation de figures Destinations.
- Il s'agit alors de trouver pour chaque figure Source, quel est le meilleur couple (figure source, figure destination) minimisant une erreur. Cette erreur est généralement calculée en soustrayant les deux figures. Pour réaliser l'opération de soustraction, il est nécessaire d'opérer une transformation de la figure source aux dimensions (et à la géométrie) de la figure destination. De plus, des règles comme la rotation et les retournements sont possibles.
- Une fois que tout les couples ont été trouvés, le fichier de sortie contient alors les différents couples, ainsi que les différentes transformations effectuées (rotation, réduction de la moyenne etc.).
- Lors de la décompression, l'image est recréée à partir de ces transformations. La convergence est alors garantie par le faite que d'une part il y a une minimisation d'erreur (différence) et une modification des pixels, et d'autre part, que les figures sources sont plus grandes que les figures destinations. La compression fractale utilise la même propriété pour reconstruire l'image.

Algorithme générique de compression

Image:Algo compression fractale.jpg

Algorithme générique de décompression

Image:Algo decompression fractale.jpg

Partitionnements

Le partitionnement est l’opération qui consiste à segmenter une image en régions. Dans la compression par la méthode Jacquin, nous avons besoin de 2 partitionnements : Source et Destination. La méthode Jacquin utilise par exemple des figures carrées, mais d'autres formes sont possibles (nids d'abeilles, triangles etc). Image:Algo decompression fractale.jpg]
- Un point essentiel dans les partitionnements Source et Destination est que le pavage destination doit être plus petit que le pavage source. En effet, dans le cas contraire, nous serions amenés à faire un agrandissement (et non une réduction) lors de la transposition des figures sources vers les figures destinations. Une fractale possède un motif se répétant à l’infini, en se rétrécissant. Aussi, nous perdons cette propriété si le partitionnement destination est plus grand que le partitionnement source, l’image ne pourra alors pas converger. Image:Algo decompression fractale.jpg
- Le partitionnement par la méthode Jacquin est un partitionnement statique. L'utilisation d'un partitionnement adaptatif (qui dépend de l'image à traiter) améliore considérablement le facteur de compression.

Décompression


- Voici quelques images résultantes de la compression Jacquin, sur quatre itérations : Image:Algo decompression fractale.jpg
- Avec un partitionnement adaptatif triangulaire : Image:Algo decompression fractale.jpg

Liens internes


- Fractale
- Compression de données

Liens externes


- [http://webfractales.free.fr/rapport.php?see=16 Documentation et logiciel]
- [http://www.eurecom.fr/~image/DEMOS/FRACTAL/ Animation Java]
- [http://www.kaddour.com/ Triangulation De Delaunay]

7z

Format d'archivage, (d'extension .7z) qui a une architecture ouverte et qui peut ainsi supporter n'importe quelle nouvelle méthode de compression. L'algorithme de compression LZMA, qui permet la création d'archives plus compactes que les formats ZIP, RAR, ACE, etc. est la méthode de compression générale par défaut du format 7z. C'est le format de compression par défaut du logiciel 7-Zip.

Liens externes

[http://www.7-zip.org/ Site officiel de 7-zip] Catégorie:format de données numériques

LZW

Définition

LZW (pour Lempel-Ziv-Welch) est un algorithme de compression de données. Il s'agit d'une amélioration des algorithmes LZ77 (1977) et LZ78 (1978), tous les deux écrits par Abraham Lempel et Jacob Ziv. LZW fut créé en 1984 par Terry Welch, d'où son nom. L'algorithme LZW a été breveté par la société Unisys. Il a été utilisé dans les modems (norme V42 bis) et est encore utilisé dans le format d'image numérique GIF.

Principe

Cet algorithme est appelé « à dictionnaire », car il se base sur la répétition de chaînes de caractères dans un même flux. Les fenêtres coulissantes de LZ77 et LZ78 ont elles disparues, remplacées par un tampon, mais le dictionnaire est lui toujours présent. Ce dernier se chargera d'enregistrer les chaînes de caractères rencontrées et de leur associer un indice. Tout d'abord on initialise le dictionnaire en donnant au code '0' l'indice 1, le code '1' l'indice 2.....etc jusqu'à '255' (ce qui correspond aux 256 valeurs différentes que peut prendre un octet). L'indice 0 sera reservé pour un usage ultérieur. On charge un premier caractère dans le tampon. La compression se passe alors comme suit : 1) On charge un nouveau caractère dans le tampon sans effacer les précédents 2) On recherche si la chaîne de caractères présente dans le tampon est présente dans le dictionnaire. Si elle l'est, on retourne à l'étape 1). Si elle ne l'est pas, on la rajoute dans le dictionnaire avec un nouvel indice et l'on émet la séquence allant du début du tampon jusqu'à l'avant-dernier caractère inclus, on supprime les caractères émis, et l'on retourne à l'étape 1). Notons que les codes binaires sont tout d'abord généralement émis sur 8 bits, jusqu'à ce que ces 8 bits ne suffisent plus à coder l'indice que l'on désire(par exemple l'indice 256, qu'il est nécessaire de coder sur 9 bits). On émet alors l'indice 0 pour signifier que l'on augmente le nombre de bits émis de 1. Prenons un exemple. Supposons que la phrase à coder soit « repetition ». À chaque lettre est associé son code ASCII. Le dictionnaire est inititialisé et associe l'indice 1 au code '0', l'indice 2 au code '1'.....etc jusqu'à l'indice 256 qui correspond au code '255'. ETAPE TAMPON EMIS RAJOUT AU DICTIONNAIRE 1 '114'+'101' '115' 257 : '114'+'101' 2 '101'+'112' '102' 258 : '101'+'112' 3 '112'+'101' '113' 259 : '112'+'101' 4 '101'+'116' '102' 260 : '101'+'116' 5 '116'+'105' '117' 261 : '116'+'105' 6 '105'+'116' '106' 262 : '105'+'116' 7 '116'+'105' '0' 8 '116'+'105'+'111' '261' 263 : '116'+'105'+'111' 9 '111'+'110' '112' 264 : '111'+'110' 10 '110' '111' Au début de la compression, les codes binaires seront émis sur 8 bits. À l'étape 1), on charge dans le tampon les 2 premiers caractères. Cette suite n'est pas présente dans le dictionnaire, donc on la rajoute. On émet ensuite sur 8 bits le code '115' (car le code '114' à pour indice '115' dans le dictionnaire) et l'on supprime du tampon les caractères émis. À l'étape 2), un charge un nouveau caractère dans le tampon et comme cette chaîne n'est pas présente, on la rajoute au dictionnaire. Puis on émet le code '102' que l'on supprime ensuite du tampon. Les étapes suivantes fonctionnent sur le même principe. Arrivé à l'étape 7), la chaîne '116'+'105' étant déjà présente dans le dictionnaire (indice 261), on émet le code '0' car 261 ne peut se coder sur 8 bits, il nécessite un minumum de 9 bits. Les codes émis seront donc désormais émis sur 9 bits. À l'étape 8), on charge un nouveau caractère dans le tampon. La chaîne n'est pas présente dans le dictionnaire, donc on la rajoute. On émet ensuite l'indice de la chaîne '116'+'105' (261) et on la supprime du dictionnaire. Les étapes suivantes suivent logiquement. Catégorie:Algorithme Catégorie:Théorie de l'information ja:LZW

Gzip

Gzip, pour GNU zip, est un logiciel libre, utilitaire de compression, qui a été créé pour remplacer le programme compress d'Unix. Gzip est basé sur l'algorithme deflate, qui est une combinaison des algorithmes LZ77 et Huffman. 'Deflate' a été développé en réponse à des problèmes de brevet couvrant LZW et autres algorithmes de compression, limitant ainsi les utilisations possibles de compress et autres programmes d'archivage populaires. De manière à simplifier les développements de logiciels utilisant la compression, la bibliothèque zlib a été créée. Elle supporte le format de fichier gzip et l'algorithme de compression deflate. Cette bibliothèque est très largement utilisée, grâce à sa taille réduite, son efficacité et sa souplesse d'utilisation. Gzip comme zlib ont été écrits par Jean-Loup Gailly et Mark Adler. Depuis la fin des années 90, bzip2 prend le relais puisqu'il produit des fichiers considérablement plus petits. Le format de donnée compressée zlib, l'algorithme deflate et le format de fichier compressé Gzip ont été standardisés avec les RFC 1950, RFC 1951 et RFC 1952. L'extension usuelle des fichiers « gzipé » est « .gz ». Les logiciels UNIX sont souvent distribués avec des fichiers terminés par .tar.gz ou .tgz, appelés tarball. Ce sont des fichiers archivés avec tar et ensuite compressés avec gzip. Ils peuvent être décompressés avec gzip -d file.tar.gz ou décompactés avec tar xzf file.tar.gz. De nos jours, de plus en plus de logiciels sont distribués à la place en archives .tar.bz2 parce que bzip2 permet de meilleurs taux de compression que gzip, et ce malgré un temps de compression plus long. AdvanceCOMP implémente une compression deflate au format gzip qui fournit des taux de compressions encore meilleurs que gzip.

Liens externes


- [http://www.gzip.org/ Site officiel]
  - [http://www.gzip.org/index-f.html En français]
- [http://www.gnu.org/software/gzip/gzip.html Page sur gnu.org] Catégorie:GNU ja:Gzip

Zip

ja:ZIP (ファイルフォーマット)

Outil informatique

Format de compression

Le ZIP est, en informatique, un format de fichier permettant la compression de données. Le format a été inventé par Phil Katz pour le logiciel PKZIP. Le format a été créé en réponse à un problème de droits entre le programme PKARC et le format ARC lancé par la Software Enhancement Associates. ARC est vendu en tant que partagiciel principalement aux utilisateurs de BBS afin qu'ils puissent compresser leurs fichiers plus rapidement. Katz décida de cesser le développement de PKARC et décrivit son propre format PKZIP utilisant l'extension de fichier .ZIP.

Stockage de données

Les disquettes Zip sont des disquettes épaisses crées par la société Iomega, lisibles par un lecteur spécial (lecteur Zip). D'une capacité de stockage de 100 Mo puis de 250 Mo, puis de 750 Mo, elles ont constitué un intermédiaire intéressant entre les disquette de 90 mm (3 pouces et demi) de 1,44 Mo, et les CD-ROM réinscriptibles. Cependant, le prix du support, la lenteur et le manque de fiabilité de ces lecteurs, associé à l'apparition des clés USB ne lui ont pas permis de s'imposer comme l'avait fait le lecteur de disquette 3 pouces et demi à son époque.

Système de fermeture

Le terme zip désigne également un système de fermeture mécanique pour les vêtements (fermeture à glissière), couramment appelé en France fermeture Éclair, du nom d'un des premiers fabricants de ce système. Catégorie:format de données numériques

RLE

Catégorie:Sigle
- RLE = Run-length encoding, algorithme de compression de données en informatique ;
- RLE = Réseau local d'entreprise (LAN en anglais), un type de réseau informatique.

Wavpack

Brève description

WavPack est un format de fichier ainsi qu'un outil de compression audio permettant d'encoder (et de restaurer) un flux PCM sans perte ou avec pertes et même d'en cumuler les deux aspects (format hybride, voir ci-dessous). Le format et libre (licence BSD) et open-source.

Lossless, lossy, hybride

WavPack est constitué de trois modes d'encodages.
- Le mode dit « sans perte » (couramment désigné par l'anglicisme lossless) utilise des techniques similaires à celles utilisées par des encodeurs généralistes tels que Zip ou 7z. Sa finalité réside dans la compression de données. Ce mode d'encodage présente pour intérêt majeur de n'occasionner aucune espèce de dégradation des données : une fois décodé, le flux audionumérique est rigoureusement identique à celui précédent l'encodage. Appliquées à l'audio, ces techniques de compression sans perte se révèlent donc idéales pour tous les travaux scientifiques (généalogie, océanologie...) ou ceux concernant l'archivage ; l'encodage sans perte est également prisé pour une utilisation audiophile très stricte. En contrepartie, le taux de compression atteint est plus faible que celui obtenu par des encodeurs de type « avec pertes » (lossy) tels que le MP3. De manière générale, l'encodage avec WavPack permet de réduire de moitié le volume original du fichier source. Ces performances peuvent atteindre 80% avec des fichiers plus compressibles (fichiers monophoniques, ou ceux présentant un spectre sonore tronqué) et peuvent descendre à 20% à peine de la taille d'origine pour les cas les plus extrêmes.
- Le mode dit « avec pertes » (l'anglicisme lossy est fréquemment employé) est une caractéristique originale de WavPack. Le mode permet à l'utilisateur de spécifier le débit d'encodage et par conséquent de prévoir la taille finale, qui est par nature imprédictible en lossless. Ce mode d'encodage peut être rapproché du MP3 en ce qu'il occasionne une dégradation irrémédiable du signal. Toutefois, WavPack lossy s'en démarque d'un point de vue technique, car il n'exploite pas la plupart des ressources utilisées par les encodeurs perceptuels (MP3, WMA, Vorbis, AAC...) traditionnels, se rapprochant davantage d'encodeurs reposant sur la pure quantifica