Visioconférence: le zoo des normes


Née dans le monde des télécommunications, la visioconférence a investi celui de l'Internet. Elle définit les bases de l'architecture en trois couches qui sera utilisée plus tard dans le media streaming:

 - un codec (compresseur/décompresseur) audio et un codec vidéo.
 - un packetiser (formattage des données) audio et un packetiser vidéo.
 - un protocole de transport et de signalisation.

Commençons par visiter le zoo des normes.


Les normes ITU

L'ITU (International Telecommunication Union) est l'organisme normalisateur qui a établi les standards pour la visioconférence. Les deux séries qui nous concernent, G et H, sont accessibles respectivement ici:

http://www.itu.int/rec/recommendation.asp?type=products&parent=T-REC-g
http://www.itu.int/rec/recommendation.asp?type=products&parent=T-REC-h

Cependant, pour des raisons qui nous échappent, leur lecture est réservée aux abonnés.

Les normes "chapeau": H.320, H.321, H.323


H.320 - Narrow-band visual telephone systems and terminal equipment
H.321 - Adaptation of H.320 visual telephone terminals to B-ISDN environments
H.323 - Packet-based multimedia communications systems

H.320 est une norme adaptée aux télécommunications (lignes téléphoniques).
H.321 l'adapte au réseau de téléphonie numérique ISDN (RNIS en France).
H.323 aux réseaux locaux type Ethernet.

On trouvera des commentaires ici:

http://www.ktln.com/Technical/h320.htm
http://www.ktln.com/Technical/h323.htm

Les normes "video": H.261, H.263


H.261 - Video codec for audiovisual services at p x 64 kbit/s
H.263 - Video coding for low bit rate communication

H.261 vise le RNIS (s'assemble donc avec H.321).
H.263 l'adapte aux bas débits (POTS).

On trouvera une étude de Peter Cherriman accompagnée d'exemples ici:

http://www-mobile.ecs.soton.ac.uk/peter/publications/iccs96-abstract.html
http://www-mobile.ecs.soton.ac.uk/peter/h261/h261.html
http://www-mobile.ecs.soton.ac.uk/peter/h263/h263.html

Les normes "audio": G.711, G.721, G.722, G.726 à G.729


G.711 - Pulse code modulation (PCM) of voice frequencies
G.721 - 32 kbit/s adaptive differential pulse code modulation (ADPCM)
G.722 - 7 kHz audio-coding within 64 kbit/s
G.722.1 - Coding at 24 and 32 kbit/s for hands-free operation in systems with low frame loss
G.722.2 - Wideband coding of speech at around 16 kbit/s using adaptive multi-rate wideband (AMR-WB)
G.726 - 40, 32, 24, 16 kbit/s adaptive differential pulse code modulation (ADPCM)
G.727 - 5-, 4-, 3- and 2-bit/sample embedded adaptive differential pulse code modulation (ADPCM)
G.728 - Coding of speech at 16 kbit/s using low-delay code excited linear prediction
G.729 - Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear-prediction (CS-ACELP)

Les normes "transport": H.221 à H.245


H.221 - Frame structure for a 64 to 1920 kbit/s channel in audiovisual teleservices
H.222 - Frame structure for 384-1920 kbit/s channels in audiovisual teleservices
H.223 - Multiplexing protocol for low bit rate multimedia communication
H.224 - A real time control protocol for simplex applications using the H.221 LSD/HSD/HLP channels
H.225 - Call signalling protocols and media stream packetization for packet-based multimedia communication systems
H.226 - Channel aggregation protocol for multilink operation on circuit-switched networks
H.230 - Frame-synchronous control and indication signals for audiovisual systems
H.231 - Multipoint control units for audiovisual systems using digital channels up to 1920 kbit/s
H.242 - System for establishing communication between audiovisual terminals using digital channels up to 2 Mbit/s
H.243 - Procedures for establishing communication between three or more audiovisual terminals using digital channels up to 1920 kbit/s
H.244 - Synchronized aggregation of multiple 64 or 56 kbit/s channels
H.245 - Control protocol for multimedia communication

Les deux normes importantes sont H.225 et H.245.
H.225 décrit le format des media audio/video, le packetiseur (découpage) et leur synchronisation.
H.245 décrit l'ouverture et la fermeture des canaux pour les medias et la negociation des formats.
Lors du passage Internet, elles seront transposées en normes IETF.

Les formats standards: CIF

Il s'agit tout simplement d'abbréviations pour les dimensions d'image couramment utilisées. Ces valeurs optimisent certains des algorithmes de compression/décompression.

CIF: Common Interchange Format (352 x 288)
QCIF: Quarter CIF (176 x 144)
SQCIF: Sub quarter CIF (128 x 96)
4CIF: 4 x CIF (704 x 576)
16CIF: 16 x CIF (1408 x 1152)

Le mécano ITU

Les normes "chapeau" ("umbrella") sont des assemblages de normes de niveau inférieur. Ainsi,

H.320-1 = H.261 (QCIF 7.5fps) + G.711
H.320-3 = H.261 (CIF 30fps) + G.711 ou 722 ou 728
H.323 = H.261 ou 263 + G.711 ou 722, 723, 728, 729

Le tableau suivant (tiré de http://www.ktln.com/Technical/pdfs/h323-2.pdf) résume ce mécano. Les normes T concernent le partage d'informations non audio-visuelles (applications du type whiteboard).

  ISDN EthernetPOTS ATM Iso-Ethernet
  (H.320) (H.323) (H.324) (H.321) (H.322)
Video H.261 H.261 H.261 H.261 H.261
    H.263 H.263    
Audio G.711 G.711 G.723 G.711 G.711
  G.722 G.722   G.728 G.722
  G.728 G.728     G.723
    G.729     G.728
    G.728      
Data T.120 T.120 T.120 T.120 T.120
      T.434    
      T.84    
Multiplex H.221 H.225 H.223 H.221 H.221
Signaling H.230 H.230 H.245 H.230 H.230
  H.242 H.242   H.242 H.242
Multipoint H.243 N/A N/A H.243 H.243

Les normes IETF

L'IETF (Internet Engineering Task Force) agit de son côté sur Internet. Il n'entre donc pas dans sa mission de se préoccuper du codage/décodage des informations audio-visuelles (codecs). Par contre, il prend le relais de l'ITU lorsqu'il s'agit de transporter ces données sur un réseau IP.

Deux lots de RFC distinctes prennent le relais de la série H.221-H.245 de l'ITU. Le premier est le "vieux" (1996) protocole RTP destiné au transport de données temps-réel. Le second est l'ensemble session SIP (1999), équivalent de ce qu'on appelle "signalisation" en téléphonie.

Les normes "protcocole" et "payload": RTP


rfc1889 - RTP: A Transport Protocol for Real-Time Applications.
rfc2032 - RTP Payload Format for H.261 Video Streams.
rfc2190 - RTP Payload Format for H.263 Video Streams.
rfc2429 - RTP Payload Format for the 1998 Version of ITU-T Rec. H.263 Video
rfc3047 - RTP Payload Format for ITU-T Recommendation G.722.1.

Les normes "session": SIP


rfc2543 - SIP: Session Initiation Protocol.
rfc2848 - The PINT Service Protocol: Extensions to SIP and SDP for IP.
rfc2976 - The SIP INFO Method.
rfc3050 - Common Gateway Interface for SIP.
rfc3087 - Control of Service Context using SIP Request-URI.
rfc3104 - RSIP Support for End-to-end IPsec.
rfc3105 - Finding an RSIP Server with SLP.
rfc3219 - Telephony Routing over IP (TRIP).

Ce double héritage, riche à l'indigestion, est celui qui compose la visioconférence sur Internet aujourd'hui. Le passage du monde des télécommunications à celui des réseaux IP a exigé la transposition des nomes conçues pour les circuits commutés (ITU) vers d'autres conçues pour les réseaux à commutation de paquet (IETF). Cette transposition entre des concepts souvent non superposables a produit un résultat lourd et par endroits ambigu.

En particulier, la transposition à TCP/IP de H.225 (et son protocole Q.931) et H.245 pour ouvrir la session et négocier les canaux de transmission et capacités des terminaux, est source d'incompatibilités et interfère sérieusement avec les architectures orientées vers la sécurité (pare-feus, translation d'adresse).

Il est assez probable que nous vivions une situation intérimaire avant que la visioconférence et autres applications collaboratives ne soient totalementharmonisées avec l'architecture TCP/IP. SIP pourrait être un pas dans cette voie.


[Index] [Ecrire à l'auteur]