Voipn
Voipn
Voipn
Introduction
La voix sur IP (Internet Protocol) constitue actuellement une évolution très importante
dans le domaine des Télécommunications. Avant 1970, la transmission de la voix
s’effectuait de façon analogique sur des réseaux dédiés à la téléphonie, la technologie utilisée
était la technologie électromécanique (Crossbar). Dans les années 80, une premiére
évolution a été le passage à la transmission numérique TDM (Time Division Multiplexing).
La transmission de la voix sur les réseaux informatiques à commutation de paquets IP
constitue aujourd’hui une évolution majeure comparable aux précédentes.
Définition
VoIP signifie Voice over Internet Protocol ou Voix sur IP. Comme son nom l’indique, la
VoIP permet de transmettre du son (en particulier la voix) dans des paquets IP circulant sur
Internet[1].
Architecture
Etant une nouvelle téchnologie de communication, la VoIP n’a pas encore de standard
unique. En effet, chaque constructeur apporte ses normes et ses fonctionnalités à ses so-
lutions. Les trois principaux protocoles sont H.323, SIP (Session Initiation Protocol) et
MGCP/MEGACO. Il existe donc plusieurs approches pour offrir des services de télépho-
nie et de visiophonie sur des réseaux IP.
Figure 1.1 – Architecture générale de la voix sur IP[1].
La figure 1.1 décrit, de façon générale, la topologie d’un réseau de téléphonie IP. Elle
comprend toujours des terminaux, un serveur de communication et une passerelle vers les
autres réseaux. Chaque norme a ensuite ses propres caractéristiques, pour garantir une plus
ou moins grande qualité de service. Le réseau est aussi déportée soit sur les terminaux, soit
sur les passerelles/contrôleur de commutation, appelées Gatekeeper. Nous retrouvons les
éléments communs suivants :
• Le routeur : Permet d’aiguiller les données et de router les paquets entre deux
réseaux. Certains routeurs permettent de simuler un Gatekeeper, grâce à l’ajout de
cartes spécialisées supportant les protocoles VoIP.
• La passerelle : Permet d’interfacer le réseau commuté et le réseau IP.
• Le PABX : Est le commutateur du réseau téléphonique classique. Il permet de faire
le lien entre la passerelle ou le routeur, et le RTC (Réseau Téléphonique Commuté).
Toutefois, si tout le réseau devient IP, ce matériel devient obsolète.
• Les Terminaux : Sont généralement de type logiciel (software phone) ou
matériel (hardphone), le softphone est installé dans le PC de l’utilisateur.
L’interface audio peut être un microphone et des haut-parleurs branchés sur la carte
son, même si un casque est recommandé.
• Le hardphone : est un téléphone IP qui utilise la technologie de la Voix sur IP, pour
permettre des appels téléphoniques sur un réseau IP, tel que l’Internet, au lieu de l’ordinaire
système PSTN (Public Switched Telephone Network). Les appels peuvent parcourir par le
réseau internet comme par un réseau privé. Un terminal utilise des protocoles comme le SIP
ou l’un des protocoles propriétaires tel que celui utilisée par Skype[1].
Principe de fonctionnement
Depuis de nombreuses années, il était possible de transmettre un signal à une destination
éloignée sous forme de données numériques. Avant la transmission, il faut numériser le
signal à l’aide d’un CODEC (Codeur Décodeur), le signal est ensuite transmis. Pour être
utilisable, il doit être transformé de nouveau en un signal analogique.
La VoIP fonctionne par numérisation de la voix, puis par reconversion des paquets
numériques en voix à l’arrivée. Le format numérique est plus facile à contrôler, il peut être
compressé, routé et converti en un nouveau format de meilleure qualité. Le signal numérique
est plus tolérant au bruit que l’analogique.
Les réseaux TCP/IP sont des supports de circulation de paquets IP, contenant un en-
tête (pour contrôler la communication) et une charge utile, pour transporter les données. Il
existe plusieurs protocoles qui peuvent supporter la voix sur IP tel que : H.323, SIP et
MGCP.
Les deux protocoles les plus utilisés actuellement dans les solutions VoIP présents
sur le marché sont le H.323 et le SIP[2].
2 Protocole H.323
• Les messages de signalisation sont ceux envoyés pour demander la mise en relation
de deux clients, qui indique que la ligne est occupée ou que le téléphone sonne, etc.
Avec H.323, la signalisation s’appuie sur le protocole RAS
(Registration/Admission/Status) pour l’enregistrement et l’authentification, et le
protocole Q.931 pour l’initialisation et le contrôle d’appel.
• La négociation est utilisée pour se mettre d’accord sur la façon de coder les
informations à échanger. Il est important que les téléphones (ou systèmes) utilisent
un langage commun s’ils veulent se comprendre. Il s’agit du codec le moins gourmand
en bande passante ou de celui qui offre la meilleure qualité. Il serait aussi préférable
d’avoir plusieurs alternatives de langages. Le protocole utilise pour la négociation de
codec est le H.245.
• Gateway ou les passerelles vers des réseaux classiques (RTC, RNIS, etc.) :
Les passerelles H.323 assurent l’interconnexion avec les autres réseaux, ex : les
modems H.324, les téléphones classiques, etc. Elles assurent la correspondance de
signalisation de Q.931, la correspondance des signaux de contrôle et la cohésion entre
les medias (multiplexage, correspondance des débits, transcodage audio).
• Les MCU (Multipoint Control Unit) : Les contrôleurs multipoint appelés MCU
offrent aux utilisateurs la possibilité de faire des visioconférences à trois terminaux et
plus en « présence continue » ou en « activation à la voix ». Une MCU consiste en un
Contrôleur Multipoint (MC), auquel est rajouté un ou plusieurs Processeurs Multipoints
(MP). Le MC prend en charge les négociations H.245 entre tous les terminaux pour
harmoniser les paramètres audio et vidéo de chacun. Il contrôle également les ressources
utilisées. Mais le MC ne traite pas directement avec les flux audio, vidéo ou données,
c’est le MP qui se charge de récupérer les flux et de leurs faire subir les traitements
nécessaires. Un MC peut contrôler plusieurs MP distribués sur le réseau et faisant partie
d’autres MCU[3].
3 Protocole SIP
• Différents modes de communication : Avec SIP, les utilisateurs qui ouvrent une
session peuvent communiquer en mode point à point, en mode diffusif ou dans un mode
combinant ceux-ci.
Gestion des participants : Durant une session d’appel, de nouveaux participants peuvent
joindre les participants d’une session déjà ouverte en participant directement, en étant
transférés ou en étant mis en attente (cette particularité rejoint les fonctionnalités d’un
PABX par exemple, où l’appelant peut être transféré vers un numéro donné ou être mis en
attente).
Adressage : Les utilisateurs disposant d’un numéro (compte) SIP, disposent d’une
adresse ressemblant à une adresse mail (sip :numéro@serveursip.com). Le numéro SIP est
unique pour chaque utilisateur.
Codes d’erreurs : Une réponse à une requête est caractérisée, par un code et un motif,
appelés respectivement code d’état et raison phrase. Un code d’état est un entier codé sur
3 digits indiquant un résultat à l’issue de la réception d’une requête. Ce résultat est précisé
par une phrase, textbased (UTF-8), expliquant le motif du refus ou de l’acceptation de la
requête. Le code d’état est donc destiné à l’automate gérant l’établissement des sessions
SIP et les motifs aux programmeurs. Il existe 6 classes de réponses et donc de codes d’état,
représentées par le premier digit :
L’UAS (User Agent Server) : Représente l’agent de la partie appelée. C’est une
application de type serveur qui contacte l’utilisateur lorsqu’une requête SIP est reçue, elle
renvoie une réponse au nom de l’utilisateur.
Le Registrar : Est un serveur qui gère les requêtes REGISTER envoyées par les
Users Agents pour signaler leur emplacement courant. Ces requêtes contiennent donc une
adresse IP, associée à une URI, qui seront stockées dans une base de données (figure 1.4).
Les URI SIP : Sont très similaires dans leur forme à des adresses email sip :utili-
sateur@domaine.com. Généralement, des mécanismes d’authentification permettent d’éviter
que quiconque puisse s’enregistrer avec n’importe quelle URI.
Figure 1.4 – Enregistrement d’un utilisateur[5].
Un Proxy SIP sert d’intermédiaire entre deux User Agents, qui ne connaissent pas leurs
emplacements respectifs (adresse IP). En effet, l’association URI-Adresse IP a été stockée
préalablement dans une base de données par un Registrar. Le Proxy peut donc interroger
cette base de données pour diriger les messages vers le destinataire. La figure 1.5 montre les
étapes de l’interrogation du proxy la base de données.
Le Proxy se contente de relayer uniquement les messages SIP pour établir, contrôler et
terminer la session (voir figure 1.6). Une fois la session établie, les données, par exemple
un flux RTP pour la VoIP, ne transitent pas par le serveur Proxy. Elles sont échangées
directement entre les User Agents.
Avantages et inconvénients
Les principaux avantages du protocole SIP [5][6] sont :
• Ouvert : Les protocoles et documents officiels sont détaillés et accessibles à tous en
téléchargement.
• Standard : L’IETF a normalisé le protocole et son évolution continue par la création
ou l’évolution d’autres protocoles qui fonctionnent avec SIP.
• Simple : SIP est simple et très similaire à http.
• Flexible : SIP est également utilisé pour tout type de sessions multimédia (voix,
vidéo, mais aussi musique, réalité virtuelle, etc.).
• Téléphonie sur réseaux publics : Il existe de nombreuses passerelles (services
payants) vers le réseau public de téléphonie (RTC, GSM, etc.) permettant d’émettre
ou de recevoir des appels vocaux.
• Points communs avec H323 : L’utilisation du protocole RTP et quelques codecs
son et vidéo sont en commun.
4 Protocoles de transport
Nous décrivons deux autres protocoles de transport utilisés dans la voix sur IP, à
savoir RTP et le RTCP [7].