Natureza da operação SIP
Já vimos no capítulo anterior que a telefonia NGN baseada em SIP e mesmo mecanismos afins, requer para sua operação uma estrutura de dados e componentes estáveis e leves. Por este motivo a maioria dos sistemas trabalha sobre protocolo de rede UDP. Por ser mais leve, este protocolo facilita a criação de redes de altíssima capacidade, porém trazem a necessidade de implantar-se na camada de SW (SIP) os mecanismos de confirmação de entrega de sinalização.
Estes mecanismos, definidos pela IETF, garantem a correta troca de mensagens de forma correta entre dois ou mais elementos envolvidos no estabelecimento de uma sessão de comunicação.
No entanto veremos que a qualidade da rede de dados utilizada, de alguns componentes ativos e passivos (tanto quanto sua capacidade quanto na sua observação às normas da IETF) e ainda a qualidade de tráfego tratada na rede de uma operadoras, poderá trazer impactos negativos em sua operação. Esta seção tem por objetivo apontar os principais problemas enfrentados na operação, suas consequências, mecanismos de mitigação e formas de analise de problemas.
Operação B2B vs Proxy
Há dois modelos básicos para a arquitetura dos sistemas softswitch de telefonia NGS. O Modelos B2BUA e o modelo proxy.
Arquitetura B2B
No primeiro modelo, o softswicth faz a conversão da troca de mensagens entre origem e destino. Isto é, tomando como base a figura abaixo, onde a origem a busca estabelecer comunicação com o destino B, o elemento softswitch fará a troca de sinalização, encaminhada por cada parte, gerando um novo conjunto que será enviado à outra parte.
Enquanto este processo tende a reduzir, mas não eliminar, problemas de sinalização, como erros, perda de trechos da sinalização e outros, o sistema tem significativa perda de desempenho considerando que para cada chamada terá que processar duas vezes a sinalização.
Os sistemas baseados na arquitetura B2B tipicamente incluem também a passagem da midia pelo softswitch central, o que consome recursos de banda e de processamento.
Consequentemente, por ter capacidade de processamento limitada, ao experimentar aumento da demanda o sistema adota comportamento instável, podendo se tornar um dos agentes causadores de problemas de sinalização.
Já na arquitetura Proxy, o softswitch repassa toda a sinalização recebida de um lado, para o outro encaminhar fazendo apenas o tratamento de roteamento e coleta de dados para bilhetagem e tarifação.
Neste modelo, é imprescindível que a sinalização tratada esteja correto e não haja perdas de comunicação ou de qualidade da rede.
Por características, o modelo proxy suporta volume consideravelmente maior de transações e reduz significativamente a demanda de banda rede (ao não exigir o tratamento centralizado da midia.
Este modelo no entanto exige gestão mais apura da infraestrutura e ações tempestivas para correção de falhas (evitando sua propagação). Ainda assim este modelo é economicamente mais eficaz e eficiente e quando bem monitorado, mais estável na qualidade de serviços. Caracteristicas operacionais da arquitetura B2B podem ser incorporadas na operação Proxy. Ao passo que o inverso não é verdadeiro.
A seguir discorreremos sobre os principais eventos adversos enfrentados pela operação de telefonia, como mitiga-los e como analisa-los.
Avalie constantemente este site, uma vez que sempre que detectarmos eventos recorrentes, adicionaremos informações uteis para que possam gerenciá-los de forma eficienteEnquanto seria ideal construirmos um ambiente operacional livre de falhas, dada a natureza operacional dos sistemas de telefonia NGN, a existência de eventos irregulares é inexorável. Porém muitos dos eventos podem ser prevenidos ou, na impossibilidade de tal, serem mitigados.
O principal objetivo das áreas operacionais de prestadoras de serviços deve ser o de implantar um ambiente mais resiliente possível, e dotar-se de condições técnicas e funcionais para monitorar o ambiente e assim, na ocorrência de um evento irregular, identificar a origem e sanar de forma tempestiva, evitando a propagação de suas consequências.
Por envolver uma série de componentes na operação de telefonia IP, a SIPPulse entende que a identificação da causa raiz, ou causas, de eventos irregulares na operação de telefonia pode envolver a análise de diversos componentes. É comum que a análise, quando não estruturada, aponte para o componente errado e por isso sua resolução tende a ser retardada prejudicando a operação do cliente.
Sendo o ponto central de operação dos serviços, normalmente os eventos são observados pelo cliente e seus usuários na plataforma central (softswitch), o que não significa que estes sejam a causa dos mesmos. Por outro lado, a análise do evento será mais efetiva a partir de uma analise holística dos eventos. Assim o objetivo deste manual é dotar às operadoras e empresas usuárias das plataformas SIPPulse de recursos de avaliação de eventos anormais que provoquem perda de qualidade de serviços, ou mesmo que tragam impactos negativos na conciliação de serviços entre operadoras. Com a correta avaliação dos eventos será possível à equipe operacional do cliente agir sobre a causa raiz do problema. Com a imediata ação de correção necessária.
Para orientar nossos clientes, discorreremos sobre os principais eventos irregulares enfrentados no dia a dia de operação de telefonia NGN, as melhores práticas pada identificação da origem (troubleshooting) e formas de mitigação dos problemas:
Este sessão apresentará aos usuários da plataforma Softswicth PCRT
- Visão das principais causas de eventos irregulares,
- Ações diretas e indiretas para reduzir a incidência de eventos irregulares,
- Ações para mitigar o impacto dos eventos irregulares,
- Análise de eventos irregulares.
Os principais eventos irregulares que afetam a eficaz utilização de nossos problemas são:
- Problemas com chamadas presas
- Chamadas sem mídia
- Desconexão antecipada de chamadas
- Qualidade de áudio
Alguns problemas acima, além de acarretar perda de qualidade na percepção dos serviços, podem gerar ainda:
- Problemas com bilhetagem (consequência direta de chamadas presas).
Considerando a impossibilidade de de eliminar todos os problemas, a SIPPulse recomenda o estabelecimento de processos de análise de eventos estruturados de modo a permitir a analise de possibilidades múltiplas para apontar corretamente a origem de falhas operacionais.
Tais processos são importantes pois eventos irregulares podem ter origem em elementos não controlados. especialmente onde a origem dos problemas podem inclusive sair de controle da operação do cliente,
As figuras abaixo mostram claramente a complexidade envolvida na análise. Neste exemplo, real, uma chamada do Terminal A (TA), cliente da Operadora A (OA) para o Terminal B (TB), acarretou uma chamada presa em OA, gerando discrepância de bilhetagem.
Por ter sido o agente de desconexão da chamada, a investigação do evento poderia ter-se concentrado apenas na OA, uma vez que não houve nenhum evento físico na rede entre OA e OB e OX, fincado a OA com o pre. Entretanto, com uma analise completa da sinalização, incluindo todos os agentes envolvidos, nota-se o seguinte:
Em situações onde TB envia o BYE, a sinalização é perdida, não por qualidade da rede, mas por erro de endereçamento do GW SBC B2B envolvido na operação. Como consequência, nem a plataforma da Operadora A ou da Operadora B recebem o Bye, gerando e conforme projetado e configurado, a plataforma da Operadora A desconectou a chamada por Keep Alive Time Out, gerando na plataforma da operadora A uma chamada desconectada (sem bilhete) e na operadora B um bilhete normal (com 3.600 segundos). Então, temos neste cenário:
- Na Operadora A: Chamada desconectada por time out com 3.600 segundo
- Na Operadora B: CDR gerado por BYE da operadora A com 3.600 segundos
- Na Operadora X: CDR gerado por BYE de TB, com duração real da chamada
Nota ainda que quando a operadora A enviou o BYE por time out à operadora B, esta encaminhou à operadora X um BYE para um diálogo que não existia mais naquela operação. Esta ação deve ter gerado uma sinalização indicativa do evento para a Operadora B.
Pelo evento acima, nota-se que a correta configuração de todos os atores, a estabilidade da rede e o monitoramento constante são as melhores formas de mitigar eventos irregulares na operação de telefonia NGN.
É importante destacar no entanto que, ainda que a infraestrutura esteja organizada conforme recomendamos, a ocorrência de eventos relacionados aos itens abaixo operacionais abaixo é ocorre além do controle da equipe do cliente. Por isso a necessidade de monitoramento constante do ambiente operacional.
- Ambiente de rede
- Chamadas presas
- Chamadas desconectadas ou mudas
- Chamadas sem mídia
- Diferenças de bilhetagem
- Saturação de elementos
É imprescindível que a equipe operacional do cliente tenha conhecimento dos recursos aplicados em sua operação, com entendimento claro de seus princípios operacionais e de funcionamento. Este conhecimento é necessário para operar corretamente a plataforma, detectar problemas (internos e externos) e agir tempestivamente e corretamente sobre os mesmo. A pronta ação de sua equipe quando os problemas se apresentam irá evitar a propagação do problema. |
---|