Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Para orientar nossos clientes, discorreremos sobre os principais eventos irregulares enfrentados no dia a dia de operação de telefonia NGN, as melhores práticas pada identificação da origem (troubleshooting) e formas de mitigação dos problemas:

Este sessão apresentará aos usuários da plataforma Softswicth PCRT

  • Visão das principais causas de eventos irregulares, 
  • Ações diretas e indiretas para reduzir a incidência de eventos irregulares,
  • Ações para mitigar o impacto dos eventos irregulares,
  • Análise de eventos irregulares.  

Os principais eventos irregulares que afetam a eficaz utilização de nossos problemas são:

  • Problemas com chamadas presas
  • Chamadas sem mídia
  • Desconexão antecipada de chamadas
  • Qualidade de audioáudio

Alguns problemas acima, além de acarretar perda de qualidade na percepção dos serviços, podem gerar ainda:

  • Problemas com bilhetagem (consequência direta de chamadas presas).

Este sessão apresentará aos usuários da plataforma Softswicth PCRT

...

Considerando a impossibilidade de de eliminar todos os problemas, a SIPPulse recomenda o estabelecimento de processos de análise de eventos estruturados de modo a permitir a analise de possibilidades múltiplas para apontar corretamente a origem de falhas operacionais.  

Tais processos são importantes pois eventos irregulares podem ter origem em elementos não controlados. especialmente onde a origem dos problemas podem inclusive sair de controle da operação do cliente,

As figuras abaixo mostram claramente a complexidade envolvida na análise. Neste exemplo, real, uma chamada do Terminal A (TA), cliente da Operadora A (OA) para o Terminal B (TB), acarretou uma chamada presa em OA, gerando discrepância de bilhetagem.  

Image Added 

Por ter sido o agente de desconexão da chamada, a investigação do evento poderia ter-se concentrado apenas na OA, uma vez que não houve nenhum evento físico na rede entre OA e OB e OX, fincado a OA com o pre. Entretanto, com uma analise completa da sinalização, incluindo todos os agentes envolvidos, nota-se o seguinte:

Image Added

Em situações onde TB envia o BYE, a sinalização é perdida, não por qualidade da rede, mas por erro de endereçamento do GW SBC B2B envolvido na operação. Como consequência, nem a plataforma da Operadora A ou da Operadora B recebem o Bye, gerando e conforme projetado e configurado, a plataforma da Operadora A desconectou a chamada por Keep Alive Time Out, gerando na plataforma da operadora A uma chamada desconectada (sem bilhete) e na operadora B um bilhete normal (com 3.600 segundos). Então, temos neste cenário:

  • Na Operadora A: Chamada desconectada por time out com 3.600 segundo
  • Na Operadora B: CDR gerado por BYE da operadora A com 3.600 segundos
  • Na Operadora X: CDR gerado por BYE de TB, com duração real da chamada

Nota ainda que quando a operadora A enviou o BYE por time out à operadora B, esta encaminhou à operadora X um BYE para um diálogo que não existia mais naquela operação. Esta ação deve ter gerado uma sinalização indicativa do evento para a Operadora B. 

Pelo evento acima, nota-se que a correta configuração de todos os atores, a estabilidade da rede e o monitoramento constante são as melhores formas de mitigar eventos irregulares na operação de telefonia NGN.

É importante destacar no entanto que, ainda que a infraestrutura esteja organizada conforme recomendamos,  a ocorrência de eventos relacionados aos itens abaixo operacionais abaixo é ocorre além do controle da equipe do cliente. Por isso a necessidade de monitoramento constante do ambiente operacional.


...

É imprescindível que a equipe operacional do cliente tenha conhecimento dos recursos aplicados em sua operação, com entendimento claro de seus princípios operacionais e de funcionamento. Este conhecimento é necessário para operar corretamente a plataforma, detectar problemas (internos e externos) e agir tempestivamente e corretamente sobre os mesmo.

A pronta ação de sua equipe quando os problemas se apresentam irá evitar a propagação do problema.

...