0

07 окт 2014

Fault Management для операторов

Ежегодно операторы связи увеличивают объемы передачи и обработки данных, вводя новые сервисы и осваивая перспективные технологии. Это приводит к неминуемому росту нагрузки и на операторскую инфраструктуру. Вместе с тем пропорционально росту нагрузки увеличивается и количество событий в сети и телекоммуникационной инфраструктуре, требующих максимально оперативной обработки.

Количество таких сообщений у телекоммуникационных компаний достигает огромных значений, что делает критически важной их своевременную обработку и оперативность реагирования. При работе с ведущими российскими операторами связи мы неоднократно сталкивались с этой особенностью операторского бизнеса и каждый раз акцентировали внимание на том, что для обеспечения стабильной работы всех систем телекоммуникационной компании нужны все более совершенные инструменты обнаружения и устранения событий. В том числе и такие, которые позволяют превентивно реагировать на ситуации, которые могли бы повлиять на уровень предоставляемых оператором услуг.

Соответствующими качествами обладают современные системы автоматического анализа сообщений класса Fault Management. Такие системы способны существенно повысить процент автоматически обрабатываемых аварий и сократить число событий, требующих ручной обработки.

Дополнительно к системе интеллектуальной фильтрации и корреляции аварий можно устанавливать специализированный интерфейс, который значительно упрощают работу с системой мониторинга и позволяет оператору без дополнительных навыков установить сложные взаимосвязи между сообщениями, создавать и модифицировать правила корреляции в системе.

Тезис об актуальности систем автоматического мониторинга подтверждается практикой. Например, в 2014 году в компании "МегаФон" нами была успешно внедрена система Fault Management на платформе IBM Tivoli Netcool. По опыту работы с крупнейшими отечественными операторами связи мы еще раз убеждаемся в востребованности этих систем в том числе и на российском рынке.

Система стала ключевым инструментом единого центра управления сетью (ЕЦУС) компании "МегаФон". Внедрение состоялось в рамках комплексной Программы по построению зонтичных OSS, которые должны обеспечить более высокую эффективность работы подразделений компании.

Для этих целей был обеспечен централизованный мониторинг оборудования мобильной и фиксированной сетей "МегаФона" во всех филиалах, внедрены механизмы обогащения системы данных об авариях и автоматического открытия инцидентов, которые позволяют оперативно устранять аварии. Реализованный проект позволил компании "МегаФон" существенно ускорить выявление корневых причин аварий в сети, снизить среднее время восстановления сервисов, заранее прогнозировать и реагировать на события, способные повлиять на операционную деятельность. В целях обеспечения высокой отказоустойчивости система мониторинга была расположена в двух независимых ЦОДах.

При этом наша практика показывает, что внедрение системы мониторинга можно успешно осуществлять параллельно с трансформацией процессов управления сетью даже при масштабной территориально распределенной мультивендорной инфраструктуре, как в компании "МегаФон". Такой подход значительно сокращает сроки ввода в эксплуатацию всего решения. Для того чтобы охватить всю сеть, аналогичную по масштабу сети "МегаФона", в которой более сотни систем управления и сотни тысяч сетевых элементов были взяты под контроль новой системы мониторинга, может быть достаточно девяти месяцев.

Согласитесь, это достаточно короткий период для федерального оператора связи, когда речь идет о существенном повышении оперативности выявления аварийных ситуаций и, соответственно, о повышении качества сервиса и укреплении его позиции на высококонкурентном рынке телекоммуникационных услуг.

http://www.comnews.ru/node/87844