12. Ethernet OAM

12. Ethernet OAM

Сама аббревиатура OAM означает «Operation, Administration, Maintenance», т.е. процессы, затрагивающие эксплуатацию, управление и обслуживание. OAM позволяет следить за состоянием сети — определять местоположение дефектов, измерять производительность сети, производить диагностическое тестирование. Ethernet-сети имеют необходимые инструменты для выполнения вышеуказанных функций.Измерения в OAM

Устройство, поддерживающее OAM, должно быть способно выполнить такие измерения, как:

  • Availability — соотношение аптайма к общему времени измерений
  • Frame delay — время, необходимое для передачи фрейма от одного устройства другому
  • Frame delay variation — изменение времени передач фреймов между последовательными тестами
  • Frame loss — количество фреймов, потерянных в течение определённого времени

Стандарты Ethernet OAM

  • IEEE 802.3-2008, пункт 57 — описывает методы для мониторинга производительности канала, обнаружения неисправностей и выполнения loopback-проверки на одном канале. Известен как Ethernet in the First Mile OAM (EFM OAM). Обычно используется на каналах от провайдеров до потребителей (LFM)
  • IEEE 802.1ag — стандарт определяет требования для обнаружения неисправностей на end-to-end участке Ethernet-сети, используя CFM. CFM обеспечивает fault monitoring, path discovery, fault isolation и frame delay measurement (ITU-T Y.1731)
  • MEF 17 — определяет требования, которые должны быть удовлетворены поставщиками оборудования и сервис-провайдерами в области управления неисправностями, мониторинга производительности, автообнаружения и услуг внутри провайдера и между провайдерами.

Основы OAM

Основной целью OAM является обнаружение дефектов сети (т.е. функционирование сети не соответствуем ожидаемому).

  • Дефект — сеть функционирует не так, как ожидается
  • Отказ (failure) — дефекты в течение определённого времени, которые могут привести к отказу сети
  • Тревога (alarm) — оповещение об отказе

OAM использует непрерывные сообщения проверки (continuity check (CC) messages), являющиеся однонаправленными (в ответ не поступает Ack) и передающиеся между устройствами. Эти сообщения оповещают удалённое устройство о достижимости как локального устройства, так и пути до него. Если такие сообщения не могут быть доставлены, то принимается решение о неисправности и может быть сгенерирована тревога.

Другая особенность OAM-протоколов — использование indicators для оповещения о неисправностях в сети. 12-1-1При возникновении неисправности между устройствами B и C. На устройстве C срабатывает индикатор неисправности и C, используя alarm indication signal (AIS) и Forward Defect Indicators (FDIs) оповещает об этом downstream-устройство D. Устройство D, при получении AIS и FDI, может отослать Backward Defect Indicator (BDI) для оповещения устройств A и B о неисправности.

Loopback messages

Особенность OAM, помогающая найти неисправность в сети. Существуют 2 типа loopback-сообщений, инициированных администратором:

  1. Non-intrusive loopback-сообщение (ping) — обычный трафик при этом может пересылаться
  2. Intrusive loopback-сообщение (метод обратной петли) — последовательный перенос loopback‘а последовательно на устройства по трассе прохождения канала и ожидание последовательных откликов от них на том же линке, на котором был отправлен тестовый трафик; обычный трафик при этом пересылаться не может

12-1-2

Linktrace Messages

Каждое устройство по трассе отвечает на запрос (traceroute):

12-1-3


Возможности LFM

LFM ограничен одним Ethernet соединением и может обеспечить:

  • remote failure indication
  • remote loopback (intrusive)
  • link monitoring
  • event notification
  • OAM capability discovery

LMF клиенты взаимодействуют на L2 уровне, т.е. у клиентов отсутствует необходимость в IP адресе. Для поддержки LFM, коммутатор должен иметь возможность выступать в качестве LFM-клиента. LFM-клиенты обмениваются OAM protocol data units (OAMPDU), посылаемым через один канал на multicast-адрес 01-80-c2-00-00-02. Для определения, существует ли на другом конце канала LFM-клиент, LFM-клиент на локальной стороне запускает discovery process:12-1-4Режимы работы LFM-клиентов:

  • активный (active) —  инициирует discovery process, посылает loopback messages
  • пассивный (passive)

Оба клиента могут работать в активном (active) режиме.

OAM protocol data units (OAMPDU)

Формат OAMPDU:12-1-5Существуют различные типы OAMPDU. Тип OAMBPDU определяется установленным кодом и флагом.

Основные типы OAMPDUs:

  • information — используются в discovery process для поиска соседа и обмена возможностями, для выполнения непрерывной проверки между соседями через настроенные интервалы времени, для проверки доступности соседа (аналогично keepalive) — по-умолчанию 1 сек, а также информации о критических событиях/отказах
  • event notification — используются как BID, информируют upstream-клиентов об ошибках на локальном приёмном (in-) направлении; виды event notificationErrored Frame Event, Errored Frame Period Event, Errored Frame Second Summary EventErrored Symbol Period Event
  • variable request and response — позволяет собрать информацию об удалённом соседе; не поддерживается в JunOS
  • loopback control — оповещает удалённый узел об установки или снятии loop на интерфейсе

Реакция на события

Когда LFM-клиенты получают critical event, они автоматически отправляют интерфейс в down (удаляются маршруты и происходит пересчёт топологии STP). Однако процесс отслеживания LFM-сообщений на этом интерфейсе не прекращается.

Для других типов событий, действие LFM-клиента настраивается через создание action-profile и привязки его к интерфейсу. Действия , которые можно настроить:

  • отправка syslog-сообщения
  • отправка интерфейса в «down»
  • отправка OAMPDU удалённому соседу с установленным битом «critical event»

Возможности CFM

CFM может обеспечить:

  • Поиск соседа и проверка его на «живучесть» с помощью continuity check
  • Проверка трассы и проверка на отказы — аналог traceroute
  • Поиск места отказа используя loopback protocol — аналог ping
  • Замер Frame Delay

Домены обслуживания CFM

Каждому обслуживаемому домену присваивается уровень от 0 до 7. Уровни с 5 по 7 зарезервированы для потребителей, уровни 3 и 4 — для провайдеров, уровни 0-2 — для операторов. Домены обслуживания по-сути разделяют области обслуживания:12-1-6

Точки обслуживания CFM

Точка обслуживания — это порт коммутатора. Три типа точек обслуживания могут присутствовать в домене обслуживания:

  • Maintenance endpoints (MEP) — интерфейс на краю (edge) обслуживаемого домена; устанавливает отношения соседства с такими же MEP внутри домена обслуживания
  • Maintenance Intermediate Point (MIP) — внутренняя по отношению к домену
  • Transparent Point — не настраивается для CFM-сообщений, а просто пересылает их как обычный трафик12-1-7

Каждая Maintenance Point нужна для поддержания целостности каждого домена, в то же время обеспечивая каждый домен достаточной информацией для изолирования отказов:12-1-8

Mep-To-Mep отношения

Как только настроена MEP, то она пытается установить связь с другой MEP с помощью CC-сообщений. Для каждой MEP настраивается:

  • уникальный во всей сети нумерованный MEP ID
  • направление — up или downdown MEP пытается найти MEP-соседей в downstream-направлении, up MEP -в upstream-направлении

Для того, чтобы стать MEP-соседями необходимы одинаковые данные, переносящиеся в  CFM-сообщении:

  • maintenance domain
  • maintenance association
  • level
  • direction12-1-9

Сообщение CFM

IEEE 802.1ag определяет 5 типов CFM-сообщений:

  1. Continuity Check — отсылается на multicast-адрес
  2. Loopback Reply
  3. Loopback Message
  4. Linktrace Reply
  5. Linktrace Message — отсылается на multicast-адрес

CFM-сообщение инкапсулируется в 802.1Q тег.

Сообщение Continuity Check

Протокол Continuity Check используется для определения отказов подключений и непреднамеренных подключений.

  • настраиваемый интервал отправки — 100 ms, 10 ms, 1s, 1 min, 10 min
  • содержит различные значения
  • являются multicast, адрес назначения — 01-80-C2-00-00-3y («y» определяет maintenance domain level)
  • потеря трёх CC-сообщений (по-умолчанию) — это неисправность

12-1-10

Loopback Protocol

Аналогичен ping‘у в IP-сетях и служит для проверки и выявления проблем соединения.

Инициирующее устройство отсылает Loopback Request, Loopback Responder отвечает Loopback Response сообщением. Отсутствие Loopback Response означает наличие проблем в сети. Если Loopback Reply (LBR) имеет ожидаемый transaction identifier и получен в течение 5-ти секунд после передачи Loopback Request, то LBR считается валидным.

Linktrace Protocol

Аналогичен traceroute’у в IP-сетях и служит для проверки трассы и определения неисправности.

Инициирующее устройство отсылает Linktrace Message на определённый MAC-адрес назначения. Каждая точка обслуживания на пути пересылает это сообщение далее к MAC-адресу назначения, а так же отсылает обратно Linktrace Reply, содержащий его собственный MAC-адрес. Отвечающие коммутаторы настроены в тот же level, что и инициатор:12-1-12

Измерение Frame Delay

Существует 2 типа задержки: one-way и two-way. Когда запускается one-way frame delay test, отсылается delay measurement message, содержащее отметку времени, на удалённую MEP, на которой снимается время приёма фрэйма и определяется задержка в передаче этого фрэйма. Для таких измерений, «хардварные» часы на устройствах должны быть строго синхронизированы. Для двухстороннего теста часы на устройствах не обязательно должны быть синхронизированы:12-1-13

Настройка LFM

Типичная настройка LFM представлена на слайде:12-1-14В action-profile example можно указать различные события (event):

  • link-adjacency-loss: происходит когда CC-сообщение не получено от удалённого соседа
  • link-event-rate: позволяет задать rate приёма сообщений с различным типом событий, который вызовет дальнейшее действие (action)
  • protocol-down: позволяет MEP отслеживать,  когда maintenance associations на верхнем уровне уйдут в «down»

Команда show oam ethernet link-fault-management позволяет просмотреть состояние интерфейсов, на которых запущен LFM:12-1-15а так же информацию о MAC-адресе соседа, состоянии соседства с этим соседом, возможностях соседа.

Установка Remote Loop

Настраивается всё так же в «секции» [edit protocols oam ethernet link-fault-management] в режиме настройки конкретного интерфейса командой remote-loopback. Заставляет установить loop на интерфейсе удалённого устройства:12-1-16

Проверить установленный loop на интерфейсе удалённого устройства можно так:

12-1-17Генерируем ICMP пакеты через закольцованную линию, что видим из надписи о том, что TTL Exceeded. Предварительно необходимо внести изменения в ARP таблицу локального коммутатора для этого.

Настройка Down MEP

Удалённый MEP должен быть настроен аналогично локальному MEP, а именно должны совпадать:

  • maintenance domain
  • maintenance association
  • interval
  • level12-1-18

Помимо этого настраивается:

  • уникальный MEP ID
  • направление (direction)
  • MIP ID удалённого узла (может быть использовано autodiscovery)
  • интервал CC-сообщения

На слайде показано применение action-profile. Следует учесть, что когда используется autodiscovery, то нельзя применить action-profile.

Настройка Up MEP

На слайде показана типичная настройка Up MEP:

12-1-19

Для того, чтобы Up MEP функционировал ещё и как MIP для higher level, необходимо в конфигурацию добавить mip-half-function default. Как MIP работает только для Level 5 (level 4+1).

Для проверки CFM используется команда show oam ethernet connectivity-fault-management с дополнительными параметрами.

Для проверки MEP-соседства используется команда show oam ethernet connectivity-fault-management interface:12-1-20

Для проверки CFM Loopback используется команда ping ethernet maintenance-association evc1 с дополнительными параметрами:12-1-21В команде задаётся MEP ID или MAC-адрес удалённого узла.

Для проверки Linktrace используется команда traceroute ethernet maintenance-domain customer maintenance-association evc1 mep 106:12-1-22Следует учесть, что любой MIP, настроенный на Level 4 тоже будет отвечать на linktrace-сообщение, инициированное Level 5 MEP’ом.

Для проверки измерений Frame Delay между двумя MEP используется команда monitor ethernet delay-measurement maintenance-domain customer maintenance-association evc1 mep 106 two way12-1-23Если необходимо просмотреть последние результаты измерений Frame Delay, то для этого есть команда show oam ethernet connectivity-fault-management mep-statistics:12-1-24

К оглавлению

Добавить комментарий