Galera, vou listar alguns erros muito comuns nas redes que já trabalhei, talvez possa estar acontecendo na sua rede também:
- STP não configurado - em alguns casos o STP nem mesmo no padrão default (802.1d) está habilitado na rede, ou em alguns casos parte dos switches estão configurados com STP e parte não;
- STP mal dimensionado - As boas práticas do protocolo Spanning-tree recomenda que haja no máximo 7 hops (saltos) dentro de um mesmo domínio STP, o que não ocorre muitas vezes devido ao cascateamento dos switches da rede, tente evitar ao máximo esse comportamento e fique de olho nos TCNs (topology change notification) que podem estar inundando o seu domínio STP, o exemplo abaixo mostra a diferença entre dois dominios (o primeiro com 9 saltos e o segundo com no máximo 4 saltos):
Obs. Lembre-se de verificar a disponibilidade de portas Giga nos switches pois não adianta alterar e causar gargalo nos uplinks (FastEthernet x GigaEthernet).
- Root Bridge não configurado - Esse ocorreu há uns 3 meses, a empresa possui um DC principal e um backup e algumas vlans estendidas via lan-to-lan pra lá, o Core do DC principal estava com a prioridade 0 para quase todas as vlans estendidas sendo o Root-Bridge delas, apenas 2 vlans de produção que estavam com o Root bridge no DC Backup, houve queda de energia no DC-Backup causando o recalculo do STP na rede inteira, os equipamentos dessa vlan ficaram sem comunicação enquanto o recalculo era feito, fiquem sempre atentos ao root-primary e ao root-secondary configurados na rede ou se preferir você pode configurar manualmente as prioridades pra um valor baixo (0 por exemplo):
DC-1(config)# spanning-tree vlan 1-4096 root primary
DC-2(config)# spanning-tree vlan 1-4096 root secundary
ou
DC-1(config)# spanning-tree vlan 1-4096 priority 0
- Links bloqueados - Galera fiquem espertos com switches com 2 uplinks para o mesmo switch sem etherchannel, é bem provável que você vai encontrar uma das portas bloqueadas e possivelmente terá problemas se houver o recalculo do STP nas vlans permitidas nesses links:
- Utilização do STP default - Pessoal, o STP padrão tem os timers de 15 segundos de listening, 15 segundos de learning, 20 segundos de max-age timeout ou seja, pode levar até 50 segundos para convergir (o que em ambiente de produção pode ser um desastre), utilize os protocolos mais recentes (Rapid Spanning Tree ou Per-VLAN Spanning tree protocol) que além da compatibilidade com a versão antiga, possui diversas novas features para diminuir esse tempo de convergência como o port-fast (portas de acesso pulam para o estado de forwarding), UplinkFast e Back-bone fast.
- Equipamentos terceiros - Galera tomem cuidado com equipamentos novos/terceiros/multivendor ou mesmo roteadores/firewalls com placas de switch embutido, utilize alguns comando para evitar BPDUs e root bridges indesejáveis na rede:
SW-01#(config)interface FastEthernet0/x
SW-01#(config-if)spanning-tree bpduguard enable
SW-01#(config-if)spanning-tree guard root
- FHRP (HSRP/GLBP/VRRP) - É preciso tomar cuidado nesse tipo de configuração envolvendo STP, pois o switch que fica como active nem sempre é o root bridge da rede, o que pode acarretar em um gargalo ou tráfego desnecessário indo pelo trunk entre os switches.
- Incremento de TCNs - Galera, em um dos projetos que passei, tinhamos diversos switches de vários fabricantes diferentes, e para saber se o domínio STP estava funcionando bem, um dos itens que era analisado era o incremento de TCN nos switches (comparação de evidencia do começo do dia e do fim do dia), em geral um incremento grande de TCN significa uma rede instável ou com loop.
Obs. É bom observar que a porta com o comando port-fast habilitado também gera TCN na rede quando a porta fica down.
Abraços
Otimo Post, muito gente se confunde com isto!!
ResponderExcluirCara vlw, já apanhei um pouco pra STP também kkkk
ExcluirAbraços
Excelentes dicas! Parabéns pelo empenho.
ResponderExcluir