Resolvendo problema entre vSwitch e Broadcom no Windows Server 2012 / 2012 R2

Resolvendo problema entre vSwitch e Broadcom no Windows Server 2012 / 2012 R2

Considere um Failover Cluster com dois hosts Hyper-V utilizando o Windows Server 2012/ 2012 R2 Datacenter e hospedando aproximadamente 50 máquinas virtuais. Cada host tem seis NIC’s,  destas, quatro são onboard e duas offboard.

Broadcom BCM57765 NetXtreme Gigabit
– NIC01 e NIC02 – vSwitch configurado com o NIC Teaming do Windows Server 2012
– NIC03 – Live Migration
– NIC04 – Gerenciamento

Broadcom BCM57810 NetXtreme II 10 Gigabit
– NIC05-ISCSI01 e NIC06-ISCSI02 – Acesso ao Storage

O problema era semelhante ao do KB2902166, com a diferença que não havia baixo desempenho e sim falhas na conexão. Sem nenhum padrão, um dos hosts Hyper-V (eventualmente os dois hosts juntos) perdiam a conexão de rede nas NIC’s onde o vSwitch estava configurado e esta conexão somente era restabelecida se os cabos de rede fossem removidos e plugados novamente (apenas desabilitar as NIC’s e habilitar novamente não resolvia). Eventualmente uma das NIC’s do time ficavam no estado de falha, porém, basta desabilita-la e habilitar novamente para ficar com o status OK.

Outras informações:
– Todas as atualizações do Windows Server 2012 haviam sido aplicadas;
– Os drivers das NIC’s Broadcom estavam na última versão (atualizados pela Dell);
– As placas de rede utilizadas para o gerenciamento, Live Migration e iSCSI não apresentavam o problema;
– As portas do switch foram configuradas para suportar LACP;
– Testados outros modos do NIC Team;
– Configurado um membro do NIC Team como standby;

Para resolver o problema, foi necessário desabilitar o TCP Chimney Offload e Receive Side Scaling nos dois hosts Hyper-V via prompt.
* Executar como Administrador

  • netsh int tcp set global chimney=disabled
  • netsh int tcp set global rss=disabled
  • netsh int tcp show global

cms tcp offloadcms tcp offload 222

Depois foi necessário desabilitar as opções Receive Side Scaling e Virtual Machine Queues nas propriedades das placas de rede que estavam sendo utilizadas pelo vSwitch (NIC01, NIC02 e NICTEAM01) dos dois hosts Hyper-V.

nics

broadcom

Não foi necessário reiniciar os hosts Hyper-V. Esta alteração, quando feita no NICTEAM01 teve uma falha de conexão de aproximadamente 15s. Após alterar os dois hosts, não houveram mais falhas de conexão.

Update – 11/07/2014
Ao configurar um vSwitch em um servidor Dell PowerEdge T320 utilizando placas de rede Broadcom no Windows Server 2012 R2 Standard, tive problemas de desempenho que só foram solucionados após a opção Virtual Machine Queues ser desabilitada da placa de rede física.

Referências:

Ricardo Conzatti é especialista em TI e apaixonado por Virtualização. É graduado em Sistemas de Informação, pós-graduado em Gestão de TI e acredita muito na teoria da pirâmide de aprendizagem de William Glasser. Ricardo também é blogger, palestrante, podcaster e muito envolvido com comunidades técnicas. Ex-líder do VMUG Paraná e ex-host do vBrownBag Brasil, além de ser VMware vExpert & vExpert PRO. Possui várias certificações técnicas VMware e Microsoft. Você com certeza irá encontra-lo no twitter @RicardoConzatti.

7 thoughts on “Resolvendo problema entre vSwitch e Broadcom no Windows Server 2012 / 2012 R2

  1. Ótimo Post, Ricardo.
    Só fiquei com uma dúvida, tenho o Hyper-V server configurado sem o modo gráfico. Como faço para exibir as configurações do driver de rede para desabilitar esses recursos?

    1. Boa tarde Luis, neste caso é necessário utilizar o bom e velho Powershell.
      Você pode utilizar o comando Disable-NetAdapterVmq para desabilitar o VMQ e o comando Disable-NetAdapterRSS -Name “AdapterName” para desabilitar o RSS. Para mais informações sobre cmdlets para adaptadores de rede acesse http://technet.microsoft.com/en-us/library/jj134956.aspx .
      Abraço e até mais.

      1. Obrigado, Ricardo.
        Através dos comandos citados foi possível devolver o desempenho aos serviços acessados. Abraço

  2. Obrigado, Ricardo.
    Funcionou aqui! De fato o desempenho para acesso via terminal service mudou consideravelmente! Obrigado.

  3. Estou tento o mesmo problema com win 2008 e 2012 irei aplicar essas configurações para tentar sanar o meu problema grato por compartilhar o conhecimento.

  4. Ricardo,
    Veja se vc ja passou por isso. Ao reiniciar um switch de um determinado departamento, ou se houver uma queda de energia, todas as minhas vms reiniciam. O que pode ser?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *