
Exim deixando load alto e caindo
#1
Posted 05 março 2009 - 03:06
Aqui no provedor em que eu trabalho compramos uma licença do Cpanel para nosso serviço de hospedagem, como ficou tudo redondo compramos outra licença para servir somente para os e-mails do domínio do provedor, que são cerca de 5400 contas dos clientes@nomedoprovedor.com.br, em uso creio que por volta de 3500~4000.
Instalamos, deixamos tudo redondo, show! Sendo que na últimas semanas o servidor vem subindo muito o Load e quando chega a 3500 o Exim para e com ele todo o serviço de e-mails do domínio principal do provedor, assim que reinicio ele volta normal e o load cai, ai vai subindo gradativamente quando chega por volta de 3500 novamente, cai! Assim eu fico monitorando e quando ta nos 2000+- já reinicio e o Load cai. Alguém sabe o que posso fazer para melhorar isso? Já dei uma melhorada nas configurações do exim baseado em pesquisas e nada...
Observei também que a queue cresce muito rápido, fazemos limpezas de vez em quando na madrugada e quando é de manhã já tem mais de 50mil na queue e só vai subindo, 100mil, 200mil e por aí vai... E eu observo que vários e-mails ficam "emperrados" na queue e só saem deletando.
Desde já, obrigado!
#2
Posted 05 março 2009 - 04:04
cola uma linha do log aqui
#3
Posted 05 março 2009 - 06:06
#4
Posted 05 março 2009 - 10:35
#5
Posted 09 março 2009 - 03:37
Eu me refiro ao Load Averages que mostra no próprio WHM, mas pelo top eu vi que é o mesmo que é mostrado no shell do servidor.
É um dual xeon com 32gb de memória, 4mb de cache...
#6
Posted 09 março 2009 - 03:50
Cara, tem certeza que está aparecendo 2000 (2 MIL) e 3500 (3 MIL E QUINHENTOS) de load?? Se está aparecendo isso, há algo muito errado travando teu servidor.
O pessoal por aqui diz que com 30 de load os servidores começam a parar... O meu nunca chegou a 4.
This post has been edited by Martinewski: 09 março 2009 - 03:51
#7
Posted 09 março 2009 - 05:00
geralmente, dependendo da maquina, quando o load chega a 100 ou 160 ela se torna inacessivel
como está o I/O pelo que da pra notar, parece que é problema de processos esperando pelo HD, o que vc usa de discos? (nao adianta ter processamento e memoria se os HDs não dão conta pra ler e processar as mensagens sendo gravadas)
no minimo um RAID 50 pra atender esta quantidade de emails / requesições, abaixo disto (raid 10 ou 5) nao vai dar conta
#8
Posted 09 março 2009 - 05:26
Esse servidor está com muita demanda mesmo. Ao que parece (salvo problemas de configuração) o gargalo está no I/O de disco.
Um RAID 50 ou RAID 10 deverão melhorar a performance. Mas eu recomendo que você divida esses clientes por pelo menos 2 servidores. Um único server, pode ter diversos problemas gerenciando essa quantidade de usuários de email.
Pode ser mais viável ter 2 servidores um pouco menores, com pelo menos um RAID 10. Ai o EXIM deve passar a suportar bem a demanda.
Se bem que em grandes sistemas de e-mail, aqui na empresa preferimos o POSTFIX como MTA. Por nossa experiência, ele se dá melhor que o EXIM nesse tipo de demanda.
Ressalva: se for usar o POSTFIX, a administração dele não pode ser feita hoje, eficientemente, pelo cPanel. Aqui usamos o Debian com um painel de controle próprio.
Bons negócios.
#9
Posted 11 março 2009 - 10:25
Esse servidor está com muita demanda mesmo. Ao que parece (salvo problemas de configuração) o gargalo está no I/O de disco.
Um RAID 50 ou RAID 10 deverão melhorar a performance. Mas eu recomendo que você divida esses clientes por pelo menos 2 servidores. Um único server, pode ter diversos problemas gerenciando essa quantidade de usuários de email.
Pode ser mais viável ter 2 servidores um pouco menores, com pelo menos um RAID 10. Ai o EXIM deve passar a suportar bem a demanda.
Se bem que em grandes sistemas de e-mail, aqui na empresa preferimos o POSTFIX como MTA. Por nossa experiência, ele se dá melhor que o EXIM nesse tipo de demanda.
Ressalva: se for usar o POSTFIX, a administração dele não pode ser feita hoje, eficientemente, pelo cPanel. Aqui usamos o Debian com um painel de controle próprio.
Bons negócios.
Em relação ao Load, realmente mostra 3.500, vou tirar um printo e ponho já aqui!
Essa semana, no sábado, vamos transferí o Cpanel para um outro servidor com 2 processadores quad com 4mb de cache, 32gb de ram, e vamos montar Raid 6 com controladora (Hardware) para ver se com isso melhora.
Porém tenho uma dúvida: Devido a esse load alto, quando o load chega a 3.500 +- o processo do Exim para, ai os clientes não conseguem abrir nada, nem usar Outlook.
Gostaria de saber se pelo menos emergencialmente eu posso criar uma cron para ficar reiniciando o exim de x em x minutos, pois ele fica subindo muito o Load e cai com muita frequencia, e quando é restartado passa um período com o load baixo e vai subindo aos poucos.
Isso pode ser feito? Qual o comando eu teria que inserir na cron e onde colocar? Porque pelo whm não tem nada de cron, só no cpanel de usuário e no caso teria que ser como root.
Obrigado desde já.
#11
Posted 11 março 2009 - 11:48
Tem que identificar se é um processo que está travando e deixando todos esses pendentes ou se é problema de IO de disco e por isso nenhum consegue finalizar.
Qual o intervalo entre os queue runs do seu exim?
#12
Posted 11 março 2009 - 01:20
Tem que identificar se é um processo que está travando e deixando todos esses pendentes ou se é problema de IO de disco e por isso nenhum consegue finalizar.
Qual o intervalo entre os queue runs do seu exim?
Não alterei, creio que esteja no padrão. O padrão são uns 300s ? Qual é a linha da conf que altera os runs?
#13
Posted 11 março 2009 - 01:25
#14
Posted 11 março 2009 - 01:44
Acho que é no TWEAK SETTINGS do WHM ou no EXIM CONFIG EDITOR. Em um dos dois encontrará... o padrão do CPanel é 1x por hora.
#15
Posted 11 março 2009 - 02:44
O queue runs faz o que exatamente? Processa a lista no tempo programado?
Você acha que devo aumentar ou diminuir esse tempo?
#16
Posted 11 março 2009 - 02:50
Me diga uma coisa, essa quantidade enorme de emails que teu servidor está recebendo é legítima mesmo? Não está sendo usado p/ spam por gente de fora (que não clientes do provedor)?
Já usou o Configserver Mail Queues pra dar uma analisada nesse teu queue gigante?
#17
Posted 11 março 2009 - 03:00
Me diga uma coisa, essa quantidade enorme de emails que teu servidor está recebendo é legítima mesmo? Não está sendo usado p/ spam por gente de fora (que não clientes do provedor)?
Já usou o Configserver Mail Queues pra dar uma analisada nesse teu queue gigante?
Sim, provavelmente tem gente de fora usando, ai é que está o motivo de eu ter criado o outro tópico querendo bloquear somente para as faixas do provedor, e os CLIENTES que forem solicitando para utilizar em outros provedores nós daremos o noss outro SMTP que é aberto, entendeu?
Esse Mail Queues que tu se refere é no próprio WHM ne, p/ ver a lista de e-mails da fila e etc? Se sim, já olhei e tem muito e-mail emperrado la, a gente tem feito a rotina de deletar tudo durante a madrugada, o pior é que a gente zera na madrugada e quando é pela manhã já tem 50mil na fila e vai subindo hehe..
#18
Posted 11 março 2009 - 04:57
Esse Mail Queues que tu se refere é no próprio WHM ne, p/ ver a lista de e-mails da fila e etc? Se sim, já olhei e tem muito e-mail emperrado la, a gente tem feito a rotina de deletar tudo durante a madrugada, o pior é que a gente zera na madrugada e quando é pela manhã já tem 50mil na fila e vai subindo hehe..
Olha, se alguém de fora está usando o servidor de vocês pra enviar spam, então isto é um problema de segurança e não de configuração ou aperfeiçoamento.
Na minha opinião também não é correto simplesmente ir lá e zerar o queue. Muita gente está perdendo email nessa atitude. E muitos emails destes podem ser importantes.
Faz um teste básico aqui http://www.spamhelp.org/shopenrelay/ para testar se o seu servidor está aberto. Se estiver, então tem que solucionar isto imediatamente, caso contrário vai cair em lista-negra e aí seus clientes terão sérios problemas para enviar emails.
Me manda uma MP com seu messenger ou equivalente, assim podemos conversar melhor.
#19
Posted 11 março 2009 - 05:07
Na minha opinião também não é correto simplesmente ir lá e zerar o queue. Muita gente está perdendo email nessa atitude. E muitos emails destes podem ser importantes.
Faz um teste básico aqui http://www.spamhelp.org/shopenrelay/ para testar se o seu servidor está aberto. Se estiver, então tem que solucionar isto imediatamente, caso contrário vai cair em lista-negra e aí seus clientes terão sérios problemas para enviar emails.
Me manda uma MP com seu messenger ou equivalente, assim podemos conversar melhor.
Testing IP on port 25... successful! - the SMTP server is NOT an open relay.
Ok, valeu pela ajuda desde já!
This post has been edited by cadin: 11 março 2009 - 05:08
#20
Posted 11 março 2009 - 09:19
Faz teste de smart e de badblocks no disco, verifica o cache do danado!
hdparm -tT /dev/sda (pode ser sdb, sdc e etc)
Veja como está o buffer e o cache (acima de 500 e 47 mb já é algo a se tolerar)
Olha também os badblocks:
badblock -v /dev/sda (sdb...)
Olha aí!
Abraços.

Help











