Fórum cPanel: Exim deixando load alto e caindo - Fórum cPanel

Ir para


  • 2 Pages +
  • 1
  • 2
  • You cannot start a new topic
  • You cannot reply to this topic

Exim deixando load alto e caindo

#1 Membro offline   cadin 

  • Super Membro
  • PipPipPipPipPip
  • Grupo: Membros
  • Posts: 147
  • Cadastrado: 29-fevereiro 08

  Posted 05 março 2009 - 03:06

Boa tarde,

Aqui no provedor em que eu trabalho compramos uma licença do Cpanel para nosso serviço de hospedagem, como ficou tudo redondo compramos outra licença para servir somente para os e-mails do domínio do provedor, que são cerca de 5400 contas dos clientes@nomedoprovedor.com.br, em uso creio que por volta de 3500~4000.

Instalamos, deixamos tudo redondo, show! Sendo que na últimas semanas o servidor vem subindo muito o Load e quando chega a 3500 o Exim para e com ele todo o serviço de e-mails do domínio principal do provedor, assim que reinicio ele volta normal e o load cai, ai vai subindo gradativamente quando chega por volta de 3500 novamente, cai! Assim eu fico monitorando e quando ta nos 2000+- já reinicio e o Load cai. Alguém sabe o que posso fazer para melhorar isso? Já dei uma melhorada nas configurações do exim baseado em pesquisas e nada...

Observei também que a queue cresce muito rápido, fazemos limpezas de vez em quando na madrugada e quando é de manhã já tem mais de 50mil na queue e só vai subindo, 100mil, 200mil e por aí vai... E eu observo que vários e-mails ficam "emperrados" na queue e só saem deletando.

Desde já, obrigado!
0

#2 Membro offline   alancb 

  • Esse é irmão!!
  • PipPipPipPipPipPip
  • Grupo: Membros
  • Posts: 389
  • Cadastrado: 03-março 07
  • Gender:Male
  • Location:Indaial/SC
  • Interests::)

Posted 05 março 2009 - 04:04

ja olhou pra ver se nao ta dando algum erro no eximmaillog?

cola uma linha do log aqui

0

#3 Membro offline   Martinewski 

  • Esse é irmão!!
  • PipPipPipPipPipPip
  • Grupo: Membros
  • Posts: 455
  • Cadastrado: 27-maio 08
  • Gender:Male
  • Location:Porto Alegre

Posted 05 março 2009 - 06:06

Cadin, o que é os 2000, 3500 que você chama de "load"? Não é o load geral do servidor, certamente...
0

#4 Membro offline   alancb 

  • Esse é irmão!!
  • PipPipPipPipPipPip
  • Grupo: Membros
  • Posts: 389
  • Cadastrado: 03-março 07
  • Gender:Male
  • Location:Indaial/SC
  • Interests::)

Posted 05 março 2009 - 10:35

tá, pra atender a tantos emails, em primeiro lugar, qual a conf da maquina?
0

#5 Membro offline   cadin 

  • Super Membro
  • PipPipPipPipPip
  • Grupo: Membros
  • Posts: 147
  • Cadastrado: 29-fevereiro 08

Posted 09 março 2009 - 03:37

QUOTE(Martinewski @ Mar 5 2009, 06:06 PM) <{POST_SNAPBACK}>
Cadin, o que é os 2000, 3500 que você chama de "load"? Não é o load geral do servidor, certamente...



Eu me refiro ao Load Averages que mostra no próprio WHM, mas pelo top eu vi que é o mesmo que é mostrado no shell do servidor.

QUOTE(alancb @ Mar 5 2009, 10:35 PM) <{POST_SNAPBACK}>
tá, pra atender a tantos emails, em primeiro lugar, qual a conf da maquina?



É um dual xeon com 32gb de memória, 4mb de cache...
0

#6 Membro offline   Martinewski 

  • Esse é irmão!!
  • PipPipPipPipPipPip
  • Grupo: Membros
  • Posts: 455
  • Cadastrado: 27-maio 08
  • Gender:Male
  • Location:Porto Alegre

Posted 09 março 2009 - 03:50

QUOTE(cadin @ Mar 9 2009, 03:37 PM) <{POST_SNAPBACK}>
Eu me refiro ao Load Averages que mostra no próprio WHM, mas pelo top eu vi que é o mesmo que é mostrado no shell do servidor.


Cara, tem certeza que está aparecendo 2000 (2 MIL) e 3500 (3 MIL E QUINHENTOS) de load?? Se está aparecendo isso, há algo muito errado travando teu servidor.

O pessoal por aqui diz que com 30 de load os servidores começam a parar... O meu nunca chegou a 4.

This post has been edited by Martinewski: 09 março 2009 - 03:51

0

#7 Membro offline   alancb 

  • Esse é irmão!!
  • PipPipPipPipPipPip
  • Grupo: Membros
  • Posts: 389
  • Cadastrado: 03-março 07
  • Gender:Male
  • Location:Indaial/SC
  • Interests::)

Posted 09 março 2009 - 05:00

realmente com load de 3k eu nunca vi

geralmente, dependendo da maquina, quando o load chega a 100 ou 160 ela se torna inacessivel


como está o I/O pelo que da pra notar, parece que é problema de processos esperando pelo HD, o que vc usa de discos? (nao adianta ter processamento e memoria se os HDs não dão conta pra ler e processar as mensagens sendo gravadas)

no minimo um RAID 50 pra atender esta quantidade de emails / requesições, abaixo disto (raid 10 ou 5) nao vai dar conta
0

#8 Membro offline   AndreLuisPereira 

  • Esse é irmão!!
  • PipPipPipPipPipPip
  • Grupo: Membros
  • Posts: 381
  • Cadastrado: 16-julho 08
  • Gender:Male
  • Location:Ribeirão Preto-SP

Posted 09 março 2009 - 05:26

Boa tarde.

Esse servidor está com muita demanda mesmo. Ao que parece (salvo problemas de configuração) o gargalo está no I/O de disco.

Um RAID 50 ou RAID 10 deverão melhorar a performance. Mas eu recomendo que você divida esses clientes por pelo menos 2 servidores. Um único server, pode ter diversos problemas gerenciando essa quantidade de usuários de email.

Pode ser mais viável ter 2 servidores um pouco menores, com pelo menos um RAID 10. Ai o EXIM deve passar a suportar bem a demanda.

Se bem que em grandes sistemas de e-mail, aqui na empresa preferimos o POSTFIX como MTA. Por nossa experiência, ele se dá melhor que o EXIM nesse tipo de demanda.

Ressalva: se for usar o POSTFIX, a administração dele não pode ser feita hoje, eficientemente, pelo cPanel. Aqui usamos o Debian com um painel de controle próprio.

Bons negócios.
0

#9 Membro offline   cadin 

  • Super Membro
  • PipPipPipPipPip
  • Grupo: Membros
  • Posts: 147
  • Cadastrado: 29-fevereiro 08

Posted 11 março 2009 - 10:25

QUOTE(AndreLuisPereira @ Mar 9 2009, 05:26 PM) <{POST_SNAPBACK}>
Boa tarde.

Esse servidor está com muita demanda mesmo. Ao que parece (salvo problemas de configuração) o gargalo está no I/O de disco.

Um RAID 50 ou RAID 10 deverão melhorar a performance. Mas eu recomendo que você divida esses clientes por pelo menos 2 servidores. Um único server, pode ter diversos problemas gerenciando essa quantidade de usuários de email.

Pode ser mais viável ter 2 servidores um pouco menores, com pelo menos um RAID 10. Ai o EXIM deve passar a suportar bem a demanda.

Se bem que em grandes sistemas de e-mail, aqui na empresa preferimos o POSTFIX como MTA. Por nossa experiência, ele se dá melhor que o EXIM nesse tipo de demanda.

Ressalva: se for usar o POSTFIX, a administração dele não pode ser feita hoje, eficientemente, pelo cPanel. Aqui usamos o Debian com um painel de controle próprio.

Bons negócios.


Em relação ao Load, realmente mostra 3.500, vou tirar um printo e ponho já aqui!

Essa semana, no sábado, vamos transferí o Cpanel para um outro servidor com 2 processadores quad com 4mb de cache, 32gb de ram, e vamos montar Raid 6 com controladora (Hardware) para ver se com isso melhora.


Porém tenho uma dúvida: Devido a esse load alto, quando o load chega a 3.500 +- o processo do Exim para, ai os clientes não conseguem abrir nada, nem usar Outlook.

Gostaria de saber se pelo menos emergencialmente eu posso criar uma cron para ficar reiniciando o exim de x em x minutos, pois ele fica subindo muito o Load e cai com muita frequencia, e quando é restartado passa um período com o load baixo e vai subindo aos poucos.

Isso pode ser feito? Qual o comando eu teria que inserir na cron e onde colocar? Porque pelo whm não tem nada de cron, só no cpanel de usuário e no caso teria que ser como root.

Obrigado desde já.

0

#10 Membro offline   cadin 

  • Super Membro
  • PipPipPipPipPip
  • Grupo: Membros
  • Posts: 147
  • Cadastrado: 29-fevereiro 08

Posted 11 março 2009 - 10:31

Está ai o print blink.gif

Attached File(s)


0

#11 Membro offline   Martinewski 

  • Esse é irmão!!
  • PipPipPipPipPipPip
  • Grupo: Membros
  • Posts: 455
  • Cadastrado: 27-maio 08
  • Gender:Male
  • Location:Porto Alegre

Posted 11 março 2009 - 11:48

Pior é que o load está em 3 mil mesmo!
Tem que identificar se é um processo que está travando e deixando todos esses pendentes ou se é problema de IO de disco e por isso nenhum consegue finalizar.
Qual o intervalo entre os queue runs do seu exim?
0

#12 Membro offline   cadin 

  • Super Membro
  • PipPipPipPipPip
  • Grupo: Membros
  • Posts: 147
  • Cadastrado: 29-fevereiro 08

Posted 11 março 2009 - 01:20

QUOTE(Martinewski @ Mar 11 2009, 11:48 AM) <{POST_SNAPBACK}>
Pior é que o load está em 3 mil mesmo!
Tem que identificar se é um processo que está travando e deixando todos esses pendentes ou se é problema de IO de disco e por isso nenhum consegue finalizar.
Qual o intervalo entre os queue runs do seu exim?



Não alterei, creio que esteja no padrão. O padrão são uns 300s ? Qual é a linha da conf que altera os runs?
0

#13 Membro offline   cadin 

  • Super Membro
  • PipPipPipPipPip
  • Grupo: Membros
  • Posts: 147
  • Cadastrado: 29-fevereiro 08

Posted 11 março 2009 - 01:25

Pelo top, quando o load está subindo, eu observo que tem vários processos de envio da mensagens do exim, cada um consome em média 0.6% de CPU, sendo que como são muitos ao mesmo tempo a soma disso deve está contribuindo também para esse problema com Load
0

#14 Membro offline   Martinewski 

  • Esse é irmão!!
  • PipPipPipPipPipPip
  • Grupo: Membros
  • Posts: 455
  • Cadastrado: 27-maio 08
  • Gender:Male
  • Location:Porto Alegre

Posted 11 março 2009 - 01:44

QUOTE(cadin @ Mar 11 2009, 01:20 PM) <{POST_SNAPBACK}>
Não alterei, creio que esteja no padrão. O padrão são uns 300s ? Qual é a linha da conf que altera os runs?


Acho que é no TWEAK SETTINGS do WHM ou no EXIM CONFIG EDITOR. Em um dos dois encontrará... o padrão do CPanel é 1x por hora.
0

#15 Membro offline   cadin 

  • Super Membro
  • PipPipPipPipPip
  • Grupo: Membros
  • Posts: 147
  • Cadastrado: 29-fevereiro 08

Posted 11 março 2009 - 02:44

QUOTE(Martinewski @ Mar 11 2009, 01:44 PM) <{POST_SNAPBACK}>
Acho que é no TWEAK SETTINGS do WHM ou no EXIM CONFIG EDITOR. Em um dos dois encontrará... o padrão do CPanel é 1x por hora.


O queue runs faz o que exatamente? Processa a lista no tempo programado?

Você acha que devo aumentar ou diminuir esse tempo?
0

#16 Membro offline   Martinewski 

  • Esse é irmão!!
  • PipPipPipPipPipPip
  • Grupo: Membros
  • Posts: 455
  • Cadastrado: 27-maio 08
  • Gender:Male
  • Location:Porto Alegre

Posted 11 março 2009 - 02:50

Exato, Cadin. É nesse intervalo de tempo que o Exim roda todo o queue pra tentar entregar o que não conseguiu antes. Quando fechar esse tempo novamente, ele irá pegar tudo o que deu bounce e tentar entregar novamente, desde que os tempos de retry fechem.

Me diga uma coisa, essa quantidade enorme de emails que teu servidor está recebendo é legítima mesmo? Não está sendo usado p/ spam por gente de fora (que não clientes do provedor)?

Já usou o Configserver Mail Queues pra dar uma analisada nesse teu queue gigante?
0

#17 Membro offline   cadin 

  • Super Membro
  • PipPipPipPipPip
  • Grupo: Membros
  • Posts: 147
  • Cadastrado: 29-fevereiro 08

Posted 11 março 2009 - 03:00

QUOTE(Martinewski @ Mar 11 2009, 02:50 PM) <{POST_SNAPBACK}>
Exato, Cadin. É nesse intervalo de tempo que o Exim roda todo o queue pra tentar entregar o que não conseguiu antes. Quando fechar esse tempo novamente, ele irá pegar tudo o que deu bounce e tentar entregar novamente, desde que os tempos de retry fechem.

Me diga uma coisa, essa quantidade enorme de emails que teu servidor está recebendo é legítima mesmo? Não está sendo usado p/ spam por gente de fora (que não clientes do provedor)?

Já usou o Configserver Mail Queues pra dar uma analisada nesse teu queue gigante?



Sim, provavelmente tem gente de fora usando, ai é que está o motivo de eu ter criado o outro tópico querendo bloquear somente para as faixas do provedor, e os CLIENTES que forem solicitando para utilizar em outros provedores nós daremos o noss outro SMTP que é aberto, entendeu?

Esse Mail Queues que tu se refere é no próprio WHM ne, p/ ver a lista de e-mails da fila e etc? Se sim, já olhei e tem muito e-mail emperrado la, a gente tem feito a rotina de deletar tudo durante a madrugada, o pior é que a gente zera na madrugada e quando é pela manhã já tem 50mil na fila e vai subindo hehe.. wacko.gif
0

#18 Membro offline   Martinewski 

  • Esse é irmão!!
  • PipPipPipPipPipPip
  • Grupo: Membros
  • Posts: 455
  • Cadastrado: 27-maio 08
  • Gender:Male
  • Location:Porto Alegre

Posted 11 março 2009 - 04:57

QUOTE(cadin @ Mar 11 2009, 03:00 PM) <{POST_SNAPBACK}>
Sim, provavelmente tem gente de fora usando, ai é que está o motivo de eu ter criado o outro tópico querendo bloquear somente para as faixas do provedor, e os CLIENTES que forem solicitando para utilizar em outros provedores nós daremos o noss outro SMTP que é aberto, entendeu?

Esse Mail Queues que tu se refere é no próprio WHM ne, p/ ver a lista de e-mails da fila e etc? Se sim, já olhei e tem muito e-mail emperrado la, a gente tem feito a rotina de deletar tudo durante a madrugada, o pior é que a gente zera na madrugada e quando é pela manhã já tem 50mil na fila e vai subindo hehe.. wacko.gif


Olha, se alguém de fora está usando o servidor de vocês pra enviar spam, então isto é um problema de segurança e não de configuração ou aperfeiçoamento.
Na minha opinião também não é correto simplesmente ir lá e zerar o queue. Muita gente está perdendo email nessa atitude. E muitos emails destes podem ser importantes.

Faz um teste básico aqui http://www.spamhelp.org/shopenrelay/ para testar se o seu servidor está aberto. Se estiver, então tem que solucionar isto imediatamente, caso contrário vai cair em lista-negra e aí seus clientes terão sérios problemas para enviar emails.

Me manda uma MP com seu messenger ou equivalente, assim podemos conversar melhor.
0

#19 Membro offline   cadin 

  • Super Membro
  • PipPipPipPipPip
  • Grupo: Membros
  • Posts: 147
  • Cadastrado: 29-fevereiro 08

Posted 11 março 2009 - 05:07

QUOTE(Martinewski @ Mar 11 2009, 04:57 PM) <{POST_SNAPBACK}>
Olha, se alguém de fora está usando o servidor de vocês pra enviar spam, então isto é um problema de segurança e não de configuração ou aperfeiçoamento.
Na minha opinião também não é correto simplesmente ir lá e zerar o queue. Muita gente está perdendo email nessa atitude. E muitos emails destes podem ser importantes.

Faz um teste básico aqui http://www.spamhelp.org/shopenrelay/ para testar se o seu servidor está aberto. Se estiver, então tem que solucionar isto imediatamente, caso contrário vai cair em lista-negra e aí seus clientes terão sérios problemas para enviar emails.

Me manda uma MP com seu messenger ou equivalente, assim podemos conversar melhor.



Testing IP on port 25... successful! - the SMTP server is NOT an open relay.

Ok, valeu pela ajuda desde já!

This post has been edited by cadin: 11 março 2009 - 05:08

0

#20 Membro offline   little_oak 

  • Se às mãos fazem errar -> yum remove hands -y
  • PipPipPipPipPipPipPip
  • Grupo: Membros
  • Posts: 1165
  • Cadastrado: 19-julho 07
  • Gender:Male
  • Interests:Gnu/Linux, Windows Server, PHP, Mysql, Postgres, Ajax, Flex e Café, soldat, Warcraft, Quake, Counter Strike, Cachorros, Surf e tomar muito, mas muito café!

Posted 11 março 2009 - 09:19

Falaram acima, isso é I/O de disco.
Faz teste de smart e de badblocks no disco, verifica o cache do danado!

hdparm -tT /dev/sda (pode ser sdb, sdc e etc)

Veja como está o buffer e o cache (acima de 500 e 47 mb já é algo a se tolerar)

Olha também os badblocks:

badblock -v /dev/sda (sdb...)

Olha aí!

Abraços.
0

Share this topic:


  • 2 Pages +
  • 1
  • 2
  • You cannot start a new topic
  • You cannot reply to this topic

1 User(s) are reading this topic
0 membro(s), 1 visitante(s), 0 membro(s) anônimo(s)