Discussion:
Problemen op een virtuele machine
(te oud om op te antwoorden)
Paul van der Vlis
2022-10-03 12:19:21 UTC
Permalink
Hoi,

Een nieuwe klant van mij heeft vele virtuele machines bij TransIP. Een
van deze machines valt ongeveer dagelijks uit.

Er staat niets in de logs, anders dan "^@^@^@^@^@^@^@^@^@", en dat veel
langer. Weet iemand wat dat betekent? Blijkbaar kan iets toch nog wat
schrijven naar disk, waarom dan niet een wat duidelijker melding? Of
wordt dit geschreven bij het booten?

SSH en ping werken niet tijdens zo'n storing. Ook is de machine tijdens
zo'n storing niet te bereiken op de console. Daarop is nog wel beeld te
zien, maar hij reageert niet op toetsenbord input. Waarschijnlijk is het
beeld oud.

TransIP heeft de machine zaterdag gemigreerd naar andere hardware, maar
gisteravond ging het weer mis. Lijkt dus niet opgelost.

Na een reboot doet alles het dan gewoon weer.

Volgens de grafiek van TransIP draait de processor nog wel tijdens de
storing, maar helemaal constant. Ik denk dat dit niet klopt.

Heeft er iemand tips of ideeën?

Het is een hosting machine met Ubuntu 20.04 waarop dingen draaien als
Apache en Dovecot. Er is geen hoge load.

Groet,
Paul
--
Paul van der Vlis Linux systeembeheer Groningen
https://vandervlis.nl
Jan van den Broek
2022-10-03 13:42:47 UTC
Permalink
Post by Paul van der Vlis
Hoi,
Een nieuwe klant van mij heeft vele virtuele machines bij TransIP. Een
van deze machines valt ongeveer dagelijks uit.
langer. Weet iemand wat dat betekent?
Dit doet mij denken dat er een blok met NULL-characters ('\0')
weggeschreven wordt, maar wat dat als oorzaak kan hebben durf ik je niet
tezeggen.

[Schnipp]
--
Jan v/d Broek
***@dds.nl
tjoen
2022-10-04 05:30:06 UTC
Permalink
Post by Paul van der Vlis
Een nieuwe klant van mij heeft vele virtuele machines bij TransIP. Een
van deze machines valt ongeveer dagelijks uit.
langer. Weet iemand wat dat betekent? Blijkbaar kan iets toch nog wat
schrijven naar disk, waarom dan niet een wat duidelijker melding?  Of
wordt dit geschreven bij het booten?
Gebuik je journalctl?
Paul van der Vlis
2022-10-04 09:06:04 UTC
Permalink
Post by tjoen
Post by Paul van der Vlis
Een nieuwe klant van mij heeft vele virtuele machines bij TransIP. Een
van deze machines valt ongeveer dagelijks uit.
veel langer. Weet iemand wat dat betekent? Blijkbaar kan iets toch nog
wat schrijven naar disk, waarom dan niet een wat duidelijker melding?
Of wordt dit geschreven bij het booten?
Gebuik je journalctl?
Ja, dat staat er ook op. Maar ik haal die ^@^@ uit /var/log/syslog.

Ik heb ook nog gekeken met atop tot vlak voor het uit de lucht gaan, en
alles was goed qua CPU load, geheugen, disk I/O, netwerkverkeer.
Heel bruikbaar dat atop ;-)

Het Linux kernel heb ik gisteren vervangen door een andere, sindsdien
gaat het nu bijna een dag goed. Zegt nog niet veel.

De VPS is zaterdag verhuist naar andere hardware. Daarna is hij nog 1x
uit de lucht gegaan. De migratie heeft live plaatsgevonden, het zou
misschien kunnen dat hij iets raars heeft meegenomen van de andere
hardware, geen idee.

Mochten jullie mogelijke oorzaken weten voor een dergelijk probleem, dan
zou ik dat graag willen weten.

Een mogelijke oorzaak lijkt mij een bug in het Linux kernel. Dat heb ik
vervangen door een nieuwere versie.

Verder hardware, maar de VPS is dus gemigreerd naar andere hardware.

Groet,
Paul
--
Paul van der Vlis Linux systeembeheer Groningen
https://vandervlis.nl
Loading...