Files Descriptor leak

5 risposte [Ultimo messaggio]
Ritratto di Roberto Simone
Roberto Simone
(Junior)
Offline
Junior
Iscritto: 27/08/2011
Messaggi: 20

Ciao a tutti.
Sul mio vecchio portatile, un Dell inspiron 6400, ho installata una distribuzione Mageia 2 con kernel 3.4.34 e come ambiente grafico uso Kde4 (versione 4.8.5). Di solito non spengo mai il pc: semplicemente chiudo lo schermo e il pc va in sospensione.
Da qualche mese - me ne sono accorto a fine novembre - ogni tanto (diciamo ogni due-tre settimane) l'ambiente grafico sembra andare come in crash e non risponde più. Allora provo a riavviare Kde4, ma dopo il riavvio alcuni programmi non partono più (per esempio firefox) o funzionano male (esempio: chrome non riesce ad accedere alla pagina di gmail, nella konsole i comandi non sono eseguiti restando come sospesi etc...). Quindi riavvio l'intero sistema e tutto torna a posto.
Inizialmente non ci ho dato molto peso. Poi un giorno mi sono deciso a guardare i file di log è ho trovato una sfilza senza fine di:
VFS: file-max limit reachead
che significa che il sistema ha troppi files descriptor aperti. Per la cronaca: il limite è di 206374!
Così ho scritto un banalissimo script che ho fatto girare ogni ora (tramite cron) per monitorare il numero di file aperti, leggendo tale numero sia dal file  /proc/sys/fs/file-nr sia attraverso il comando lsof |wc -l.
Ebbene: il risultato è che secondo file-nr il numero di file aperti continua ad aumentare nel tempo (circa 2-300 files descriptor almento in più ogni ora) mentre lsof mostra un numero di file sostanzialmente stabile (dell'ordine di 50000).
Girando in rete ho trovato un bug praticamente identico segnalato recentemente su un'altra distribuzione: https://bugs.archlinux.org/task/33697?dev=162, ma non ancora risolto.
Vorrei sapere se qualcuno di voi:
1) sa qualcosa relativamente a questo problema, nel caso se è legato al kernel all'ambiente grafico o a qualche altro programma
2) conosce altri comandi o qualche modo per scoprire chi e perché si perde questi file
3) ha problemi simili o può controllare se nel suo sistema il numero di file aperti riportato in /proc/sys/fs/file-nr cresce costantemente al passare del tempo o rimane stabile.
Scusandomi per la lunghezza del post, e nella speranza di essere stato sufficientemente chiaro vi saluto e vi ringrazio per l'attenzione.
Roberto

Ritratto di killer1987
killer1987
(Webmaster)
Offline
Webmaster
Iscritto: 02/05/2011
Messaggi: 663

ciao,

essendo un problema abbastanza specifico forse ti conviene aprire un bug report in bugzilla:

http://bugs.mageia.org/

io non saprei da dove iniziare... fammi sapere

ciao

Alé Mageia, C'mon Mageia!!! SAMSUNG RC530, Nvidia GM5400, stamp HP Laserjet 1018, scanner Epson Perfection 3490

Ritratto di Roberto Simone
Roberto Simone
(Junior)
Offline
Junior
Iscritto: 27/08/2011
Messaggi: 20

Grazie per la risposta.
Però se usi Mageia 2, potresti verificare se il problema esiste anche sul tuo sistema?
Basta solo eseguire:
sudo cat /proc/sys/fs/file-nr
e verificare se il numero di file descriptor aumenta al passare del tempo.
Il mio sospetto è che sia un baco del kernel.
Roberto

Ritratto di killer1987
killer1987
(Webmaster)
Offline
Webmaster
Iscritto: 02/05/2011
Messaggi: 663

ecco il mio output:

[root@localhost ~]# cat /proc/sys/fs/file-nr
12480 0 611608

e questo è lo stesso output dopo un'ora:

[root@localhost ~]# cat /proc/sys/fs/file-nr
9600 0 611608

direi che da me il problema non si verifica. uso l'ultimo kernel server per architettura i686. fammi sapere

ciao
Marcello

Alé Mageia, C'mon Mageia!!! SAMSUNG RC530, Nvidia GM5400, stamp HP Laserjet 1018, scanner Epson Perfection 3490

Ritratto di Roberto Simone
Roberto Simone
(Junior)
Offline
Junior
Iscritto: 27/08/2011
Messaggi: 20

Grazie Marcello.
Sto facendo un po' di prove per esclusione, cioè partendo da un avvio ridotto al minimo (senza neanche l'interfaccia grafica) e aggiungendo via via tutti i servizi e i programmi che sono solito usare.
Allo stato mi sento di escludere che sia un problema di kernel, che sia un problema del server grafico e di kde4. A quanto pare deve essere qualche specifico programma che genera il problema.
Appena ne so di più ti aggiorno.
Roberto.

Ritratto di Roberto Simone
Roberto Simone
(Junior)
Offline
Junior
Iscritto: 27/08/2011
Messaggi: 20

Dopo un fine settimana di test sono giunto alla conclusione che il problema sia generato da Dropbox (ho provato sia la versione 1.6.16 che la versione 1.6.17)
Io lo uso per sincronizzare la cartella di posta elettronica (dopo averla criptata con encfs) ed era uno dei programmi avviati automaticamente dopo il login in kde e attivo per tutta la sessione.
Spegnendolo il problema non è più presente.
Credo che abbia anche una cattiva gestione della memoria: pur avendo il mio pc solo 2 Gb di ram, senza dropbox la swap è del tutto inutilizzata mentre con dropbox attivo l'utilizzo della swap cresceva anch'essa in funzione del tempo...
Ho provato a fare una ricerca (molto veloce in verità) su internet ma non ho trovato nessuno che lamentasse problemi analoghi.
In ogni caso, dal momento che non esiste un pacchetto Dropbox per Mageia (si installa scaricandolo dal sito relativo) non credo che ci sia nulla da segnalare a Mageia.
Roberto