<br><br><div class="gmail_quote">2008/12/7 Stephen Nelson-Smith <span dir="ltr"><<a href="mailto:sanelson@gmail.com">sanelson@gmail.com</a>></span><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<br>
<br>
So far all I've done is use lsof and look at the major and minor device<br>
numbers and mount points - but this really doesn't tell me much.<br>
</blockquote><div><br>Don't forget about 'fuser' also.<br><br>You should be looking at I/O elevator tuning I think - but as you say, you should<br>be looking at finding what processes are responsible first.<br>
<br></div></div>Once you've identified the processes and disk devices which are causing the problems,<br>then maybe a bit of lateral thought can help. As a for instance, one of the applications I'm familiar with, Ganglia, uses a round-robin-tool database, which is frequently updated with information from Beowulf cluster nodes - so frequently that on a big cluster the didks are just continually busy. The recognised fix is to write the data to a RAMdisk then flush to real disk every so often. <br>