<br><br><div class="gmail_quote">On Wed, Apr 8, 2009 at 4:11 PM, Peter Corlett <span dir="ltr"><<a href="mailto:abuse@cabal.org.uk">abuse@cabal.org.uk</a>></span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
On Wed, Apr 08, 2009 at 04:01:40PM +0100, <a href="mailto:damion.yates@gmail.com">damion.yates@gmail.com</a> wrote:<br>
[...]<br>
<div class="im">> Maybe I'm missing something but it looks like this will blat a file of<br>
> name $path every time it changes (back), so if a log entry contains<br>
> 05/Mar/2009 and then 06/Mar/2009, but later returns to 05/Mar/2009, you<br>
> wipe all previously logged 05/Mar/2009 entries.<br>
<br>
> It might sound a little unlikely, but perhaps the user-fed-in data (the<br>
> <>), might contain some multiple, overlapping logs, maybe part of a pipe<br>
> from zcat, or apache processes/threads might write either side of<br>
> midnight?<br>
<br>
</div>Yes, this is a bug I spotted after posting. Use '>>' instead of '>'.<br>
<div class="im"><br>
> Maybe your regex (which should use \d and \w where necessary and be bound<br>
> by \s), will match a referrer (user's browser supplied), which isn't<br>
> escaped and so could contain the [ and / around the right number of<br>
> characters?<br>
<br>
</div>That shouldn't matter in this specific case because the regex will only<br>
match the *first* matching string, which will always be the date field.<br>
Whether \d and \w "should" be used is very much a matter of taste.<br>
<div><div></div><div class="h5"><br>
--<br>
Gllug mailing list  -  <a href="mailto:Gllug@gllug.org.uk">Gllug@gllug.org.uk</a><br>
<a href="http://lists.gllug.org.uk/mailman/listinfo/gllug" target="_blank">http://lists.gllug.org.uk/mailman/listinfo/gllug</a></div></div></blockquote><div><br>Thats great, thanks for explaining the script also gives me a much better understanding and I hope I will be writing similar in the not to distant future.<br>
<br>Will<br></div></div><br>