<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Sat, Nov 1, 2014 at 6:08 PM, Dave Horsfall <span dir="ltr"><<a href="mailto:dave@horsfall.org" target="_blank">dave@horsfall.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><span class="">On Sat, 1 Nov 2014, Tom Mitchell wrote:<br>
<br>
> FWIW:   The alpha particle cause mostly does not apply.  There was a<br>
> case at IBM where contamination of packages did cause Alpha particle bit<br>
</span>> flips [...]<br>
<br>
I'm surprised.  Everything I was taught about alpha particles (i.e. helium<br>
nuclei) was that just a sheet of paper will stop them.  Or is this alpha<br>
decay from within, as you seem to imply?<br></blockquote><div><br></div><div>Yes...</div><div>The IBM issue was contaminated ceramic packaging material and</div><div>was  an eye opener.   The IBM case is commonly used in a problem</div><div>solving case in a training program for the "is and is-not folk".  I forget</div><div>the product name that uses it.   And yes a thin layer of foil or paper</div><div>can be expected to stop alpha particles.  Even a thin layer of gold leaf</div><div>at near three atoms thick can be enough.</div><div><br></div><div>The IBM issue dates for the '70s if I recall correctly feature size and process</div><div>were large and it did that a very energetic interaction to flip the bit.</div><div><br></div><div>The modern issue is cosmic rays of astounding energy.  <a href="http://en.wikipedia.org/wiki/Soft_error">http://en.wikipedia.org/wiki/Soft_error</a><br>Cosmic rays creating energetic neutrons and protons that penetrate </div><div>modern packages and interact with the contents of the package.</div><div>Modern package material is quite free of this type of contamination.</div><div>As feature size shrinks this gets more and more interesting...</div><div><br></div><div>By looking at ECC error counts... (need hardware support) over time </div><div>it is easy to measure the altitude difference of two largeish clusters of </div><div>machines packed with DRAM.</div><div><br></div><div>A parity only machine can have its uptime increased by enhancements</div><div>to the parity exception handler.    Bits on disk can be copied back to RAM</div><div>and the instruction restarted.  Other long lived data structures can be</div><div>reinforced by vertical parity to compliment  hardware parity.</div><div><br></div><div>There are many error correcting codes and I do recommend them for</div><div>data of any value.   It is not sufficient to have a checksum to detect an error.</div><div>A correcting code used on files like this is a solved problem.   Anyone </div><div>filing such a patent should be scolded and laughed out of the room</div><div>unless it is strategic to make sure some troll does not rush to the office</div><div>first.   As for trolls,  pick up the phone and accuse them of stealing secrets </div><div>from a TLA.</div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature"><div dir="ltr">  T o m    M i t c h e l l</div></div>
</div></div>