<br><br><div class="gmail_quote"><div dir="ltr">On Sun, 15 Oct 2017, 21:34 James A. Donald, <<a href="mailto:jamesd@echeque.com">jamesd@echeque.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">An arbitrary and possibly hostile web page passes through proxy or a<br>
server, which makes a record of it.<br>
<br>
Is there any easy way to filter that web page, stripping out javascript<br>
and links to outside images and such, so that record is guaranteed to<br>
display the same way, or closely equivalent way, as the original?<br></blockquote></div><div><br></div><div>For arbitrary content I'd have thought it wasn't possible. Imagine trying to pass Google Inbox through a service such as this, you'd never be able to recreate the content in just HTML.</div><div><br></div><div>Robin</div><div><br></div><div><br></div><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
Seems to me this is a job for an html compiler, that you need to parse<br>
it, filter the parse tree, and then regenerate the vanilla html document<br>
from the parse tree.  Which sounds like a great deal of work.<br>
<br>
But there are lots of services that allow one client to generate html<br>
that will be seen in their web page by another client.  Which gives Bob<br>
the potential to doing surprising things to Carol's subscription when<br>
Carol views content supplied by Bob, so this problem, or somewhat<br>
similar problems, must have been solved many times before, the problem<br>
of rendering html incapable of doing surprising things.<br>
<br>
_______________________________________________<br>
The cryptography mailing list<br>
<a href="mailto:cryptography@metzdowd.com" target="_blank">cryptography@metzdowd.com</a><br>
<a href="http://www.metzdowd.com/mailman/listinfo/cryptography" rel="noreferrer" target="_blank">http://www.metzdowd.com/mailman/listinfo/cryptography</a></blockquote></div>