`
minghe_zy
  • 浏览: 123754 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

清除html中多余代码

 
阅读更多

清理html代码中的多余代码

<script language="javascript">
<!--
function cleanWordHtml(html)
{
// Remove all SPAN tags
html = html.replace(/<\/?SPAN[^>]*>/gi, "");
// Remove Class attributes
html = html.replace(/<(\w[^>]*) class=([^ |>]*)([^>]*)/gi, "<$1$3") ;
// Remove Style attributes
html = html.replace(/<(\w[^>]*) style="([^"]*)"([^>]*)/gi, "<$1$3") ;
// Remove Lang attributes
html = html.replace(/<(\w[^>]*) lang=([^ |>]*)([^>]*)/gi, "<$1$3") ;
// Remove XML elements and declarations
html = html.replace(/<\\?\?xml[^>]*>/gi, "") ;
// Remove Tags with XML namespace declarations: <o:p></o:p>
html = html.replace(/<\/?\w+:[^>]*>/gi, "") ;
// Replace the &nbsp;
html = html.replace(/&nbsp;/, " " );
// Transform <P> to <DIV>
var re = new RegExp("(<P)([^>]*>.*?)(<\/P>)","gi") ; // Different because of a IE 5.0 error
html = html.replace( re, "<div$2</div>");
return html;
}
//-->
</script>
<p align="center">
清理前HTML代码:<br />
<textarea name="BeforeClean" rows="11" cols="55"><P>test</P>
<P>&nbsp;
<TABLE class=MsoNormalTable style="BORDER-RIGHT: medium none; BORDER-TOP: medium none; MARGIN-LEFT: 6.75pt; BORDER-LEFT: medium none; MARGIN-RIGHT: 6.75pt; BORDER-BOTTOM: medium none; BORDER-COLLAPSE: collapse; mso-border-alt: solid windowtext .5pt; mso-table-lspace: 9.0pt; mso-table-rspace: 9.0pt; mso-table-anchor-vertical: paragraph; mso-table-anchor-horizontal: column; mso-table-left: -21.6pt; mso-table-top: 76.05pt; mso-padding-alt: 0cm 5.4pt 0cm 5.4pt; mso-border-insideh: .5pt solid windowtext; mso-border-insidev: .5pt solid windowtext" cellSpacing=0 cellPadding=0 align=left border=1>
<TBODY>
<TR style="HEIGHT: 46pt; mso-yfti-irow: 0; mso-yfti-firstrow: yes">
<TD style="BORDER-RIGHT: windowtext 1pt solid; PADDING-RIGHT: 5.4pt; BORDER-TOP: windowtext 1pt solid; PADDING-LEFT: 5.4pt; PADDING-BOTTOM: 0cm; BORDER-LEFT: windowtext 1pt solid; WIDTH: 144pt; PADDING-TOP: 0cm; BORDER-BOTTOM: windowtext 1pt solid; HEIGHT: 46pt; mso-border-alt: solid windowtext .5pt" vAlign=top width=192>
<P class=MsoNormal style="mso-element: frame; mso-element-frame-hspace: 9.0pt; mso-element-wrap: around; mso-element-anchor-vertical: paragraph; mso-element-anchor-horizontal: column; mso-element-left: -21.55pt; mso-element-top: 76.05pt; mso-height-rule: exactly"><SPAN lang=EN-US style="FONT-SIZE: 14pt">aaaaaaaa<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /><o:p></o:p></SPAN></P></TD>
<TD style="BORDER-RIGHT: windowtext 1pt solid; PADDING-RIGHT: 5.4pt; BORDER-TOP: windowtext 1pt solid; PADDING-LEFT: 5.4pt; PADDING-BOTTOM: 0cm; BORDER-LEFT: medium none; WIDTH: 99pt; PADDING-TOP: 0cm; BORDER-BOTTOM: windowtext 1pt solid; HEIGHT: 46pt; mso-border-alt: solid windowtext .5pt; mso-border-left-alt: solid windowtext .5pt" vAlign=top width=132>
<P class=MsoNormal style="mso-element: frame; mso-element-frame-hspace: 9.0pt; mso-element-wrap: around; mso-element-anchor-vertical: paragraph; mso-element-anchor-horizontal: column; mso-element-left: -21.55pt; mso-element-top: 76.05pt; mso-height-rule: exactly"><SPAN lang=EN-US style="FONT-SIZE: 14pt">bbbbbbbbbb<o:p></o:p></SPAN></P></TD>
<TD style="BORDER-RIGHT: windowtext 1pt solid; PADDING-RIGHT: 5.4pt; BORDER-TOP: windowtext 1pt solid; PADDING-LEFT: 5.4pt; PADDING-BOTTOM: 0cm; BORDER-LEFT: medium none; WIDTH: 135pt; PADDING-TOP: 0cm; BORDER-BOTTOM: windowtext 1pt solid; HEIGHT: 46pt; mso-border-alt: solid windowtext .5pt; mso-border-left-alt: solid windowtext .5pt" vAlign=top width=180>
<P class=MsoNormal style="mso-element: frame; mso-element-frame-hspace: 9.0pt; mso-element-wrap: around; mso-element-anchor-vertical: paragraph; mso-element-anchor-horizontal: column; mso-element-left: -21.55pt; mso-element-top: 76.05pt; mso-height-rule: exactly"><SPAN lang=EN-US style="FONT-SIZE: 14pt">cccccccccc<o:p></o:p></SPAN></P></TD></TR>
<TR style="HEIGHT: 46pt; mso-yfti-irow: 1; mso-yfti-lastrow: yes">
<TD style="BORDER-RIGHT: windowtext 1pt solid; PADDING-RIGHT: 5.4pt; BORDER-TOP: medium none; PADDING-LEFT: 5.4pt; PADDING-BOTTOM: 0cm; BORDER-LEFT: windowtext 1pt solid; WIDTH: 144pt; PADDING-TOP: 0cm; BORDER-BOTTOM: windowtext 1pt solid; HEIGHT: 46pt; mso-border-alt: solid windowtext .5pt; mso-border-top-alt: solid windowtext .5pt" vAlign=top width=192>
<P class=MsoNormal style="mso-element: frame; mso-element-frame-hspace: 9.0pt; mso-element-wrap: around; mso-element-anchor-vertical: paragraph; mso-element-anchor-horizontal: column; mso-element-left: -21.55pt; mso-element-top: 76.05pt; mso-height-rule: exactly"><SPAN lang=EN-US style="FONT-SIZE: 14pt">dddddddddd<o:p></o:p></SPAN></P></TD>
<TD style="BORDER-RIGHT: windowtext 1pt solid; PADDING-RIGHT: 5.4pt; BORDER-TOP: medium none; PADDING-LEFT: 5.4pt; PADDING-BOTTOM: 0cm; BORDER-LEFT: medium none; WIDTH: 99pt; PADDING-TOP: 0cm; BORDER-BOTTOM: windowtext 1pt solid; HEIGHT: 46pt; mso-border-alt: solid windowtext .5pt; mso-border-left-alt: solid windowtext .5pt; mso-border-top-alt: solid windowtext .5pt" vAlign=top width=132>
<P class=MsoNormal style="mso-element: frame; mso-element-frame-hspace: 9.0pt; mso-element-wrap: around; mso-element-anchor-vertical: paragraph; mso-element-anchor-horizontal: column; mso-element-left: -21.55pt; mso-element-top: 76.05pt; mso-height-rule: exactly"><SPAN lang=EN-US style="FONT-SIZE: 14pt">eeeeeeeeee<o:p></o:p></SPAN></P></TD>
<TD style="BORDER-RIGHT: windowtext 1pt solid; PADDING-RIGHT: 5.4pt; BORDER-TOP: medium none; PADDING-LEFT: 5.4pt; PADDING-BOTTOM: 0cm; BORDER-LEFT: medium none; WIDTH: 135pt; PADDING-TOP: 0cm; BORDER-BOTTOM: windowtext 1pt solid; HEIGHT: 46pt; mso-border-alt: solid windowtext .5pt; mso-border-left-alt: solid windowtext .5pt; mso-border-top-alt: solid windowtext .5pt" vAlign=top width=180>
<P class=MsoNormal style="mso-elem:)ent: frame; mso-element-frame-hspace: 9.0pt; mso-element-wrap: around; mso-element-anchor-vertical: paragraph; mso-element-anchor-horizontal: column; mso-element-left: -21.55pt; mso-element-top: 76.05pt; mso-height-rule: exactly"><SPAN lang=EN-US style="FONT-SIZE: 14pt">fffffffffff<o:p></o:p></SPAN></P></TD></TR></TBODY></TABLE></P></textarea><br />
清理后HTML代码:<br />
<textarea name="AfterClean" rows="11" cols="55"></textarea><br /><br />
<input type="button" name="Clean" value="Clean" onclick="AfterClean.value=cleanWordHtml(BeforeClean.value);">
</p>

分享到:
评论

相关推荐

    星级评分JS-简洁美观干净已经去除多余代码

    星级评分JS-简洁美观干净已经去除多余代码

    html全屏控制控件-简洁干净已经去除多余代码

    html全屏控制控件-简洁干净已经去除多余代码

    多余css清除工具 1.1版本

    仿站利器,下载目标网站的时候,会附加很多多余的css样式,影响加载,或者再优化页面的时候,对css样式进行精简,去除多余css样式,删除多余css代码,可以参考使用本工具 注:此工具不对原有css样式进行压缩优化,...

    php过滤危险html代码

    "/\s+/", //过滤多余的空白 "/&lt;(\/?)(script|i?frame|style|html|body|title|link|meta|\?|\%)([^&gt;]*?)&gt;/isU", //过滤 等可能引入恶意内容或恶意改变显示布局的代码,如果不需要插入flash等,还可以加入的过滤 "/(...

    笔趣阁网站小说源码搭建

    去除多余的代码 程序稳定无卡顿,笔趣阁小说整站源码+采集器+可用采集规则+APP+教程全部覆盖打包 仿2019最新笔趣阁小说全套源码包含有: 1,笔趣阁模板小说程序(杰奇CMS内核二开) 2,手机站wap 3,安卓封装APP 4,...

    规范HTML代码可以节省修改代码的时间

    在这个教程里着重讲如何规范的来写HTML代码让它更加的有意义.你有没有经历过这样的场景:在编缉别人的模版时发现那些语意不明的标签,你的感觉是什么样子的.学完这个教程后你会发现规范的代码不仅仅为你以后修改代码省...

    使用正则表达式去除所有html标签只保留文字

    主要介绍了使用正则表达式去除所有html标签只保留文字效果,本文给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友参考下吧

    bootstrap-multiselect精简可以直接放入代码的例子

    去官网上下载过来的bootstrap-multiselect,经过精简,去除多余的文件和代码,提供给大家使用。里面的test.html可以参考调用。

    JAVA上百实例源码以及开源项目源代码

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    js过滤HTML标签以及空格的思路及代码

    //去除HTML tagstr.value = str.replace(/[ | ]*\n/g,’\n’); //去除行尾空白//str = str.replace(/\n[\s| | ]*\r/g,’\n’); //去除多余空行return str;} 测试的时候发现这段代码不能过滤掉网页中空格字符(即: ...

    去掉代码空白行

    将文件(.java/.jsp/.html/.htm)中的空白行去掉 使用方法: 将deleteBlank.exe 文件放到要更新的文件夹中,双击即可 1.0.2 修改了空白格只有空格无法去掉的问题 1.0.3 修改文件中有汉字时,处理后,汉字部分变为...

    代码重构:作业1到期627

    为了获得更有效的代码,我努力在整个代码中减少div标签的使用。 在这种情况下,我能够消除除一个div标签以外的所有标签。 取而代之的是,我能够利用更准确的语义HTML元素。 另一个重要的更改涉及消除css文件中的...

    简单的CSS 下拉导航菜单实现代码

    在这个导航菜单中Portfolio项下有一个子菜单,我用粗体表示出来,最后说一句别忘了关闭(可以看这个:css技巧-清除多余的标签让代码更加有意义) HTML代码 复制代码代码如下: ”nav”&gt; &lt;ul&gt; ”first”&gt;&lt;a&gt;Home&lt;/a&gt;&lt;/li&gt; ...

    精易模块[源码] V5.15

    4、修正“文本_逐字分割”返回数组不清除会保留上次内容的问题,感谢易友【@JadeジYu】反馈。 5、新增“文本_是否为双字节字符”与OPenGL支持库-&gt;文字轮廓 中的 是否为双字节字符功能相同。 6、新增“文本_是否为...

    去除字符串左右两边的空格(实现代码)

    在日常工作中,过滤表单中的一些特殊的字符是很常见的功能,比如文本中要求输入单纯的数字,但用户有时会误输入一些多余的空格或其他字符混合的文本,这显然不符合输入要求。 下面一起来学习怎么样去除字符串左右...

    Microsoft Office 2000 HTML filter 2.0

    可以用来处理掉word2000转html时出现的多余代码。 可以为用Word 2000等编辑生成的HTML文件清除Office-specific标记等内容,而不影响WEB页面在浏览器中的显示效果。 如果双击安装不了,右键解压缩,再执行其中msi...

    FCKEditor 一款开源的非常优秀的WEB在线编辑器

    一、对"插入/编辑超链接"功能进行了彻底简化,不可否认源代码中考虑了超链接的几乎所有应用情景,非常之完善和全面,甚至提供了服务器目录的浏览和文件上传功能, 但这也恰恰暴露了更多的安全隐患,参考了各大网站的...

    java源码包2

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

Global site tag (gtag.js) - Google Analytics