正则表达式提取html内容
很多时候我们想从一段html中找到需要的。
比如有一段html

Code
<!--
Code highlighting produced by Actipro CodeHighlighter (freeware)
http://www.CodeHighlighter.com/
-->some do<div class ="postTitle"><a id="homepage1_HomePageDays_DaysList_ctl01_DayItem_DayList_ctl02_TitleUrl" class="postTitle2" href="http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html">把一个sql where表达式转化为一个二叉树</a>ddd<div>1 <div >2</div></div></div><br />如题。比如我们有一个sql<br />select a.id from b ,c<br />where<br /> (b.id=c.id) and ((b.code="a" and c.code="d") or b.name="c" )<br /><br />将 where 后面的表达式转化为二叉树.<br /><br /><br />:( 俺也不会<br />有空研究研究<div class = "postDesc">posted @ <a href="http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html" Title = "permalink">2009-09-28 17:02</a> netfuns 阅读(45) | <a href="http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html#FeedBack" Title = "comments, pingbacks, trackbacks">评论 (0)</a> | <a href="http://www.cnblogs.com/netfuns/admin/EditPosts.aspx?postid=1575829">编辑</a>
<div id=level1>level1
<div id=level2>level2
<div>level3</div>
<div/>
</div>
</div> some end
正则1:<div class ="postTitle">(?<name>[sS]+?)</div>
结果为
<div class ="postTitle">dddd<a id="homepage1_HomePageDays_DaysList_ctl01_DayItem_DayList_ctl02_TitleUrl" class="postTitle2" href="<A" target="_blank" rel="nofollow">http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html">把一个sql where表达式转化为一个二叉树</a>ddd<div>1 <div >2</div>
说明不能嵌套。但对于简单的标记是可以了。
正则2 :
<div class ="postTitle">(?<mycontent>[sS]+)</div>
结果:
得到整个div,包括嵌套的内容.
说明对于嵌套的html标记内容提取是可以的
比如有一段html
<!--
Code highlighting produced by Actipro CodeHighlighter (freeware)
http://www.CodeHighlighter.com/
-->some do<div class ="postTitle"><a id="homepage1_HomePageDays_DaysList_ctl01_DayItem_DayList_ctl02_TitleUrl" class="postTitle2" href="http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html">把一个sql where表达式转化为一个二叉树</a>ddd<div>1 <div >2</div></div></div><br />如题。比如我们有一个sql<br />select a.id from b ,c<br />where<br /> (b.id=c.id) and ((b.code="a" and c.code="d") or b.name="c" )<br /><br />将 where 后面的表达式转化为二叉树.<br /><br /><br />:( 俺也不会<br />有空研究研究<div class = "postDesc">posted @ <a href="http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html" Title = "permalink">2009-09-28 17:02</a> netfuns 阅读(45) | <a href="http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html#FeedBack" Title = "comments, pingbacks, trackbacks">评论 (0)</a> | <a href="http://www.cnblogs.com/netfuns/admin/EditPosts.aspx?postid=1575829">编辑</a>
<div id=level1>level1
<div id=level2>level2
<div>level3</div>
<div/>
</div>
</div> some end
正则1:<div class ="postTitle">(?<name>[sS]+?)</div>
结果为
<div class ="postTitle">dddd<a id="homepage1_HomePageDays_DaysList_ctl01_DayItem_DayList_ctl02_TitleUrl" class="postTitle2" href="<A" target="_blank" rel="nofollow">http://www.cnblogs.com/netfuns/archive/2009/09/28/1575829.html">把一个sql where表达式转化为一个二叉树</a>ddd<div>1 <div >2</div>
说明不能嵌套。但对于简单的标记是可以了。
正则2 :
<div class ="postTitle">(?<mycontent>[sS]+)</div>
结果:
得到整个div,包括嵌套的内容.
说明对于嵌套的html标记内容提取是可以的
声明:该文观点仅代表作者本人,入门客AI创业平台信息发布平台仅提供信息存储空间服务,如有疑问请联系rumenke@qq.com。
- 上一篇: 匹配获取HTML标签属性的正则 表达式
- 下一篇:没有了
