/s]+))/s*[^>]*>";2,得到网页的标题:            string" />
入门客AI创业平台(我带你入门,你带我飞行)
博文笔记

正则表达式,在html标签上的应用

创建时间:2010-08-18 投稿人: 浏览次数:1565

1,得到网页上的链接地址:
      string matchString = @"<a[^>]+href=/s*(?:"(?<href>[^"]+)"|""(?<href>[^""]+)""|(?<href>[^>/s]+))/s*[^>]*>";
2,得到网页的标题:
           string matchString = @"<title>(?<title>.*)</title>";
3,去掉网页中的所有的html标记:
           string temp = Regex.Replace(html, "<[^>]*>", "");        //html是一个要去除html标记的文档
        java 中去掉网页中的所有标签
           str = str.replaceAll("<[^>]*>", "");
4, string matchString = @"<title>([/S/s/t]*?)</title>";

5,js去掉所有html标记的函数:
           function delHtmlTag(str)
          {
             return str.replace(/<//?.+?>/g,"");//去掉所有的html标记
          }
        这个可能IE5会错,那用这个,梅花的:
         function delHtmlTag(str)
{
        return str.replace(/<[^>]+>/g,"");//去掉所有的html标记
}

声明:该文观点仅代表作者本人,入门客AI创业平台信息发布平台仅提供信息存储空间服务,如有疑问请联系rumenke@qq.com。