正则表达是解析HTML元素的代码记录

来源:转载

                如果我们要解析一个html,想要得到界面里的某个标签值,那么用正则表达式比较方便。

                比如,我们获得了一个html界面,想获得某个标签的值(这个标签有唯一属性比如id=xxx,如果该类标签没有唯一属性的话,那么将会得到该类标签所有值),

                代码展示如下:

                 private string GetValue(string data)
                   {
                         string returnStr = "";     
                         MatchCollection mc = Regex.Matches(data, "<td id='cur_no2' .*?>.*?</td>");  //做一个要匹配的正则表达式, .*?表示所有的元素
                        foreach (Match m in mc)               //遍历匹配好的标签
                        {
                           string str = m.Value.Replace("</td>", "");   //去掉标签后缀,用“”代替</td>
                           str = Regex.Replace(str, "<.*?>", "");         // 去掉标签前缀,用“”代替<.*?>
                           returnStr += str;          //如果匹配多个标签,那么标签里面的值拼接
                        }
                                 return returnStr;  
                   }

               

分享给朋友:
您可能感兴趣的文章:
随机阅读: