首页 > 编程 > Regex > 正文

C#正则表达式实现Ubb解析类的代码

2020-03-16 21:21:22
字体:
来源:转载
供稿:网友
解析得到的代码能通过XHTML 1.0 STRICT验证; 
包含了标题,链接,字体,对齐,图片,引用,列表等方面的功能.  
Ubb.ReadMe.htm
  1.     <div id="ubb">   
  2.       <h1>UBB代码说明</h1>   
  3.  
  4.       <h2>标题</h2>   
  5.       <dl>   
  6.         <dt>[h1]标题一[/h1]</dt>   
  7.         <dd><h1>标题一</h1></dd>   
  8.         <dt>[h2]标题二[/h2]</dt>   
  9.  
  10.         <dd><h2>标题二</h2></dd>   
  11.         <dt>[h1]标题三[/h1]</dt>   
  12.         <dd><h3>标题三</h3></dd>   
  13.         <dt>[h4]标题四[/h4]</dt>   
  14.         <dd><h4>标题四</h4></dd>   
  15.         <dt>[h5]标题五[/h5]</dt>   
  16.  
  17.         <dd><h5>标题五</h5></dd>   
  18.         <dt>[h6]标题六[/h6]</dt>   
  19.         <dd><h6>标题六</h6></dd>   
  20.       </dl>   
  21.       <h2>链接</h2>   
  22.       <dl>   
  23.         <dt>[url]www.unibetter.com[/url]</dt>   
  24.  
  25.         <dd><a rel="nofollow" href="http://www.unibetter.com">unibetter.com</a></dd>   
  26.         <dt>[url]http://www.unibetter.com[/url]</dt>   
  27.         <dd><a rel="nofollow" href="http://www.unibetter.com">http://www.unibetter.com</a></dd>   
  28.         <dt>[url=http://www.unibetter.com]unibetter大学生论坛[/url]</dt>   
  29.         <dd><a rel="nofollow" href="http://www.unibetter.com" title="unibetter大学生论坛">unibetter大学生论坛</a></dd>   
  30.         <dt>[email]none@none.com[/email]</dt>   
  31.  
  32.         <dd><a href="mailto:none@none.com">none@none.com</a></dd>   
  33.       </dl>   
  34.       <h2>字体大小</h2>   
  35.       <dl>   
  36.         <dt>[size=xx-small]文字大小[/size]</dt>   
  37.         <dd><span style="font-size:xx-small">文字大小</span></dd>   
  38.         <dt>[size=x-small]文字大小[/size]</dt>   
  39.  
  40.         <dd><span style="font-size:x-small">文字大小</span></dd>   
  41.         <dt>[size=small]文字大小[/size]</dt>   
  42.         <dd><span style="font-size:small">文字大小</span></dd>   
  43.         <dt>[size=medium]文字大小[/size]</dt>   
  44.         <dd><span style="font-size:medium">文字大小</span></dd>   
  45.         <dt>[size=large]文字大小[/size]</dt>   
  46.  
  47.         <dd><span style="font-size:large">文字大小</span></dd>   
  48.         <dt>[size=x-large]文字大小[/size]</dt>   
  49.         <dd><span style="font-size:x-large">文字大小</span></dd>   
  50.         <dt>[size=xx-large]文字大小[/size]</dt>   
  51.         <dd><span style="font-size:xx-large">文字大小</span></dd>   
  52.       </dl>   
  53.  
  54.       <h2>字体格式</h2>   
  55.       <dl>   
  56.         <dt>[font=黑体]文字字体[/font]</dt>   
  57.         <dd><span style="font-family:黑体">文字字体</span></dd>   
  58.         <dt>[color=red]文字颜色[/color]</dt>   
  59.         <dd><span style="color:red">文字颜色</span></dd>   
  60.  
  61.         <dt>[color=#0000ff]文字颜色[/color]</dt>   
  62.         <dd><span style="color:#0000ff">文字颜色</span></dd>   
  63.         <dt>[b]粗体字[/b]</dt>   
  64.         <dd><strong>粗体字</strong></dd>   
  65.         <dt>[i]斜体字[/i]</dt>   
  66.         <dd><i>斜体字</i></dd>   
  67.  
  68.         <dt>[u]下划线[/u]</dt>   
  69.         <dd><span style="text-decoration:underline">下划线</span></dd>   
  70.       </dl>   
  71.     </div>   
  72.     <h2>对齐</h2>   
  73.     <dl>   
  74.         <dt>[left]左对齐[/left]</dt>   
  75.  
  76.         <dd><div style="text-align:left">左对齐</div></dd>   
  77.         <dt>[right]右对齐[/right]</dt>   
  78.         <dd><div style="text-align:right">右对齐</div></dd>   
  79.         <dt>[center]右对齐[/center]</dt>   
  80.         <dd><div style="text-align:center">居中</div></dd>   
  81.     </dl>   
  82.  
  83.     <h2>图片</h2>   
  84.     <dl>   
  85.         <dt>[hr]</dt>   
  86.         <dd><hr /></dd>   
  87.         <dt>[img]http://www.w3.org/Icons/valid-xhtml10[/img]</dt>   
  88.         <dd><img src="http://www.w3.org/Icons/valid-xhtml10" alt="" /></dd>   
  89.         <dt>[img=176x62]http://www.w3.org/Icons/valid-xhtml10[/img]</dt>   
  90.  
  91.         <dd><img src="http://www.w3.org/Icons/valid-xhtml10" style="width:176px;height:62px" alt="" /></dd>   
  92.     </dl>   
  93.     <h2>引用</h2>   
  94.     <dl>   
  95.       <dt>[quote]毛主席他老人家说:一切反动派都是纸老虎![/quote]</dt>   
  96.       <dd><blockquote><div>毛主席他老人家说:一切反动派都是纸老虎!</div></blockquote></dd>   
  97.     </dl>   
  98.  
  99.     <h2>列表</h2>   
  100.     <h3>无序列表</h3>   
  101.     <p>[list] 
  102. [*]苹果 
  103. [*]香蕉 
  104. [*]桃 
  105. [/list]</p>   
  106.     <ul><li>苹果</li><li>香蕉</li><li></li></ul>   
  107.  
  108.     <h3>有序列表</h3>   
  109.     <p>[list=1
  110. [*]打开冰箱门 
  111. [*]把大象赶进冰箱 
  112. [*]关上冰箱门 
  113. [/list]</p>   
  114.     <ol style="list-style:decimal;"><li>打开冰箱门</li><li>把大象赶进冰箱</li><li>关上冰箱门</li></ol>   
  115.     <p>[list=i] 
  116. [*]打开冰箱门 
  117. [*]把大象赶进冰箱 
  118. [*]关上冰箱门 
  119. [/list]</p>   
  120.  
  121.     <ol style="list-style:lower-roman;"><li>打开冰箱门</li><li>把大象赶进冰箱</li><li>关上冰箱门</li></ol>   
  122.     <p>[list=I
  123. [*]打开冰箱门 
  124. [*]把大象赶进冰箱 
  125. [*]关上冰箱门 
  126. [/list]</p>   
  127.     <ol style="list-style:upper-roman;"><li>打开冰箱门</li><li>把大象赶进冰箱</li><li>关上冰箱门</li></ol>   
  128.  
  129.     <p>[list=a
  130. [*]打开冰箱门 
  131. [*]把大象赶进冰箱 
  132. [*]关上冰箱门 
  133. [/list]</p>   
  134.     <ol style="list-style:lower-alpha;"><li>打开冰箱门</li><li>把大象赶进冰箱</li><li>关上冰箱门</li></ol>   
  135.     <p>[list=A
  136. [*]打开冰箱门 
  137. [*]把大象赶进冰箱 
  138. [*]关上冰箱门 
  139. [/list]</p>   
  140.  
  141.     <ol style="list-style:upper-alpha;"><li>打开冰箱门</li><li>把大象赶进冰箱</li><li>关上冰箱门</li></ol>   
  142. </div> 
代码如下:

//作者:deerchao  
// http://www.unibetter.com/blogs/blogdeerchao/default.aspx  
//在不移除以上(及本条)注释的前提下,任何人可以以任何方式使用此代码.  

using System;  
using System.Collections.Generic;  
using System.Text;  
using System.Web;  
using System.Text.RegularExpressions;  

namespace Deerchao.Web  
{  
    public class UbbDecoder  
    {  
        private static readonly RegexOptions options = RegexOptions.Compiled | RegexOptions.Singleline; 

        /// <summary>  
        /// 解析Ubb代码为Html代码  
        /// </summary>  
        /// <param name="ubb">Ubb代码</param>  
        /// <returns>解析得到的Html代码</returns>  
        public static string Decode(string ubb)  
        {  
            if (string.IsNullOrEmpty(ubb))  
                return null;  
            string result = ubb;  
            result = HttpUtility.HtmlEncode(result);  

            result = DecodeStyle(result);  
            result = DecodeFont(result);  
            result = DecodeColor(result);  
            result = DecodeImage(result);  
            result = DecodeLinks(result);  
            result = DecodeQuote(result);  
            result = DecodeAlign(result);  
            result = DecodeList(result);  
            result = DecodeHeading(result);  
            result = DecodeBlank(result);  

            return result;  
        }  

        /// <summary>  
        /// 解析Ubb代码为Html代码,所有的链接为rel="nofollow"  
        /// </summary>  
        /// <param name="ubb">Ubb代码</param>  
        /// <returns>解析得到的Html代码</returns>  
        public static string DecodeNoFollow(string ubb)  
        {  
            if (string.IsNullOrEmpty(ubb))  
                return null;  
            string result = ubb;  
            result = HttpUtility.HtmlEncode(result);  

            result = DecodeStyle(result);  
            result = DecodeFont(result);  
            result = DecodeColor(result);  
            result = DecodeImage(result);  
            result = DecodeLinksNoFollow(result);  
            result = DecodeQuote(result);  
            result = DecodeAlign(result);  
            result = DecodeList(result);  
            result = DecodeHeading(result);  
            result = DecodeBlank(result);  

            return result;  
        }  

        private static string DecodeHeading(string ubb)  
        {  
            string result = ubb;  
            result = Regex.Replace(result, @"/[h(/d)/](.*?)/[/h/1/]", "<h$1>$2</h$1>", options);  
            return result;  
        }  

        private static string DecodeList(string ubb)  
        {  
            string sListFormat = "<ol style=/"list-style:{0};/">$1</ol>";  
            string result = ubb;  
            // Lists  
            result = Regex.Replace(result, @"/[/*/]([^/[]*)", "<li>$1</li>", options);  
            result = Regex.Replace(result, @"/[list/]/s*(.*?)/[/list/]", "<ul>$1</ul>", options);  
            result = Regex.Replace(result, @"/[list=1/]/s*(.*?)/[/list/]", string.Format(sListFormat, "decimal"), options);  
            result = Regex.Replace(result, @"/[list=i/]/s*(.*?)/[/list/]", string.Format(sListFormat, "lower-roman"), options);  
            result = Regex.Replace(result, @"/[list=I/]/s*(.*?)/[/list/]", string.Format(sListFormat, "upper-roman"), options);  
            result = Regex.Replace(result, @"/[list=a/]/s*(.*?)/[/list/]", string.Format(sListFormat, "lower-alpha"), options);  
            result = Regex.Replace(result, @"/[list=A/]/s*(.*?)/[/list/]", string.Format(sListFormat, "upper-alpha"), options);  

            return result;  
        }  

        private static string DecodeBlank(string ubb)  
        {  
            string result = ubb;  

            result = Regex.Replace(result, @"(?<= ) | (?= )", " ", options);  
            result = Regex.Replace(result, @"/r/n", "<br />");  
            string[] blockTags = {"h[1-6]", "li", "list", "div", "p", "ul"};  
            //clear br before block tags(start or end)  
            foreach (string tag in blockTags)  
            {  
                Regex r = new Regex("<br />(<" + tag + ")",options);  
                result = r.Replace(result, "$1");  
                r = new Regex("<br />(</" + tag + ")",options);  
                result = r.Replace(result, "$1");  
            }  
            return result;  
        }  

        private static string DecodeAlign(string ubb)  
        {  
            string result = ubb;  

            result = Regex.Replace(result, @"/[left/](.*?)/[/left/]", "<div style=/"text-align:left/">$1</div>", options);  
            result = Regex.Replace(result, @"/[right/](.*?)/[/right/]", "<div style=/"text-align:right/">$1</div>", options);  
            result = Regex.Replace(result, @"/[center/](.*?)/[/center/]", "<div style=/"text-align:center/">$1</div>", options);  

            return result;  
        }  

        private static string DecodeQuote(string ubb)  
        {  
            string result = ubb;  

            result = Regex.Replace(result, @"/[quote/]", "<blockquote><div>", options);  
            result = Regex.Replace(result, @"/[/quote/]", "</div></blockquote>", options);  
            return result;  
        }  

        private static string DecodeFont(string ubb)  
        {  
            string result = ubb;  

            result = Regex.Replace(result, @"/[size=([-/w]+)/](.*?)/[/size/]", "<span style=/"font-size:$1/">$2</span>", options);  
            result = Regex.Replace(result, @"/[font=(.*?)/](.*?)/[/font/]", "<span style=/"font-family:$1/">$2</span>", options);  
            return result;  
        }  

        private static string DecodeLinks(string ubb)  
        {  
            string result = ubb;  

            result = Regex.Replace(result, @"/[url/]www/.(.*?)/[/url/]", "<a href=/"http://www.$1/">$1</a>", options);  
            result = Regex.Replace(result, @"/[url/](.*?)/[/url/]", "<a href=/"$1/">$1</a>", options);  
            result = Regex.Replace(result, @"/[url=(.*?)/](.*?)/[/url/]", "<a href=/"$1/" title=/"$2/">$2</a>", options);  
            result = Regex.Replace(result, @"/[email/](.*?)/[/email/]", "<a href=/"mailto:$1/">$1</a>", options);  
            return result;  
        }  

        private static string DecodeLinksNoFollow(string ubb)  
        {  
            string result = ubb;  

            result = Regex.Replace(result, @"/[url/]www/.(.*?)/[/url/]", "<a rel=/"nofollow/" href=/"http://www.$1/">$1</a>", options);  
            result = Regex.Replace(result, @"/[url/](.*?)/[/url/]", "<a rel=/"nofollow/" href=/"$1/">$1</a>", options);  
            result = Regex.Replace(result, @"/[url=(.*?)/](.*?)/[/url/]", "<a rel=/"nofollow/" href=/"$1/" title=/"$2/">$2</a>", options);  
            result = Regex.Replace(result, @"/[email/](.*?)/[/email/]", "<a href=/"mailto:$1/">$1</a>", options);  
            return result;  
        }  

        private static string DecodeImage(string ubb)  
        {  
            string result = ubb;  

            result = Regex.Replace(result, @"/[hr/]", "<hr />", options);  
            result = Regex.Replace(result, @"/[img/](.+?)/[/img/]", "<img src=/"$1/" alt=/"/" />", options); 
            result = Regex.Replace(result, @"/[img=(/d+)x(/d+)/](.+?)/[/img/]", "<img src=/"$3/" style=/"width:$1px;height:$2px/" alt=/"/" />", options);  

            return result;  
        }  

        private static string DecodeColor(string ubb)  
        {  
            string result = ubb;  
            result = Regex.Replace(result, @"/[color=(#?/w+?)/](.+?)/[/color/]", "<span style=/"color:$1/">$2</span>",options);  

            return result;  
        }  

        private static string DecodeStyle(string ubb)  
        {  
            string result=ubb;  
            //we don't need this for perfomance and other consideration:  
            //(<table[^>]*>(?><table[^>]*>(?<Depth>)|</table>(?<-Depth>)|.)+(?(Depth)(?!))</table>)  
            result = Regex.Replace(result, @"/[[b]/](.*?)/[/[b]/]", "<strong>$1</strong>", options);  
            result = Regex.Replace(result, @"/[[u]/](.*?)/[/[u]/]", "<span style=/"text-decoration:underline/">$1</span>", options);  
            result = Regex.Replace(result, @"/[[i]/](.*?)/[/[i]/]", "<i>$1</i>", options);  

            return result;  
        }  
    }  
 
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表