ASP.NET過濾HTML標(biāo)簽只保留換行與空格的方法
來源:易賢網(wǎng) 閱讀:769 次 日期:2015-01-16 15:38:14
溫馨提示:易賢網(wǎng)小編為您整理了“ASP.NET過濾HTML標(biāo)簽只保留換行與空格的方法”,方便廣大網(wǎng)友查閱!

本文實(shí)例講述了ASP.NET過濾HTML標(biāo)簽只保留換行與空格的方法。分享給大家供大家參考。具體分析如下:

自己從網(wǎng)上找了一個(gè)過濾HTML標(biāo)簽的方法,我也不知道誰的才是原創(chuàng)的,反正很多都一樣。我把那方法復(fù)制下來,代碼如下:

復(fù)制代碼 代碼如下:/// <summary>

/// 去除HTML標(biāo)記

/// </summary>

/// <param name="NoHTML">包括HTML的源碼 </param>

/// <returns>已經(jīng)去除后的文字</returns>

public static string NoHTML(string Htmlstring)

{

//刪除腳本

Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "",

RegexOptions.IgnoreCase);

//刪除HTML

Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"<!--.*", "", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "\"",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", "<",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", " ",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "\xa1",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "\xa2",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "\xa3",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "\xa9",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);", "",

RegexOptions.IgnoreCase);

Htmlstring.Replace("<", "");

Htmlstring.Replace(">", "");

Htmlstring.Replace("\r\n", "");

Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();

return Htmlstring;

}

以上代碼是從網(wǎng)上直接復(fù)制過來的,這個(gè)確實(shí)能過濾掉所有的HTML標(biāo)簽,但是這個(gè)不是我想要的,這個(gè)過濾得太干凈了,我如果用textarea輸入框的話,我是要保留空格跟換行的。

然后我就自己改了一下這個(gè)方法,textarea的換行是\n,所以我得把這些標(biāo)簽重新匹配替換成<br>,這樣的話從數(shù)據(jù)庫中讀取到頁面時(shí),就能正確的換行了,把空格替換成HTML的空格符,大功告成。

復(fù)制代碼 代碼如下:/// <summary>

/// 去除HTML標(biāo)記(保留br跟\r\n)

/// </summary>

/// <param name="NoHTML">包括HTML的源碼 </param>

/// <returns>已經(jīng)去除后的文字</returns>

public static string NewNoHTML(string Htmlstring)

{

//Htmlstring.Replace("", "%r%n").Replace("<br>","%br%").Replace("<br/>","%br&%").Replace("");

//刪除腳本

Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "",

RegexOptions.IgnoreCase);

//刪除HTML

Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"<!--.*", "", RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "\"",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", "<",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", " ",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "\xa1",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "\xa2",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "\xa3",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "\xa9",

RegexOptions.IgnoreCase);

Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);", "",

RegexOptions.IgnoreCase);

Htmlstring.Replace("<", "");

Htmlstring.Replace(">", "");

//Htmlstring.Replace("\r\n", "");

Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring);

Htmlstring = Regex.Replace(Htmlstring, @"((\r\n))", "<br>");

Htmlstring = Regex.Replace(Htmlstring, @"(\r|\n)", "<br>");

Htmlstring = Regex.Replace(Htmlstring, @"(\s)", " ");

return Htmlstring;

}

這個(gè)過濾可以用于讓用戶輸入發(fā)布內(nèi)容時(shí)的過濾。

希望本文所述對(duì)大家的asp.net程序設(shè)計(jì)有所幫助。

更多信息請(qǐng)查看IT技術(shù)專欄

更多信息請(qǐng)查看網(wǎng)絡(luò)編程
易賢網(wǎng)手機(jī)網(wǎng)站地址:ASP.NET過濾HTML標(biāo)簽只保留換行與空格的方法
由于各方面情況的不斷調(diào)整與變化,易賢網(wǎng)提供的所有考試信息和咨詢回復(fù)僅供參考,敬請(qǐng)考生以權(quán)威部門公布的正式信息和咨詢?yōu)闇?zhǔn)!

2025國考·省考課程試聽報(bào)名

  • 報(bào)班類型
  • 姓名
  • 手機(jī)號(hào)
  • 驗(yàn)證碼
關(guān)于我們 | 聯(lián)系我們 | 人才招聘 | 網(wǎng)站聲明 | 網(wǎng)站幫助 | 非正式的簡(jiǎn)要咨詢 | 簡(jiǎn)要咨詢須知 | 新媒體/短視頻平臺(tái) | 手機(jī)站點(diǎn) | 投訴建議
工業(yè)和信息化部備案號(hào):滇ICP備2023014141號(hào)-1 云南省教育廳備案號(hào):云教ICP備0901021 滇公網(wǎng)安備53010202001879號(hào) 人力資源服務(wù)許可證:(云)人服證字(2023)第0102001523號(hào)
云南網(wǎng)警備案專用圖標(biāo)
聯(lián)系電話:0871-65099533/13759567129 獲取招聘考試信息及咨詢關(guān)注公眾號(hào):hfpxwx
咨詢QQ:1093837350(9:00—18:00)版權(quán)所有:易賢網(wǎng)
云南網(wǎng)警報(bào)警專用圖標(biāo)