2009-06-26

Convert HTML to plain text and remove tags


// convert HTML to plain text
string Description = System.Web.HttpUtility.HtmlDecode(HTML_encoded_string);

Description = StripTags(Description);

...

// remove tags from HTML-parsed string
private string StripTags(string HTML)
{
System.Text.RegularExpressions.Regex objRegEx = new System.Text.RegularExpressions.Regex("<[^>]*>");

return objRegEx.Replace(HTML, "");
}

2 комментария:

Vlad комментирует...

innerText для XML как-то по-лучше будет )

hyper комментирует...

innerText для сего HTML документа?!