HOW TO:辨識 Visual Basic HTML 字串中的文字
更新:2007 年 11 月
這個範例會使用簡單的規則運算式 (Regular Expression) 移除 HTML 文件的標記。
範例
HTML 標記會與規則運算式 \<[^\>]+\> 相符,這表示:
字元 "<",之後接著
一個或多個字元集合,不包括 ">" 字元,之後接著
字元 ">"。
這個範例會使用共用的 Regex.Replace 方法,以使用空字串取代標記規則運算式的所有符合項。
''' <summary>Removes the tags from an HTML document.</summary>
''' <param name="htmlText">HTML text to parse.</param>
''' <returns>The text of an HTML document without tags.</returns>
''' <remarks></remarks>
Function GetTextFromHtml(ByVal htmlText As String) As String
Dim output As String = Regex.Replace(htmlText, "\<[^\>]+\>", "")
Return output
End Function
這個範例要求您必須使用 Imports 陳述式,匯入 System.Text.RegularExpressions 命名空間。如需詳細資訊,請參閱Imports 陳述式 (.NET 命名空間和型別)。
請參閱
工作
HOW TO:在 Visual Basic 中識別 HTML 字串內的超連結