提取网页源码,遇到编码转换的问题
在提取某繁体网页的源代码时,
在浏览器显示的是【加州里 】的繁体中文,
在源代码里却是显示了以下代码
<a href="#" class=table_text>加州萬里</a>
加 = 加
州 = 州
萬 =
里 = 里
请问应该怎么根据这些编码转换成繁体或简体呢?
[解决办法]
- C# code
string str = "<a href=\"#\" class=table_text>加州萬里</a>";HttpUtility.HtmlDecode(str)