vc++ 提取html文件中的汉字输出txt格式文件中
小弟菜鸟,最近有份作业要求提取html文件中的汉字,然后输出到txt文件中。不知道该怎么去做,希望路过的各位高手帮帮我。。最好能说的详细一点。。。高分感谢!~。。
[解决办法]
一般两种方法:
1:自分析,自己读取文件内容,获取编码格式,一般是gb码,进行双字转换。
2:利用IE,Com一个HtmlDocument,再Get_InnerText。
函数名可能不对,大体意思差不多。
发布时间: 2012-03-25 20:55:16 作者: rapoo
vc++ 提取html文件中的汉字输出txt格式文件中
小弟菜鸟,最近有份作业要求提取html文件中的汉字,然后输出到txt文件中。不知道该怎么去做,希望路过的各位高手帮帮我。。最好能说的详细一点。。。高分感谢!~。。
[解决办法]
一般两种方法:
1:自分析,自己读取文件内容,获取编码格式,一般是gb码,进行双字转换。
2:利用IE,Com一个HtmlDocument,再Get_InnerText。
函数名可能不对,大体意思差不多。