VB.NET抓取网页出现错误解决方案
创始人
2024-06-21 04:41:17
0

VB.NET编程语言特点比较突出,它是一个真正的实现面向对象以及支持继承性的编程语言,其应用范围广泛,功能强大,帮助开发人员大大提高了编程效率。在调试VB.NET调用Microsoft.XMLHttp组件抓取网页时,遇到了抓取中文字符出现乱码,经测试若网页meta标签charset为utf-8的网页不会乱码,而charset为Gb2312的则会出现乱码,本文提供了一个完整的解决方法,希望对研究VB.NET抓取网页或者VB.NET实现采集功能的朋友有所帮助。

以下为VB.NET抓取网页的函数LobDotCn 注:url_Link为抓取的目标页面 IsGb2312为是否Gb2312字符

  1. Public Function LobDotCn(ByVal url_Link 
    As String, ByVal IsGb2312 As Boolean)   
  2. On Error Resume Next   
  3. Dim XmlHttp As Object   
  4. XmlHttp = CreateObject("Microsoft.XMLHttp")   
  5. XmlHttp.Open("POST", url_Link, False)   
  6. XmlHttp.Send()   
  7. Dim WebContent As Object   
  8. Dim Str_WebContent As String   
  9. If IsGb2312 Then   
  10. WebContent = XmlHttp.ResponseBody   
  11. Str_WebContent = System.Text.Encoding.
    Default.GetString(WebContent)   
  12. Else   
  13. WebContent = XmlHttp.ResponseText   
  14. Str_WebContent = WebContent.ToString   
  15. End If   
  16. XmlHttp = Nothing   
  17. LobDotCn = Str_WebContent   
  18. End Function  

VB.NET抓取网页的调用方式 :

变量 = LobDotCn("http://www.lob.cn", True) '抓取 Gb2312网页

变量 = LobDotCn("此处填写网址", False) ' 抓取utf-8网页

【编辑推荐】

  1. VB.NET读取内存具体代码编写方法
  2. VB.NET类型转换相关运算符应用技巧分享
  3. 四步完成VB.NET读写注册表
  4. VB.NET条件分支语句应用方法概述
  5. VB.NET控件数组正确使用方法分析

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
着眼MAC地址,解救无法享受D... 在安装了DHCP服务器的局域网环境中,每一台工作站在上网之前,都要先从DHCP服务器那里享受到地址动...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...