我们常常需要把新闻中的图片保存到自己的服务器上.
原理:
提取新闻内容中的图片地址---然后向该地址请求----得到二进制流数据--保存此数据
'返回一文章或者源代码中的所有图片地址,结果为空或者为数组
Function GetImgPath(ArString)
Dim objRegExp,Matches,Match
Set objRegExp = New RegExp
objRegExp.IgnoreCase = True '忽略大小写
objRegExp.Global = True '设置为全文搜索
objRegExp.Pattern = "
Set Matches = objRegExp.Execute(ArString) '开始执行配置
IF Matches.Count = 0 Then
GetImgPath = ""
Else
Dim imgTmp,imgi,imgUrl
ReDim imgUrl(Matches.Count-1)
objRegExp.Pattern = "src="".+?""" '取出里面的地址
For imgi=0 To Matches.Count-1
Set imgTmp = objRegExp.Execute(Matches.item(imgi)) '执行第二轮的匹配
imgUrl(imgi) = Replace(imgTmp.item(0),"""","")
imgUrl(imgi) = Mid(imgUrl(imgi),5)
Next
GetImgPath = imgUrl
End IF
Set objRegExp = Nothing
End Function
提供新闻的源内容.将自动返回内容中所有的图片地址,返回的是一个数组哦..
地址可能是 http://的绝对路径 也有可能是别人网站使用的相对路径.所以你自己必须要进行处理.
这个函数同使用了 正则匹配函数 RegExpSerch 前一个文章中有哦.