小醉寒i

【原创】第一个Python-Spider程序
说明:这是一个非常简单的Pyhton爬虫程序,一般站点数据都可以爬取。运行Pyhton程序的时候会提示输入一个UR...
扫描右侧二维码阅读全文
25
2019/01

【原创】第一个Python-Spider程序

说明:这是一个非常简单的Pyhton爬虫程序,一般站点数据都可以爬取。运行Pyhton程序的时候会提示输入一个URL:就是需要爬取的地址例如:http://www.baidu.comURL必须加上http或者https协议(当然也有少部分ftp或者ftps等等,一般都不常用)否侧程序会无法识别需要爬取的地址无法进行下一步操作。第二个输入的是filename:这是爬取的数据保存在本地的文件的名称,例如:baidu.html,baidu.jpg,baidu.txt等等。

下面代码:

from urllib import request

print('----第一个爬虫程序开始----')
url = input("输入需要爬取的地址,格式http://www.baidu.com按回车结束:")
filename = input("输入需要保存的文件格式,格式baidu.html,baidu.jpg,baidu.txt按回车执行程序:")
request.urlretrieve(url,filename)
print("程序执行完成,文件已下载到此程序父类目录的下面")

小白写文,大牛勿喷。


扫描二维码,在手机上阅读!
Last modification:January 25th, 2019 at 09:56 pm
果觉得我的文章对你有用,请随意赞赏瓶饮料

Leave a Comment