名人彩票娱乐登录彩票平u内u部44844

 andlly   2019-01-14 21:18   286 人阅读  0 条评论

urllib是python内置模块

读取数据

data = file.read() #读取全部
dataline = file.readline() #读取一行
字符串变量 = file.read() #读取全部内容
列表变量 = file.readlines() #读取全部内容
字符串变量 = file.readline() #读取文件的一行内容
#爬取网页,并保存路径和对应的文件名
url = 'https://www.shwoq.com/'
filename = urllib.request.urlretrieve(url,filename="D:/python/1.html")
urllib.request.urlcleanup() #清除缓存
print(file.info()) #返回与当前环境的有关的信息
print(file.getcode())#获取网页的状态码
print(file.geturl())#获取网页的url地址


URL标准中只会允许一部分ASCII字符比如数字、字母、部分符号等 

其他字符,如汉字不符合标准,这时需要URL编码来解决 

编码解码代码如下


print(urllib.request.quote("https://www.baidu.com"))
print(urllib.request.unquote("https://www.shwoq.com"))

打印结果为: 
http%3A//www.baidu.com 
https://www.shwoq.com

本文地址:https://www.shwoq.com/post/67.html
版权声明:本文为原创文章,版权归 andlly 所有,欢迎分享本文,转载请保留出处!
 相关文章  关键词:

 发表评论


表情

还没有留言,还不快点抢沙发?