urllib是可用于打开URL的Python模块。 它定义了有助于URL操作的函数和类。
使用Python,您还可以从Internet访问和检索XML,HTML,JSON等数据。您也可以使用Python直接处理此数据。 在本教程中,我们将看到如何从Web检索数据。 例如,在这里我们使用了guru99视频URL,我们将使用Python以及该URL的打印HTML文件访问该视频URL。
在运行代码以连接到Internet数据之前,我们需要导入URL库模块或“ urllib”的语句。
导入urllib
您还可以使用Python中的“read function”来读取HTML文件,并且在运行代码时,HTML文件将出现在控制台中。
这是完整的代码
Python 2 Example
#
# read the data from the URL and print it
#
import urllib2
def main():
# open a connection to a URL using urllib2
webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")
#get the result code and print it
print "result code: " + str(webUrl.getcode())
# read the data from the URL and print it
data = webUrl.read()
print data
if __name__ == "__main__":
main()
Python 3 Example
#
# read the data from the URL and print it
#
import urllib.request
# open a connection to a URL using urllib
webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')
#get the result code and print it
print ("result code: " + str(webUrl.getcode()))
# read the data from the URL and print it
data = webUrl.read()
print (data)