2022-01-17 11:14:19|已瀏覽:250次
Python最主要的應用就是爬蟲,即自動獲取網頁內容的程序。文件是網頁內容的重要存儲模式,如何利用Python讀取文件呢?今天老師就來給大家分享一下Python初學者教程中關于讀取文件的有關知識。
大局部爬蟲一般按照“發送懇求——取得頁面——解析頁面——抽取并貯存內容”的流程,想要讀取信息,我們就要了解數據的存儲方式,其中文件格式是比較常見的一種。所謂文件格式,是指文件中存儲信息的一種標準方法。首先,文件格式指定文件是一個二進制或ASCII文件。其次,文件展示了文件的組織形式,如CSV、XLSX等。import pandas as pd使用Python讀取TXT純文本
pf = pd.read_csv('train.csv')
text_file = open("text.txt", "r")使用Python讀取ZIP文件
lines = text_file.read()
import zipfile使用Python讀取XLSX文件
archive = zipfile.ZipFile('T.zip', 'r')
df = archive.read('train.csv')
import pandas as pd除了以上文件類型,使用Python你還可以讀取XML、HTML、JSON等程序,基于Python簡單易學、應用廣泛的特性,越來越多的人選擇學習Python編程語言。
pf = pd.read_excel('train.xlsx',sheetname = 'invoice')
注:尊重原創文章,轉載請注明出處和鏈接 http://m.dedgn.cn/news-id-15593.html 違者必究!部分文章來源于網絡由培訓無憂網編輯部人員整理發布,內容真實性請自行核實或聯系我們,了解更多相關資訊請關注python培訓頻道查看更多,了解相關專業課程信息您可在線咨詢也可免費申請試課。關注官方微信了解更多:150 3333 6050
姓名:
手機:
地區: