我們要正確地取得資料,可以使用政府的open data收集每天的資料。
本篇會從政府資料開放平台取得資訊作為範例。
範例檔案在:Day15_getStockDataFromOpenData.py
政府資料開放平台簡介
基於Open data的概念,以及open government的概念,政府大力推廣open data,其中交易的方面也是如此。
以前需要爬網站才能取得的資料,現在政府提供查詢平台和API,讓我們更容易地取得資訊。
我們這次的資料就是從這邊取得:盤後資訊 > 個股日成交資訊
取得csv資料
根據介紹,這份資料為csv格式,欄位包含:證券代號、證券名稱、成交股數、成交金額、開盤價、最高價、最低價、收盤價、漲跌價差、成交筆數。
接着我們去下載檔案來觀察一下里面的資料吧!首先去「資料下載網址」那邊下載csv:
可以看到格式是這樣的:
是不是發現沒有日期!
沒錯,他們沒有提供日期,因為是每日更新,所以他們都不會有日期,上面寫的都是最近一次交易日的盤後資訊。
所以我們要自己加上日期。
解析資料
取得檔案後,觀察裏面的內容,發現還滿乾淨的,也跟他們的説明相同,那我們就直接拿來使用囉~
取得API提供的csv資料:
2.解析內文,把有逗點的文字內容變成dataframe格式
3.但是這樣我們的第一行也會被認為是一般資料,這時候要把第一行變成欄位名稱,重新排列。
這樣就是新的資料囉!
#python實戰#