一行Python程式碼即可匯出多種瀏覽器的歷史記錄?就像這樣
現在來說說原理,不管是 Windows 還是MAC,Chrome等瀏覽器的歷史資料都是儲存在本地的SQLite資料庫中,例如Windows使用者可以在C:\Users\Administrator\AppData\Local\ Google \Chrome\User Data\Default找到,當然在Python中我們可以使用內建OS模組找到該資料庫檔案,再使用Python內建的sqlite3模組可以輕鬆讀取並匯出瀏覽記錄資料,而這個過程在 GitHub 上已經有一位外國小哥幫我們完成了,總共不到200行程式碼,現在我們只要使用pip install browserhistory安裝,接著進入Python匯入
現在只要一行程式碼即可檢視全部歷史瀏覽記錄
JSON格式資料不怎麼好看,可以藉助 pandas 轉換為表格,並且可以檢視指定瀏覽器的記錄,比如 Safari
當然也可以一行程式碼將歷史記錄匯出為CSV
開啟我的Safari記錄看看,最早的一條記錄居然是去年6月的除錯Django專案的記錄,看來很久沒有清空了
但是在儲存資料時有一個小插曲,作者在原始碼中使用CSV模組來將資料寫入CSV表格時使用的編碼是UTF-8,這會導致中文亂碼
所以只要進入原始碼將UTF-8改為utf-8_sig就能正常儲存中文了,或者直接copy過來原始碼並修改也是可以的。並且要注意執行程式時要徹底退出瀏覽器,否則會丟失對應瀏覽器的記錄。
最後,有了幾萬條瀏覽記錄,就可以進行一些簡單分析,比如面向搜尋引擎程式設計的我,最常訪問的網站就是 百度 、 Google 、 GitHub 、 stack overflow 等,當然你也可以寫一個簡單的指令碼並打包,獲取某人的瀏覽記錄,看看TA上班是不是愛摸魚,或者根據妹子的訪問記錄來找點話題,大家自由發揮