老闆讓我從幾百個Excel中查找數據,我用Python一分鐘搞定

老闆讓我從幾百個Excel中查找數據,我用Python一分鐘搞定

以下文章來源: 早起Python

作者:陳熹

大家好,又到了Python辦公自動化系列。

今天分享一個真實的辦公自動化需求,大家一定要仔細閲讀需求説明,在理解需求之後即可體會Python的強大!

一、需求説明

首先我們來看下今天的需求,有一份檔案記錄總表的Excel工作簿, 每天會根據當天日期建立新表,每天的表格內包含所有檔案信息,同時也有可能會添加新的檔案名。同個年度的總表在年末可能會有兩、三百個工作表,同時每個表中可能也存在千餘份檔案信息。表格形式如下(為了直觀呈現本例以7個工作表和十餘份檔案的形式呈現)

老闆讓我從幾百個Excel中查找數據,我用Python一分鐘搞定

需要完成的操作:為了方便審查特定檔案信息,需要給出檔案名後生成一份新表,該表包含指定檔案在所有日期(即所有工作表)中的記錄。最終結果如下(以檔案x003為例):

也就是老闆説:給我把這幾百個表格中所有包含檔案x003的相關數據全部找到並整理個新的表格給我

二、步驟分析

正式寫代碼前可以把需求分析清楚,將複雜問題簡單化。

説白了,這個需求要求把所有日期工作表中的特定行都提取出來整合成一個新表。那麼我們可以遍歷每一張表,然後遍歷第一列(名稱列,也可以看作A列)每一個有數據的單元格,如果單元格中的文字為我們需要的檔案名,就把這一行提取出來放到新的表格中,進一步梳理步驟為

建立一個新的EXCEL工作簿

新表的表頭和檔案記錄Excel中的一樣,也是名稱、配置、提交日期等

遍歷檔案記錄Excel的每一張工作表sheet,再遍歷第一列每一個有數據的單元格,對內容進行判斷

找到符合條件的單元格後獲取行號,根據行號將當前表中的特定行提取出來,並將行追加新創建的表中

分析清楚就可以着手寫代碼了

三、Python實現

首先導入需要的庫本例中涉及舊錶的打開和新表的創建,因此需要從openpyxl導入load_workbook和Workbook(如果是ppt和word用到的模塊就更智能了,一個方法就能搞定)

fromopenpyxl importload_workbook, Workbook

接着導入舊錶及創建新表

# 從桌面上獲取總表
filepath = r'C:\Users\chenx\Desktop\台賬.xlsm'# 根據實際情況進行修改
workbook = load_workbook(filepath)
# 創建新的Excel工作簿獲取到工作表
new_workbook = Workbook()
new_sheet = new_workbook.active
# 給新表寫入表頭
new_headers = ['名稱''配置''提交日期''受限操作''操作時間''狀態''存儲位置']
new_sheet.append(new_headers)

現在是核心步驟:多次遍歷,可以用workbook.sheetnames獲取工作簿所有工作表名稱的列表,然後遍歷即可

fori in workbook.sheetnames:
sheet = workbook[i]
# 獲取檔案名稱所在列
names = sheet['A']

按照前面的分析,需要遍歷名稱列,判斷每一個單元格的值是不是需要的檔案名。這裏應注意,如果已經循環到需要的單元格,就可以停止循環了,但一定要把符合單元格的行號傳遞給一個變量做記錄,不然一旦break出循環就沒有記憶了

flag0
for cell in names:
if cell.value == keyword: # 這裏的keyword就是檔案名,可以以 檔案x003 為例
flag = cell.row
break

獲得到符合條件的行號後用sheet[flag]就可以拿到符合行了。openpyxl不支持舊錶的一整行寫入新表,因此應對策略就是將這一行的所有單元格具體值組裝成一個列表,用sheet.append(列表)的方法寫入新表,遍歷部分的完整代碼如下:

fori in workbook.sheetnames:
sheet = workbook[i]
names = sheet['A']
flag = 0
forcell in names:
            ifcell.value == keyword:
                flag = cell.row
                break
ifflag:   # 如果flag沒有被修改則不需要順序進行下列代碼
            data_lst = []
            forcell in sheet[flag]:
                # 這裏加上一個對內容的判斷,是讓無內容的行直接放空,而不是寫入一個 none
                ifcell.value:  
                    data_lst.append(str(cell.value))
                else:
                    data_lst.append(' ')
            new_sheet.append(data_lst)

最後記得保存

new_workbook.save(r'C:\Users\chenx\Desktop\台賬查詢.xlsx')

小結

這是經過一定改編的真實案例,可見Python自動化辦公確實能夠幫助我們解放自己的雙手,不過在寫自動化腳本之前也要先拆分任務,明確思路再進行,如果對本文的代碼和數據感興趣可以在後台回覆自動化獲取。最後還是希望大家能夠理解Python辦公自動化的一個核心就是批量操作-解放雙手,讓複雜的工作自動化!

【來源:CDA數據分析師】

聲明:轉載此文是出於傳遞更多信息之目的。若有來源標註錯誤或侵犯了您的合法權益,請作者持權屬證明與本網聯繫,我們將及時更正、刪除,謝謝。 郵箱地址:[email protected]

版權聲明:本文源自 網絡, 於,由 楠木軒 整理發佈,共 2446 字。

轉載請註明: 老闆讓我從幾百個Excel中查找數據,我用Python一分鐘搞定 - 楠木軒