在大數據時代標識“小數據” ——淺談律師數據文件的命名規則

律師在處理法律事務的過程中會生成大量的文檔、表格、幻燈片、照片、音頻、視頻等數據文件,能否快速、準確的識別、檢索和區分所需文件是衡量數據管理是否完善的重要指標。對數據文件的命名看似無足輕重,實則對工作的高效開展有着重要的影響,且將隨着時間的推移和文件數量的增加而愈發重要。故此,筆者結合自身實踐,就數據文件的命名問題進行梳理分享。

數據命名文件概述

文件名是數據文件最顯著的特徵,通過它可以識別、檢索和區分不同的文件。數據文件名的格式基本相同,完整的名稱為“文件名.擴展名”,前半部分是文件的正式文件名,後半部分是屬性標記,即擴展名。擴展名決定了文件的類型,通常由數個英文字母組成,一般是相關英文單詞的縮寫,由系統自動添加,如Word文件的擴展名是doc,某些音頻文件的擴展名是mp3,多數圖像文件的擴展名是jpg等。本文闡述的數據文件名是指前半部分,即正式文件名。

1.Windows系統下的文件命名規則

(1)長度:任何一個文件(文件夾)名稱不得超過255個英文字符;

(2)可用字符:原則上英文字母、符號、空格、中文等均可以作為命名字符,但由於以下字符由系統保留它用,故不能用於文件命名: \ / : * ? " <> | ;(末尾的分號是本句的標點符號,非禁用符號)

(3)空格:文件名除了開頭之外任何地方均可使用空格,如果空格用在文件名的第一個字符,系統將忽略不計;

(4)大小寫:使用英文文件名,大小寫不做區分,但系統在顯示時可以保留大小寫格式。

2.常用軟件的自行命名規則

所謂自行命名規則,是指在沒有人為填寫、修改的情況下,相關軟件在保存文件時自動形成文件名的方式。

(1)Word:若通過單擊右鍵新建文檔,將自動命名為:《新建 Microsoft Word 文檔》;若通過雙擊桌面圖標新建文檔,在尚未寫入內容時即保存,將自動命名為:《文檔1》或《Doc1》;如果已寫入內容後保存,則將首段(行)文字內容命名為文件名,如《民事起訴狀》、《辯護詞》、《情況説明》等,但不會保留首段(行)第一個標點符號及符號之後的內容,如:文檔首段(行)為:律師的隨身“裝備”,自動命名將保存為《律師的隨身》。

(2)Excel:若通過單擊右鍵新建文檔,將自動命名為:《新建 Microsoft Excel 工作表》;若通過雙擊桌面圖標新建文檔,無論是否寫入內容保存,系統將自動命名為:《工作簿1》或《Book1》。

(3)PowerPoint:若通過單擊右鍵新建文檔,將自動命名為:《新建 Microsoft PowerPoint 演示文稿》;若通過雙擊桌面圖標新建文檔,在尚未寫入內容時即保存,系統將自動命名為:《演示文稿1》;如果已寫入內容後保存,則將首頁添加標題框中的文字內容命名為文件名。

(4)記事本(txt):不具備自行命名功能,必須人為輸入文件名。

(5)寫字板(RTF):新建文檔後,無論是否寫入內容保存,都將自行命名為:《文檔》。

(6)照片、視頻:照相機或手機拍攝軟件具有自動命名功能,常見有:照片061、DSC_1398、IMG_0581、20191124_100846等方式。需要注意的是,通過微信傳送的照片、視頻下載保存後,原始名稱會變化為:210319140318396286e944920、tmpvideo_780138.4935648334、mmexport1464958066816等形式。

(7)音頻:錄音筆或手機錄音軟件具有自動命名功能,常見有:20181023_165901、2018-09-23_19時38分26秒等方式。

數據文件命名的常見問題

從技術角度而言,目前對文件的識別、檢索和區分幾乎都依賴於文件名中的信息得以實現。在律師執業初期,文件命名問題往往未能引起足夠重視,更少有系統化、規範化的考慮和處理,隨着文件數量的不斷增加,易出現下列問題:

1.無法及時找出所需文件

若文件系自行命名,後期也未予修改,則信息泛化的初始文件名將一直保留,如:將案件的起訴狀僅保存命名為《民事起訴狀》。當需要找出該文件時,無法通過文件名中的信息進行有效檢索。

2.文件不同版本之間難以區分

法律文件往往需要經過多次修改,常通過無規律添加標記的方式對後續版本進行命名,如:《文檔2》、《Doc5》、《新建 Microsoft Word 文檔 (6)》或《民事起訴狀2》、《辯護詞666》、《情況説明1111》等。

此外,法律法規等規範性文件更新後,有的僅以《中華人民共和國公司法(新)》、《中華人民共和國公司登記管理條例(修訂)》、《最高人民法院關於人民法院審理離婚案件處理子女撫養問題的若干具體意見(有效)》等方式予以籠統標識。

上述命名方式,會導致文件的不同版本之間難以通過文件名進行明確區分,亦無法看出規範性文件的文號、修訂或實施日期等關鍵信息。

數據文件命名的原則和具體方式

當擁有海量文件時,對文件的識別、檢索和區分至關重要。文件命名並非越長或越詳細越好,一是因為文件名長度有限,規則不宜太過複雜;再則過長的文件名難以在手機或顯示器上全文顯示,反而不便於查看。故文件命名原則上應做到清晰表明文件核心內容、便於識別、檢索和區分。

關於具體的命名規則,筆者的實踐如下:先統一將日期按照年月日的順序編為8位或者12位阿拉伯數字,如20110308或20190528 11:58,再將數據文件分為文檔類文件和音像類文件,適用不同規則:

1.文檔類數據文件的命名規則

文檔類數據文件,是指word文檔、Excel文檔、PowerPoint文檔、記事本(txt)、寫字板(RTF)等主要用於文字、數據編輯的軟件所形成的文件。其命名規則是:將文件名分為“標題+註釋”兩個部分,前者與文檔內大標題保持一致,後者根據文檔的類型不同而有所區別。

(1)普通文檔,按照:標題+(日期)的方式命名;

例:《律師的隨身“裝備”(20190828)》

(2)案件類法律文書,按照:標題+(案由)+(日期)的方式命名;

例:《民事起訴狀(武漢市某高科技集團有限公司訴武漢某商貿公司股權轉讓糾紛案)(20200501)》

若對上述兩類文件進行修改,改後版本以尾部括號內標註的8位日期數字相區別;若同日內有多次修改,則尾部括號內以12位日期+時間標註相區別。

例:《律師的隨身“裝備”(20190828 10:36)》

《民事起訴狀(武漢市某高科技集團有限公司訴武漢某商貿公司股權轉讓糾紛案)(20200501 15:38)》

(3)法律法規等規範性文件,其核心信息為名稱和版本,故其命名方式為:標題+(文號)+(施行日期);

例:《中華人民共和國外商投資法(中華人民共和國主席令 第二十六號)(20200101)》

《最高人民法院關於適用若干問題的解釋(法釋〔2019〕20號)(20200101)》

(4)外發文檔,尤其發給上級單位彙總時,文件的可識別命名是一項基本要求,試想:如果收件人收到的文件名都是“表格”、“發言”、“報告”,勢必易造成混淆,故按照:標題+(單位或姓名)的規則命名;

例:《武漢市推進重大工程、重大行動情況彙總表(武漢市司法局 律師進村行動)》

2.音像類數據文件的命名方式

音像類數據文件,主要是指照片、音頻、視頻等由拍攝、錄製軟件所形成的文件,具有較強的時間順序性特徵,可將時間信息放在文件名的首部,這樣系統可以自動將文件按命名時間順序排列(注意:中文數字一、二、三……並非按照大小而是拼音首字母排序)。其命名規則是:將文件名分為“日期+註釋”兩個部分,前者以8位數字標註形成日期,註釋內容為:何人+何地+何事。

(1)照片

例:20191214-陳亮律師在市民之家第268期市民大講堂接受採訪,講述“防範非法集資”的故事。

(2)音頻

例:20190520-陳亮律師在武漢經濟廣播台《財富早點到》欄目錄制繼承法專題知識。

(3)視頻

例:20191021-特邀調解員陳亮至江漢區人民法院開展首例在線案件調解。

如果同一天有數個文件或同一文件有修改編輯版本,可以在尾部加“-1”“-2”予以區分。

在大數據時代,我們在享受數據便利的同時,容易忽略對自身“小數據”的有效利用。筆者在律師執業過程中沉澱的文件有三萬餘個,上述命名方式有助於有效識別、檢索和區分文件。當然,數據文件的命名沒有既定之規,完全可以遵循習慣給自己定製一套簡便好用的規則。相信隨着時間的推移和文件數量的不斷增加,文件命名的規範化對後期法律工作帶來的益處將不斷顯現。

作者簡介:陳亮律師,男,湖北好律律師事務所主任、創始合夥人,主要從事公司法、房產及婚姻繼承法律事務,任湖北省安徽商會、共青團武漢市委、武漢市東西湖區人民政府等大型企事業單位常年法律顧問,現為中國法學會會員、武漢市律師協會直屬支部書記、公司法專委會副主任、武漢市人民檢察院人民監督員、長江日報公益律師服務中心理事、武漢市信訪事項複查複核專家庫成員、武漢市新社會階層人士聯誼會會員,入選武漢市青年律師“雙百”計劃首批青年英才律師。

版權聲明:本文源自 網絡, 於,由 楠木軒 整理發佈,共 3701 字。

轉載請註明: 在大數據時代標識“小數據” ——淺談律師數據文件的命名規則 - 楠木軒