在大数据时代标识“小数据” ——浅谈律师数据文件的命名规则

律师在处理法律事务的过程中会生成大量的文档、表格、幻灯片、照片、音频、视频等数据文件,能否快速、准确的识别、检索和区分所需文件是衡量数据管理是否完善的重要指标。对数据文件的命名看似无足轻重,实则对工作的高效开展有着重要的影响,且将随着时间的推移和文件数量的增加而愈发重要。故此,笔者结合自身实践,就数据文件的命名问题进行梳理分享。

数据命名文件概述

文件名是数据文件最显著的特征,通过它可以识别、检索和区分不同的文件。数据文件名的格式基本相同,完整的名称为“文件名.扩展名”,前半部分是文件的正式文件名,后半部分是属性标记,即扩展名。扩展名决定了文件的类型,通常由数个英文字母组成,一般是相关英文单词的缩写,由系统自动添加,如Word文件的扩展名是doc,某些音频文件的扩展名是mp3,多数图像文件的扩展名是jpg等。本文阐述的数据文件名是指前半部分,即正式文件名。

1.Windows系统下的文件命名规则

(1)长度:任何一个文件(文件夹)名称不得超过255个英文字符;

(2)可用字符:原则上英文字母、符号、空格、中文等均可以作为命名字符,但由于以下字符由系统保留它用,故不能用于文件命名: \ / : * ? " <> | ;(末尾的分号是本句的标点符号,非禁用符号)

(3)空格:文件名除了开头之外任何地方均可使用空格,如果空格用在文件名的第一个字符,系统将忽略不计;

(4)大小写:使用英文文件名,大小写不做区分,但系统在显示时可以保留大小写格式。

2.常用软件的自行命名规则

所谓自行命名规则,是指在没有人为填写、修改的情况下,相关软件在保存文件时自动形成文件名的方式。

(1)Word:若通过单击右键新建文档,将自动命名为:《新建 Microsoft Word 文档》;若通过双击桌面图标新建文档,在尚未写入内容时即保存,将自动命名为:《文档1》或《Doc1》;如果已写入内容后保存,则将首段(行)文字内容命名为文件名,如《民事起诉状》、《辩护词》、《情况说明》等,但不会保留首段(行)第一个标点符号及符号之后的内容,如:文档首段(行)为:律师的随身“装备”,自动命名将保存为《律师的随身》。

(2)Excel:若通过单击右键新建文档,将自动命名为:《新建 Microsoft Excel 工作表》;若通过双击桌面图标新建文档,无论是否写入内容保存,系统将自动命名为:《工作簿1》或《Book1》。

(3)PowerPoint:若通过单击右键新建文档,将自动命名为:《新建 Microsoft PowerPoint 演示文稿》;若通过双击桌面图标新建文档,在尚未写入内容时即保存,系统将自动命名为:《演示文稿1》;如果已写入内容后保存,则将首页添加标题框中的文字内容命名为文件名。

(4)记事本(txt):不具备自行命名功能,必须人为输入文件名。

(5)写字板(RTF):新建文档后,无论是否写入内容保存,都将自行命名为:《文档》。

(6)照片、视频:照相机或手机拍摄软件具有自动命名功能,常见有:照片061、DSC_1398、IMG_0581、20191124_100846等方式。需要注意的是,通过微信传送的照片、视频下载保存后,原始名称会变化为:210319140318396286e944920、tmpvideo_780138.4935648334、mmexport1464958066816等形式。

(7)音频:录音笔或手机录音软件具有自动命名功能,常见有:20181023_165901、2018-09-23_19时38分26秒等方式。

数据文件命名的常见问题

从技术角度而言,目前对文件的识别、检索和区分几乎都依赖于文件名中的信息得以实现。在律师执业初期,文件命名问题往往未能引起足够重视,更少有系统化、规范化的考虑和处理,随着文件数量的不断增加,易出现下列问题:

1.无法及时找出所需文件

若文件系自行命名,后期也未予修改,则信息泛化的初始文件名将一直保留,如:将案件的起诉状仅保存命名为《民事起诉状》。当需要找出该文件时,无法通过文件名中的信息进行有效检索。

2.文件不同版本之间难以区分

法律文件往往需要经过多次修改,常通过无规律添加标记的方式对后续版本进行命名,如:《文档2》、《Doc5》、《新建 Microsoft Word 文档 (6)》或《民事起诉状2》、《辩护词666》、《情况说明1111》等。

此外,法律法规等规范性文件更新后,有的仅以《中华人民共和国公司法(新)》、《中华人民共和国公司登记管理条例(修订)》、《最高人民法院关于人民法院审理离婚案件处理子女抚养问题的若干具体意见(有效)》等方式予以笼统标识。

上述命名方式,会导致文件的不同版本之间难以通过文件名进行明确区分,亦无法看出规范性文件的文号、修订或实施日期等关键信息。

数据文件命名的原则和具体方式

当拥有海量文件时,对文件的识别、检索和区分至关重要。文件命名并非越长或越详细越好,一是因为文件名长度有限,规则不宜太过复杂;再则过长的文件名难以在手机或显示器上全文显示,反而不便于查看。故文件命名原则上应做到清晰表明文件核心内容、便于识别、检索和区分。

关于具体的命名规则,笔者的实践如下:先统一将日期按照年月日的顺序编为8位或者12位阿拉伯数字,如20110308或20190528 11:58,再将数据文件分为文档类文件和音像类文件,适用不同规则:

1.文档类数据文件的命名规则

文档类数据文件,是指word文档、Excel文档、PowerPoint文档、记事本(txt)、写字板(RTF)等主要用于文字、数据编辑的软件所形成的文件。其命名规则是:将文件名分为“标题+注释”两个部分,前者与文档内大标题保持一致,后者根据文档的类型不同而有所区别。

(1)普通文档,按照:标题+(日期)的方式命名;

例:《律师的随身“装备”(20190828)》

(2)案件类法律文书,按照:标题+(案由)+(日期)的方式命名;

例:《民事起诉状(武汉市某高科技集团有限公司诉武汉某商贸公司股权转让纠纷案)(20200501)》

若对上述两类文件进行修改,改后版本以尾部括号内标注的8位日期数字相区别;若同日内有多次修改,则尾部括号内以12位日期+时间标注相区别。

例:《律师的随身“装备”(20190828 10:36)》

《民事起诉状(武汉市某高科技集团有限公司诉武汉某商贸公司股权转让纠纷案)(20200501 15:38)》

(3)法律法规等规范性文件,其核心信息为名称和版本,故其命名方式为:标题+(文号)+(施行日期);

例:《中华人民共和国外商投资法(中华人民共和国主席令 第二十六号)(20200101)》

《最高人民法院关于适用若干问题的解释(法释〔2019〕20号)(20200101)》

(4)外发文档,尤其发给上级单位汇总时,文件的可识别命名是一项基本要求,试想:如果收件人收到的文件名都是“表格”、“发言”、“报告”,势必易造成混淆,故按照:标题+(单位或姓名)的规则命名;

例:《武汉市推进重大工程、重大行动情况汇总表(武汉市司法局 律师进村行动)》

2.音像类数据文件的命名方式

音像类数据文件,主要是指照片、音频、视频等由拍摄、录制软件所形成的文件,具有较强的时间顺序性特征,可将时间信息放在文件名的首部,这样系统可以自动将文件按命名时间顺序排列(注意:中文数字一、二、三……并非按照大小而是拼音首字母排序)。其命名规则是:将文件名分为“日期+注释”两个部分,前者以8位数字标注形成日期,注释内容为:何人+何地+何事。

(1)照片

例:20191214-陈亮律师在市民之家第268期市民大讲堂接受采访,讲述“防范非法集资”的故事。

(2)音频

例:20190520-陈亮律师在武汉经济广播台《财富早点到》栏目录制继承法专题知识。

(3)视频

例:20191021-特邀调解员陈亮至江汉区人民法院开展首例在线案件调解。

如果同一天有数个文件或同一文件有修改编辑版本,可以在尾部加“-1”“-2”予以区分。

在大数据时代,我们在享受数据便利的同时,容易忽略对自身“小数据”的有效利用。笔者在律师执业过程中沉淀的文件有三万余个,上述命名方式有助于有效识别、检索和区分文件。当然,数据文件的命名没有既定之规,完全可以遵循习惯给自己定制一套简便好用的规则。相信随着时间的推移和文件数量的不断增加,文件命名的规范化对后期法律工作带来的益处将不断显现。

作者简介:陈亮律师,男,湖北好律律师事务所主任、创始合伙人,主要从事公司法、房产及婚姻继承法律事务,任湖北省安徽商会、共青团武汉市委、武汉市东西湖区人民政府等大型企事业单位常年法律顾问,现为中国法学会会员、武汉市律师协会直属支部书记、公司法专委会副主任、武汉市人民检察院人民监督员、长江日报公益律师服务中心理事、武汉市信访事项复查复核专家库成员、武汉市新社会阶层人士联谊会会员,入选武汉市青年律师“双百”计划首批青年英才律师。

版权声明:本文源自 网络, 于,由 楠木轩 整理发布,共 3701 字。

转载请注明: 在大数据时代标识“小数据” ——浅谈律师数据文件的命名规则 - 楠木轩