在K-Lab页面
下的我的数据集
中点击蓝色+
来进行数据集的创建。
该功能分为两个步骤,数据集制作与数据集信息完善。
上传数据集图片:上传一个能够代表数据集内容的封面图片。
填写数据集名称:对将要创建的数据集进行命名。
设置挂载目录:挂载目录是可以在K-Lab Notebook中访问到数据集的地址,挂载目录的设置支持字母、数字及下划线,在创建后不可修改。以上传名为vgsalesGlobale.csv的数据文件为例,若设置挂载目录为 first_dataset
,则在运行挂载了该数据集的K-Lab项目时,可以在 /home/kesci/input/first_dataset/
目录下访问到该数据集。
填写数据集短描述:简单介绍一下数据集内容。
添加文件:K-Lab支持用户在一个数据集目录下面上传不超过20个文件,文件总大小不超过500M,上传文件格式不限。推荐用户上传csv格式文件。K-lab支持csv格式文件内容的预览。若文件数目较多,建议压缩成zip文档后上传,K-Lab将自动解压一级目录下的zip文件。
数据集权限:
- 私有数据集:用户上传的数据集默认为私有数据集,仅上传者可以访问及使用。注意:如果用户创建的公开项目挂载了私有数据集,该项目被Fork时其他用户将无法访问到项目的数据集。
- 公有数据集:数据集公开后可以被社区其他用户访问并使用,公开上传的数据集可以被分享,也可以在用户的个人主页找到。注意:数据集公开后,不能再转回私有数据集。
点击创建即可完成数据集的制作。
创建好数据集后,创建者可以在K-Lab的数据集详情页面对数据集文档和数据文件进行编辑和完善,方便在进行协作时他人能够理解该数据的背景信息。
- 数据集文档:数据集文档是对数据集背景信息及包含内容的概述。在数据集文档页面,点击右上角的编辑按钮,可以进入编辑状态,参考我们提供的模板,对数据集文档进行完善。
- 文件信息:在文件信息页面,用户可以预览csv文件的前20行数据,点击编辑按钮后可以修改数据集标注,同时对每个文件编写简介。对于zip格式的文件,用户可以预览压缩包内的文件数量,名称及大小。