Skip to content

Latest commit

 

History

History
36 lines (22 loc) · 2.71 KB

create_dataset.md

File metadata and controls

36 lines (22 loc) · 2.71 KB

创建数据集

K-Lab页面下的我的数据集中点击蓝色+来进行数据集的创建。

image description

该功能分为两个步骤,数据集制作与数据集信息完善。

数据集制作

上传数据集图片:上传一个能够代表数据集内容的封面图片。

填写数据集名称:对将要创建的数据集进行命名。

设置挂载目录:挂载目录是可以在K-Lab Notebook中访问到数据集的地址,挂载目录的设置支持字母、数字及下划线,在创建后不可修改。以上传名为vgsalesGlobale.csv的数据文件为例,若设置挂载目录为 first_dataset,则在运行挂载了该数据集的K-Lab项目时,可以在 /home/kesci/input/first_dataset/目录下访问到该数据集。

填写数据集短描述:简单介绍一下数据集内容。

添加文件:K-Lab支持用户在一个数据集目录下面上传不超过20个文件,文件总大小不超过500M,上传文件格式不限。推荐用户上传csv格式文件。K-lab支持csv格式文件内容的预览。若文件数目较多,建议压缩成zip文档后上传,K-Lab将自动解压一级目录下的zip文件。

数据集权限

  • 私有数据集:用户上传的数据集默认为私有数据集,仅上传者可以访问及使用。注意:如果用户创建的公开项目挂载了私有数据集,该项目被Fork时其他用户将无法访问到项目的数据集。
  • 公有数据集:数据集公开后可以被社区其他用户访问并使用,公开上传的数据集可以被分享,也可以在用户的个人主页找到。注意:数据集公开后,不能再转回私有数据集。

点击创建即可完成数据集的制作。

image description

数据集信息完善

创建好数据集后,创建者可以在K-Lab的数据集详情页面对数据集文档数据文件进行编辑和完善,方便在进行协作时他人能够理解该数据的背景信息。

  • 数据集文档:数据集文档是对数据集背景信息及包含内容的概述。在数据集文档页面,点击右上角的编辑按钮,可以进入编辑状态,参考我们提供的模板,对数据集文档进行完善。

image description

  • 文件信息:在文件信息页面,用户可以预览csv文件的前20行数据,点击编辑按钮后可以修改数据集标注,同时对每个文件编写简介。对于zip格式的文件,用户可以预览压缩包内的文件数量,名称及大小。

image description image description