makesense.ai 是一款免费的图片标注的在线工具。多亏使用浏览器,它不需要任何复杂的安装 - 仅通过访问网站就可以了。在什么样的操作系统上运行也不重要 - 我们尽力坐到了真正的跨平台。它非常适合小型电脑上视觉深度学习项目,使准备数据集的过程更加简单和快捷。准备好的标签可以以多种支持的格式下载。该项目是用 TypeScript 编写的,基于 React/Redux 二人组。
For AI to be free we need not just Open Source, but also a strong Open Data movement.
Andrew Ng
Figure 1. 应用程序的基础功能-不包括 AI
makesense.ai 致力于大幅减少我们在图片标注上花费的时间。为了实现这一目标,我们将使用很多不同的人工智能模型,这些模型将能够给你提供建议,以及自动完成重复性和乏味的活动。
- SSD 模型 在COCO 数据集上进行预训练,它将为你做一些在照片画 bboxes (bbox是每个region矩形框的位置信息。)的工作,并且还(在有些情况下)建议一个标签。
- PoseNet 模型 是一个视觉模型,可以通过估计身体关键关节的位置来推定推定或视频中一个人的姿势。
在未来,我们还计划添加,照片分类、检测人脸特征以及整个脸的模型。驱动我们 AI 功能的引擎是 TensorFlow.js - 最流行的神经网络训练框架的 JS 版本。这种选择不仅可以让我们加快你的工作速度,还可以关心你的数据隐私,因为与其它商业和开源工具不同,你的照片不必传输到服务器。这一次,AI 来到了你的设备上!
Figure 2. SSD 模型 - 允许你检测多个对象,加快 bbox 标签过程
Figure 3. PoseNet 模型 - 允许你检测照片中人们的姿势,在某些情况下自动进行点标签
# clone repository
git clone https://github.com/SkalskiP/make-sense.git
# navigate to main dir
cd make-sense
# install dependencies
npm install
# serve with hot reload at localhost:3000
npm start
为了确保应用程序在本地的正常功能,需要 npm6.x.x
和 node.js v11.x.x
版本。关于这个问题的更多信息可以在#16中找到。
# Build Docker Image
docker build -t make_sense docker/
# Run Docker Image as Service
docker run -dit -p 3000:3000 --restart=always --name=make_sense make_sense
# Get Docker Container IP
docker inspect -f '{{range .NetworkSettings.Networks}}{{.IPAddress}}{{end}}' make_sense
# Go to `<DOCKER_CONTAINER_IP>:3000`
# Get Docker Container Logs
docker logs make_sense
Functionality | Context | Mac | Windows / Linux |
---|---|---|---|
Polygon autocomplete | Editor | Enter | Enter |
Cancel polygon drawing | Editor | Escape | Escape |
Delete currently selected label | Editor | Backspace | Delete |
Load previous image | Editor | ⌥ + Left | Ctrl + Left |
Load next image | Editor | ⌥ + Right | Ctrl + Right |
Zoom in | Editor | ⌥ + + | Ctrl + + |
Zoom out | Editor | ⌥ + - | Ctrl + - |
Move image | Editor | Up / Down / Left / Right | Up / Down / Left / Right |
Exit popup | Popup | Escape | Escape |
Table 1. Supported keyboard shortcuts
CSV | YOLO | VOC XML | VGG JSON | COCO JSON | PIXEL MASK | |
---|---|---|---|---|---|---|
Point | ✓ | ✗ | ☐ | ☐ | ☐ | ✗ |
Line | ✓ | ✗ | ✗ | ✗ | ✗ | ✗ |
Rect | ✓ | ✓ | ✓ | ☐ | ☐ | ✗ |
Polygon | ☐ | ✗ | ☐ | ✓ | ✓ | ☐ |
Label | ✓ | ✗ | ✗ | ✗ | ✗ | ✗ |
Table 2. The matrix of supported labels export formats, where:
- ✓ - 支持的格式
- ☐ - 尚未支持的格式
- ✗ - 对于给定的标签类型,格式没有意义
你可以在我们的Wiki上找到导出文件的例子以及描述和模式。
CSV | YOLO | VOC XML | VGG JSON | COCO JSON | PIXEL MASK | |
---|---|---|---|---|---|---|
Point | ☐ | ✗ | ☐ | ☐ | ☐ | ✗ |
Line | ☐ | ✗ | ✗ | ✗ | ✗ | ✗ |
Rect | ☐ | ✓ | ☐ | ☐ | ✓ | ✗ |
Polygon | ☐ | ✗ | ☐ | ☐ | ✓ | ☐ |
Label | ☐ | ✗ | ✗ | ✗ | ✗ | ✗ |
Table 3. The matrix of supported labels import formats
我们不存储您的图片,因为我们不会把他们发送到任何地方。
我们的程序正在积极开发中。请在我们的Wiki上查看我们的近期计划。如果你有新功能的想法,请在Twitter或Gitter上联系我们,或者创建一个issue,在哪里你可以描述你的概念。同事,看看我们在未来为您规划了那些改进。
如果你刚刚开始深度学习的冒险,并希望在这条路上学习了创造一些很酷的东西,makesense.ai可以帮助你。利用我们的边界框标签功能来准备一个数据集,并使用它来训练你的 第一个最先进的对象检测模型。按照说明和示例,但最重要的是,解放你的创造力。
Figure 4. 基于YouTube-8M数据集,检测球员在篮球场上的移动。
欢迎提交 issues 或 pull requests.
@MISC{make-sense,
author = {Piotr Skalski},
title = {{Make Sense}},
howpublished = "\url{https://github.com/SkalskiP/make-sense/}",
year = {2019},
}
本项目采用 GPL-3.0 许可协议进行授权,详见 LICENSE 文件。
Copyright (c) 2019-present, Piotr Skalski