label-studio导入数据集同时共享给他人标注

label-studio使用

Posted by ThreeStones1029 on November 3, 2023

[toc]

一、前言

上次写博客还是三个月前,希望接下来的一段时间可以把前面几个月学到的一些内容沉淀下来。本文将介绍一个标注软件label studio如何导入数据集,以及如何分享链接给他人标注。

PS:本文默认已经安装好label studio,安装过程可以看官方文档,本文使用的是pip安装在虚拟环境。 系统:ubuntu20.04

二、导入数据集

2.1.设置环境变量

在启动虚拟环境之前需要先设置环境变量允许访问本地文档

export LABEL_STUDIO_LOCAL_FILES_SERVING_ENABLED=true

设置数据集路径,设置为数据集的上一个文件夹即可,例如:如果数据集在/home/user/desktop/A/dataset,则设置为/home/user/desktop/A

export LABEL_STUDIO_LOCAL_FILES_DOCUMENT_ROOT=/home/user...

2.2.启动label studio

2.3.1激活label studio安装的环境

例如:

conda activate label-studio

2.3.2.启动label studio

label-studio start 

也可以指定端口用于分享给他人,指定的端口号不要被占用即可

label-studio start --port 5000

2.3.设置clould storage

2.3.1.新建项目

需要先新建一个项目,来导入数据集标注

2.3.2.开始设置clould storage

依次点击项目对应的settings,然后点击clould storage,先点击add source storage设置输入数据集路径。 Storage Type:打开后选择local files Storage Title设置显示的数据集名字 Absolute local path:数据集的路径,一般是设置的环境环境变量下的某个文件夹,例如这里:/home/user/desktop/A/dataset File Filter Regex:文件过滤器,例如如果你只需要显示数据集里面的的png,则可以使用.*png过滤。 Treat every bucket object as a source file:打开 可以先点击check connection 如果设置没有错误,会显示成功连接 点击保存,再点击sync storage既可以看到数据集被导入了。

三、分享给他人标注

3.1.开放端口

这里的端口也即label-studio所运行的端口,运行(port_number为端口号)

sudo ufw allow port_number
sudo ufw enable

查看端口是否开放

sudo ufw status

若没有ufw需要先安装,安装命令

sudo apt-get update
sudp apt-get install ufw

3.2.查看ip

运行,得到ip地址

ifconfig

3.3.生成链接

输入这个即可访问

http://ip:port

值得注意的是,需要在同一个局域网才能访问