🌊
LabelStudio インストール
Label Studio とは
Label Studioは、オープンソースのデータラベリングツールです。機械学習プロジェクトのためのアノテーション作業を効率化するために設計されています。アメリカのHumanSignal社が開発を行っています。昔はHeartexという社名だったんですが、2023年にHumanSignalに社名を変えてます。(参考)
Label Studioさまざまな学習データに対応しています。
- 自然言語処理
- コンピュータビジョン
- 音声認識
- 時系列データ
Label Studio 3つのエディション
2025年5月時点で、Label Studioには3つのエディションがあります。
- Community Edittion
- オープンソース(Apache 2.0)
- セルフホスト
- Stared cloud
- Humansignalが提供するクラウドサービス
- 月99ドル
- 追加ユーザー1人当たり49ドルで最大8人まで
- Enterprise
- 大規模なAI開発を行うチーム向けの有料版
- セキュアなホステッドクラウドプラットフォームまたはオンプレミスで利用可能
- コミュニティ版の全機能に加えて、大規模な内部・外部チームの管理、専用のロールと権限、分析とレポート機能、稼働時間とサポートのSLAなどが含まれています
Label Studioのセットアップ
ここからはCommunity版を利用する前提で進めます。
Pipによるインストール
公式ドキュメントのInstall using pipで解説されている方法です。Label Studioをとにかく使ってみたい人向け
Label StudioはPythonのpipでインストールすることができます
Linux(Ubuntu)
仮想環境を作ってそこにpipでインストールします。
python3 -m venv env
source env/bin/activate
sudo apt install python3.9-dev
python -m pip install label-studio
Windows
Windowも基本一緒です。
- venvで仮想環境を作る
# Python 3.8以上が必要です
# 仮想環境を作成
python -m venv env
# 仮想環境を有効化
env\Scripts\activate
# Label Studioをインストール
python -m pip install label-studio
# 起動
label-studio
Mac
MacではHomebrewでインストールできます。
# リポジトリ追加
brew tap humansignal/tap
# インストール
brew install humansignal/tap/label-studio
# 起動
label-studio
Dockerでインストール
ローカルにインストール
公式のDockerイメージがdockerhubに公開されているのでそれを利用します。
docker pull heartexlabs/label-studio:latest
docker run -it -p 8080:8080 -v $(pwd)/mydata:/label-studio/data heartexlabs/label-studio:latest
SQLite3のデータベースファイルlabel_studio.sqlite3も作成されます。
アップロードしたデータは./mydataにアップロードされます。
起動オプションを追加することもできます。
ログレベルを指定
docker run -it -p 8080:8080 -v $(pwd)/mydata:/label-studio/data heartexlabs/label-studio:latest --log-level DEBUG
ローカルファイルアクセスを許可(Docker使用時)
ローカルファイルアクセスを許可する場合、環境変数を設定する必要があります。
- LABEL_STUDIO_LOCAL_FILES_SERVING_ENABLED
- LABEL_STUDIO_LOCAL_FILES_DOCUMENT_ROOT
docker run -it -p 8080:8080 -v $(pwd)/mydata:/label-studio/data \
--env LABEL_STUDIO_LOCAL_FILES_SERVING_ENABLED=true \
--env LABEL_STUDIO_LOCAL_FILES_DOCUMENT_ROOT=/label-studio/files \
-v $(pwd)/myfiles:/label-studio/files \
heartexlabs/label-studio:latest label-studio
docker composeを使ったインストール
githubでdocker composeファイルが公開されているのでそれを利用します。
必要があれば適宜編集して使います。
Webサーバーがnginx、データベースがposgresqlになります。
Discussion