🏭

最新論文調査:大規模モデル時代における鉄スクラップ CVの現在地

に公開

はじめに

はじめまして。VPoE / AI開発部マネージャーを務める唐澤(@Takarasawa_)です。
EVERSTEELでは、鉄スクラップ画像のAI解析を行うプロダクト「鉄ナビ検収AI」を展開し、鉄鋼業界におけるAI・コンピュータビジョン(CV)技術の社会実装に取り組んでいます。
日々関連分野の技術動向や研究事例の調査についても行っており、本記事では、鉄スクラップリサイクルに関連するCV論文を俯瞰的に粗めの粒度で紹介し、「鉄スクラップ x CV」の現在地をお届けできればと思います。

鉄スクラップ x CV 全体観

近年、AI・CV分野では大規模モデルやマルチモーダル技術の発展が著しく、多様な産業応用が進んでいます。一方で、鉄鋼業界、鉄スクラップ画像を対象としたCVの研究は、ざっくり言えば、それらに比べ発展が大きく遅れている分野と言える印象です。

この分野での開発に身をおく感覚からすると、未成熟さの理由としては、アノテーションに高度なドメイン知識を要するため大規模データセットの整備が容易でないことが大きく、さらに、同様のドメイン性を持つ医療系等と比べ、画像データの撮像自体が困難な環境的側面、データのオープン化が進んでいないカルチャー的側面があるのではないかと思われます。

本記事で取り上げる論文でもクローズドなデータセットを用いる事例が多く、指標の妥当性・再現性が不明であったり、当然それらを使用できないことで研究が積み上がらない、という課題があるように感じます。
結果として、手法においても発展が遅れている印象を受け、後述しますが、YOLOv5等の既存手法を単に適用した、あるいは微修正したといった形が実際に多く見受けられます。

鉄スクラップリサイクルにおけるコアタスク

鉄スクラップのリサイクル工程では、素材の再利用効率と製鋼プロセスの安全性・品質を維持するために、入荷(検収)時点でのスクリーニング工程が重要とされます。
中でもCV観点で言えば、鉄スクラップの分類と等級査定、および異物検出は、実務上きわめて重要なタスクと位置づけられます。以後、各文章はそれぞれCV領域としての説明です。

鉄スクラップ分類・等級査定

まず、鉄スクラップ分類(steel scrap classification)は、形状や構造に基づいてスクラップを種類ごとに判別するタスクです。たとえば、鋼板・丸鋼・角鋼などの区別がこれに該当します。この段階では主に、形態的な特徴に基づくカテゴリ分けが目的となります。

そのうえで行われるのが、等級査定(steel scrap grading)です。こちらは、分類されたスクラップについてさらに厚み・長さ・処理の有無といった外観情報をもとに、等級(グレード)を判定する処理です。これは取引価格や炉への投入判断に直結する要素であり、現在は現場作業者の目視と経験に大きく依存しています。

CV技術を導入することで、属人性排除による査定の標準化・効率化が期待されます。

実用的には最終的にトラック単位での等級査定をする必要がありますが、研究におけるCVタスクとしては物体検出として評価されていることが多く、開発においては、実用性を考慮することも大切となります。

異物検出

次に、異物検出(foreign object detection)は、密閉容器やガスタンク、異種金属など、処理中に事故や品質劣化の原因となりうる異物を検出するタスクです。炉材の破損や爆発事故のリスクを回避するためには、異物を早期に、かつ確実に検出する必要があります。
ここでは物体検出アルゴリズムの精度とスループットが問われます。
CV技術を導入することで、人による異物の見落としを防止し、不純物排除に依る品質の向上、危険物排除に依る安全性への貢献が期待されます。

これらのタスクは、今回紹介する論文でも繰り返し扱われております。前者タスクの等級査定(steel scrap grading)のほうが、焦点を当てられることが少し多い印象です。また実際に(一般的なCVタスク定義とは少し異なりますが)弊社プロダクト「鉄ナビ検収AI」においても、主軸となる2つの機能です。

論文紹介

これらのタスクに対して近年どのようなアプローチがなされているのかを把握するために、本記事では最新の2025年までに発表された関連論文の中から、代表的な7本をピックアップしてご紹介します。

  • "Toward fully automated metal recycling using computer vision and non-prehensile manipulation" [Shuai D. Han+, 2021]
  • "Automated scrap steel grading via a hierarchical learning-based framework" [Qifan Tu+, 2022]
  • "DOES - A multimodal dataset for supervised and unsupervised analysis of steel scrap" [Michael Schäfer+, 2023]
  • "Classification and rating of steel scrap using deep learning" [Wenguang Xu+, 2023]
  • "Deep learning approaches for classification of copper-containing metal scrap in recycling processes" [Gerald Koinig+, 2024]
  • "An efficient and accurate quality inspection model for steel scraps based on dense small-target detection" [Pengcheng Xiao+, 2024]
  • "A steel scrap recognition model based on machine vision" [Lei Wang+, 2025]

タイトルに "using computer vision", "using deep learning", "deep learning approaches", "based on machine vision" と入るように、一般的なCV論文に比べて、導入してみた段階の内容が多いことがわかります。

本記事の論文紹介では、評価結果についてはクローズドなデータにより信頼性や意味合いが不透明なため割愛します。
なお、論文紹介における画像は全て、特別な記述の無い限り、該当論文より引用しています。

Toward fully automated metal recycling using computer vision and non-prehensile manipulation [Shuai D. Han+, 2021]

# metal recycling
# robotics
# object detection / instance segmentation
# Mask R-CNN

こちらは鉄スクラップだけではなく、金属リサイクルについての論文です。(画像中の例には、純粋な銅とアルミニウムの付着した銅の選別が示されています。)

不規則なリサイクル素材の機械的選別の困難性のうち、特に不純物が物理的に付着したスクラップ金属の分離が難しいことを課題点としてあげており、object detection/instance segmentationベースの識別システムを構築しています。

物体検出による認識からロボットアームを用いた選別コンポーネントを含め、データ収集を含めたシステム全体を提案しており、物体検出自体は一般的なMask R-CNNを使用しています。
写真自体は研究室内の小さな環境での実施で、産業界での実現には機材周りの専門性が大きく必要とされそうですが、リサイクルの質の直接的な改善の文脈から、ロボットアームの選別は言及されることが多くあります。

Automated scrap steel grading via a hierarchical learning-based framework [Qifan Tu+, 2022]

# scrap steel grading
# semantic segmentation # instance segmentation
# FCN # YOLACT

一方こちらの論文は純粋なCV論文です。前述の等級査定(scrap steel grading)に取り組んでいます。
画像単位での査定結果(トラック単位ではない)を出すまでをスコープとした実用性を加味し、積載物を含む荷台領域の検出 → 荷台領域からのスクラップ検出 → 検出結果の情報全体からの画像単位の等級査定、という3段階からなるパイプラインが提案されています。

荷台領域検出モジュール(Carriage-attention Module; CaM)
複雑な背景情報を分離、attentionという言い回しですが、内容としては荷台領域のsemantic segmentation。基本的に一般的なFully Convoluitonal Network(FCN)を活用しています。

スクラップ検出モジュール(Scrap Detection Module; SDM)
鉄スクラップの各ピースの検出モジュールで、YOLACTが採用されています。YOLACTはリアルタイム検出を想定した軽量なinstance segmentationモジュールとして知られるもので、加えてfeature mapの扱いに、Multiscale Feature Fused Pyramid (MFFP) の機構が提案され取り入れられています。

スクラップ査定モジュール(Scrap Grading Module; SGM)
検出結果全体からラベルごとの領域割合を抽出したあとそのまま結果とするのではなく、重み付けベイズ分類器を用いて最終的な画像単位の査定結果を予測しています。

データセットと評価
こちらの論文でも、公開データセットが存在していない課題が言及され、自前で高解像度カメラを用いて撮像してデータセットを作成し、評価を実施したことが言及されています。データ自体は非公開です。

DOES - A multimodal dataset for supervised and unsupervised analysis of steel scrap [Michael Schäfer+, 2023]

# image classification
# public dataset

こちらの論文ではデータセット不在の課題に対し、データセット作成提供による直接的解決を図る論文です。

提案データセット:DOES(Dataset of European scrap classes)

欧州データを対象に、非合金のスクラップ画像データにラベルを付け、 classification データセットを構築しています。長期間にわたり撮影された画像に対して、ドメインの専門性を持つ方々の指導のもと、画像から該当部分を抽出して作成を行っています。

特に、スクラップの見かけの難しさとして、酸化による腐食の進行度があることを指摘し、異なる腐食度合いのデータを含めたことをポイントとして挙げています。(ラベル付与ではなく画像データの多様性に関する言及のため、少しアピールポイントの言い回し問題の印象も受けます。)

ラベル自体はざっくりした厚みの分類と、一般的な品種レベルの分類にとどまっている印象です。
併せてResNet等のベースラインに依る結果を提供してくれています。

Classification and rating of steel scrap using deep learning [Wenguang Xu+, 2023]

# steel scrap grading
# object detection
# EfficientDet
# dataset

こちらの論文ではデータセット不在の課題に対してデータセットを自前で作成しつつ、物体検出手法の提案を行っています。タイトルは "classification and rating" ですが、タスクとしては物体検出となっています。(前述のsteel scrap gradingのことを意図した内容です。)

提案データセット: HK_L, HK_T
先程の論文と異なり、データセットは非公開前提ですが、撮像方法などが示されており、2つのデータセットを作成しています:

  • HK_L(Laboratory dataset):自分たちで鉄を購入してきて実験用に構築したデータセット
  • HK_T(Steel mill dataset):テスト用に工場で撮影して構築したデータセット

HK_Tデータセットのほうが焦点が当てられ主張されており、かつHK_Lデータセットのほうが明らかにサイズが小さいですが、実験はほとんどHK_Lが使われています。やはり実験のしやすさ等の事情を感じます。

提案手法:CSBFNet
こちらはいくつかのatteitionモジュールの導入を試し、CSPNetバックボーンのEfficientDetにSEが導入された、最も良かった形をCSBFNetとしています。

Deep learning approaches for classification of copper-containing metal scrap in recycling processes [Gerald Koinig+, 2024]

# foreign object detection # copper
# image classification
# dataset

こちらの論文は、鉄スクラップからの銅の分離の重要性に関して取り組まれた内容です。鉄スクラップに含まれる銅は、トランプエレメント(tramp elements)という再溶解時に除去が困難な有害元素の代表であり、特にその分離は重要とされています。
前述の説明としては異物検出に該当するトピックですが、論文中のCVタスクとしては画像分類の内容となっていて、鉄か銅かの二値分類となっています。
データについては、オーストリアの施設で金属材料を回収して撮像し、データセットを構築したものとなっています。また、コンベア装置を用いたインライン評価も試みています。他論文同様、こちらも非公開データとなっています。


画像分類については、結果は割愛しますが一般的なCNNアーキテクチャ20種の適用が一通り検証されています。VGG-16、AlexNetという懐かしいアーキテクチャから、EfficientNet, DenseNet等が試されDenseNetが良いという結論を主張しています。

An efficient and accurate quality inspection model for steel scraps based on dense small-target detection [Pengcheng Xiao+, 2024]

# steel scrap grading
# object detection # small object detection
# YOLOv5
# dataset

こちらの論文は2つ前のW. Xuらの論文に近い形で、データセット不在の課題に対してデータセットを自前で作成しつつ、物体検出手法が提案されています。特に撮像方法のレイアウト表示が酷似しています。こちらもクローズドなデータセットです。

提案データセット
複数のカメラで撮像を行い、物体検出アノテーションを施し、データセットを構築。厚みや長さに関する9つのカテゴリでラベル付けがされており、こちらのデータセットを用いて全ての実験を評価しています。

提案手法:CNILNet
物体検出手法については、小物体検出としてタスクをより明確に扱い、小物体を扱うための以下2点の工夫がネットワークに取り入れられています:

  • YOLOv5をもとに、小物体検出のためにfeature pyramid network (FPN) から、P2 layerを追加し、P5 layerを削除
  • 更にCoordinate Attention (CA) メカニズムを追加

A steel scrap recognition model based on machine vision [Lei Wang+, 2025]

# steel scrap grading
# foreign object detection
# YOLOv5
# dataset

こちらの論文では、前述した鉄スクラップ分類・等級査定と異物検出の両方について、まとめて取り組む認識システムを、3つの物体検出モデルをベースとして構築しています。
その際、鉄スクラップ分類(タスクとしては物体検出)と異物の検出は、それぞれ同じ形式でラベルを付与し、1つの物体検出として最初のステップで認識が行われるようになっています。
手法については、学習等の条件は不明ですが、3つのモデル全てをYOLOv5を用いて構築しており、論文ではYOLOv5に関する説明がなされています。

データについては、多くは記述されていませんがパーツごとのデータとトラック単位のデータを取ったことが記されており、実験に使用されています。


まとめ

本記事では、「鉄スクラップ × CV」という観点から、鉄リサイクルプロセスにおいて特に重要とされる代表的なタスク、等級査定と異物検出に関して紹介し、研究事例を紹介いたしました。

改めて全体を見渡してみると、データがクローズドな文化がやはり根強く、鉄鋼業界におけるCV技術の発展はまだ限定的と言わざるを得ません。しかしながら、これらのタスクは現場において非常に実用性が高く、AI導入の価値が明確な領域でもあります。

EVERSTEELでは、積極的に近年の最新のCV手法調査・導入についても行い、現場に根ざした実応用のためのデータ設計とモデル開発を通じて、鉄スクラップ業界におけるAI・CV技術の社会実装を牽引できるよう取り組んでまいります。

EVERSTEEL Tech Blog

Discussion