📝

著作権から見たGitHub Copilot

2022/07/03に公開約5,700字1件のコメント

免責

まず、この文書の著者は法律の専門家でもなく機械学習の専門家でもありません。またどちらも専門教育の経験や学位があるわけでもないので一意見として読んでいただくとありがたいです。また国内法以外の法律には明るくないため、米国法などは知識が浅いです。またこの文書が扱っている事項は著作権法のみであり、個々のライセンスの侵害などについては扱いません。

はじめに:AI創作物と著作権

近年、機械学習などの人工知能技術の進展により文章や絵画などの学習と生成が容易にできるようになりました。こういった状況下で気になるのは機械学習などの人工知能技術によって生成された各種創作物(今後はAI創作物と表記します)の権利関係です。本稿ではプログラム[1]生成、特にGitHub Copilot[2]に関係する著作権について記述しました。

知的財産権のおさらい

創作活動の成果には知的財産権という権利が付与されます。知的財産権は産業財産権、著作権、回路配置権、育成者権などの権利を含みます。このうちコードが関係する知的財産権は産業財産権と著作権です。産業財産権は特許権や実用新案権を含む権利であり、産業財産権の維持には申請と手数料が必要です。GitHub Copilotの学習データ(特に日本国外で製作されたプログラム)に関しては産業財産権を維持しているとは考えづらいため、本稿では著作権について取り扱います。 GitHubにはTensorflowやOpenCVなど特許を含むコードが公開されており、これらのコードを学習している可能性が高く使用には注意が必要です。なお本稿は依然として著作権についてのみ取り扱います。[3]

OSSと産業財産権

余談ですが、産業財産権は方式主義(認められるには申請が必要)のうち先願主義(先に出願した出願人が権利を得る)のため、OSS(特に日本国外で製作されたOSS)において第三者に取得されることがしばしば発生します。有名な例ではPythonの商標権が株式会社アークによって取得されたのち、Python Software Foundationによって取消審判が行われたのち再取得されました。

著作権のおさらい

では著作権はどういった権利でしょうか。著作権は著作物に付与される排他的な権利です。公表権や貸与権などの権利を独占的に利用できます。著作権が付与される著作物は以下のように定義されています。

思想又は感情を創作的に表現したものであつて、文芸、学術、美術又は音楽の範囲に属するものをいう。

また第十条(著作物の例示)

この法律にいう著作物を例示すると、おおむね次のとおりである。... 九 プログラムの著作物

としてプログラムも保護の対象であることが明記されています。
日本国外で製作された著作物についても万国著作権条約とベルヌ条約によって保護されています。
著作権は譲渡の可否によって著作財産権(譲渡が可能。複製権や翻訳権など)と著作人格権(譲渡不可。同一性保持権や公表権など)に大別されます。
(ちなみに業務指示によって製作され法人名で公表された著作物の著作権は法人に帰属し、著作人格権も法人のものとなります。余談ですがプログラムだけは法人名で公表しない場合でも法人に帰属します)

著作権とライセンス

エンジニアの皆様方であれば、利用するライブラリや引用するコードのライセンスに気を使う等の運用をされていることかと思います。しかし、それに違反した場合どんな法で効力を発揮するかまでは知らない方も多いのではないでしょうか。
まず最初に考えられるのは著作権の著作人格権にある公表権です。これは著作者が著作物をいつどのようにどのような制約で公表するかを決めることができる権利です。次に考えられるのが同一性保持権です。著作者の意に反する改変を受けないようにする権利です。その他民法(契約の自由と締結)と商法が関わるかもしれません。(このあたりの法律は著者の知識がないのでわかりません)

著作権と電子計算機(コンピュータ)

(少し本題とそれますが)複製が容易なプログラムやデータに関しては他の著作物とは異なった扱いをされることが多いです。特に複製や改変については例外規定が多いため注意が必要です。例えば海賊版規制の議論で生じた「メモリ上やディスク上に保存したデータは著作権違反か」といった論争は記憶に新しいですが、これもデータの複製や改変の容易さからなるものと考えて良いでしょう。
(ちなみに海賊版ダウンロード規制が盛り込まれた2021年10月施行の著作権法改正でプログラムの著作物に係る登録制度が改正されています!特にプログラムの同一性証明などの制度が創設されているので知っていて損はないと思います)

著作権侵害と構成要素

著作権侵害と認められるには何が必要でしょうか?著作権侵害と認められる要件から探ってみましょう。

依拠性

まず、当然ですが侵害元となる著作物が存在することが大前提です。この時、侵害元は著作物である必要があります。何を当然のことをと思うかもしれませんが、著作物と認められない表現物との類似は著作権侵害ではなく、よく裁判で争われる焦点になります。例えばデータベースは創作的な表現がなされていないため、無断で複製したとしても著作権侵害とは見なされません。また偶然に同じ著作物を製作した場合にも依拠性は認められません。

偶然の一致

偶然同じ創作物を製作した場合には著作権侵害は認められない、とするのが一般的な見方です。これは著作権が無方式主義(申請しなくとも権利を得られる。産業財産権は方式主義)をとるため、偶然同じ創作物を製作し両方に著作権が付与される可能性を排除できないからです。ただし実際に知っていた・知らなかったことを証明することが困難であることは想像に難くないと思います。

偶然の一致が認められた判例はワン・レイニーナイト・イン・トーキョー事件などです。

創作性

著作権が成立するには創作性が必要です。創作性は著作物が独自の要素を含み、著作物足りうるかを判断します。すなわち、一般的な表現や誰が作っても同じようになる表現などは創作性がないと判断され、著作権侵害とは当たらないと判断されます。

プログラムの創作性が問われた判例はシステムサイエンス事件などです。

問題なくGitHub Copilotを利用するには

これまで長々と著作権について記述してきましたが本当にGitHub Copilotは使えないのでしょうか?
構成要素を踏まえると、いくつかの点を効力すると使うことができる可能性があります。

創作性を判断できること

GitHub Copilotは一般的な用法であれば、独自性のあるプログラムを書くためにプログラマを補助する形でヒントとなるプログラムの一部を出力する、といった用法で使用されると思います。この用法であれば、プログラマは提示されたヒントを採用するかしないかの選択ができ、また提示されたプログラムの編集を行うこともできます。このような用法では、プログラマはそのプログラムが独自性の有無を判断できる状況であれば問題なく使用できると思います。これは著作権侵害の構成要件に依拠性や創作性が存在するため、これらを満たさなければ著作権侵害とはならないからです。逆にいえば、これらの判断がつかない状態でGitHub Copilotを採用することは避けた方が良いでしょう。
これはGitHub Copilot自身言及しています:

https://docs.github.com/en/copilot/overview-of-github-copilot/about-github-copilot#using-github-copilot

"We recommend you take the same precautions when using code generated by GitHub Copilot that you would when using any code you didn't write yourself."
筆者訳:"我々(GitHub)は自分で書いたコードと同様の予防策をGitHub Copilotで生成されたコードにも行うことを推奨します。"

コードのクオリティやセキュリティの文脈での文ではありますが、クオリティの一部としてライセンシングに関しても同様のことは言えると思います。

法的効力の発揮する可能性のある文を含まないこと

GitHub Copilotはライセンス条項や著作者情報をプログラムの一部として学習しているため、それらの情報がプログラムとして出力される可能性があります。これらが出力された場合、そのプログラム上のライセンスや著作者情報が効力を発揮してしまい、商用利用ができないなどの意図しない運用を強いられる危険が存在します。これらの出力は創作した表現の一部、すなわちプログラムを構成する一つとして意図して記述されたものとみなされ、それが自分の意志として扱われます。もしGitHub Copilotを利用するならば法的効力の発揮する可能性のある文の調査を行うべきでしょう。

結論

結論として、GitHub Copilotが書き出すプログラムは著作権侵害や法的なリスクが存在するため必要に応じて適切な判断や改変の必要がある、というのが私としての意見です。もっとも、これはGitHub Copilotのみならず文書生成を行うあらゆる機械学習システムがそのリスクを負うものであるため、AI創作物を扱うには同様の注意が必要でしょう。
AI生成物の法対応については日本含む各国が対応に追われて活発な議論が行われている最中であり、今後もAIの進展に伴いさらなる活発化が予想されます。今後の議論と法改正に注目が集まることだろうと思います。
最後に、ここまで読んでいただきありがとうございました。

おまけ:著作権は人間特権か?

https://zenn.dev/uhyo/articles/github-copilot-and-human-privilege
の文書に照らし合わせてみれば、これは人間特権と呼ばれるでしょう。その理由は現行の日本国の法律は人間のための法律だからです。もっとも、違う言い方をすればまだ現行法がAI創作物に対応できていないだけということもできると思います。

例えばもし人工知能が今日突然意志が芽生えたレベルに達したとしても、法律が変わらない限り法律上は意志あるものとしては認められない上に、それを使用する者の責任が問われることは当然と言えるでしょう。
前述の通り業務指示でプログラムを作成した場合は法人に帰属しますが、著作権侵害の場合の訴えられる先も当然法人となります。その場合従業員だけでなくその監督者にも責任は逃れられないでしょう。
自動運転車に関しても「運転AIが勝手に事故を起こしたので自分に責任はない!」という訴えは(PL法の範囲外であれば)退けられると思います。簡単にいえば大いなる力には大いなる責任が伴うということです。

人工知能に著作権を付与するといった考えも非現実的です。前述の通り、著作権は著作人格権と著作財産権によって構成されています。日本国憲法、特に人権に紐付く(財産権:第二十九条、人格権:第十三条)これらを機械に帰属できるようにする改正は非常に重要な課題となるでしょう。少なくとも現時点では不可能のように思われます。

過去の著作権が複製が容易なプログラムに対応したように、便利すぎる機械、いわゆる人工知能に対しても適切な法改正が行われることを望みます。

参考文献

https://elaws.e-gov.go.jp/document?lawid=345AC0000000048
https://www.jpo.go.jp/system/basic/index.html
https://www.cric.or.jp/qa/hajime/index.html
https://www.bunka.go.jp/seisaku/chosakuken/index.html
https://www.kantei.go.jp/jp/singi/titeki2/tyousakai/kensho_hyoka_kikaku/2016/jisedai_tizai/dai4/siryou2.pdf
https://www.bunka.go.jp/seisaku/chosakuken/hokaisei/r02_hokaisei/
脚注
  1. 本稿のプログラムの定義は著作権法の定義に準拠します。そのためコードも含みます。 ↩︎

  2. GitHub, Inc. によって提供される https://github.com/features/copilot サービスを指します。 ↩︎

  3. 7月5日追記。Ryo IGARASHI氏のご指摘によって修正しました ↩︎

Discussion

誤字脱字の修正、わかりにくい表現の追記を行いました。

ログインするとコメントできます