SD1.5系を使うなら知っておきたいNAIリーク問題

2024年10月15日

NovelAIというwebサービスで使われているモデルが不正に流出したことがあって、そのモデルが色んなモデルに混じってるかもしれないという話です。

私はこの事件の後にAIを使い始めたので、細かい部分に間違いがあったらすみません。

経緯

NovelAIコミュニティの皆さま いつもNovelAIをご利用いただき誠にありがとうございます。 ご迷惑をおかけし申し訳ごぜいません。 2022年10月6日に弊社のGitHubとセカンダリリポジトリに権限のない第三者による不正なアクセスを許してしまいました。

@novelaiofficial

上記はNovelAIの公式ポストです。この時に流出したモデルを「NAIリークモデル」と呼びます。

このNAIリークモデルをマージして(混ぜて)別のモデルが作られました。実際に「NAIリークモデルをマージした」と明言されているモデルや、そのマージモデルをさらにマージして作られたモデル、そしてさらに…と、どんどん増えたようです。

「NAIリークモデルをマージした」と明言されてはいないけど、マージしているモデルもあると思われます。そのモデルをさらにマージ…と繰り返していけば、もうリークモデルが含まれているのかどうかわからない。もちろんそういったことを嫌って、NAIリークモデルをマージしてないモデルもあると思います。

今のSD1.5系モデルはこのように混沌とした状況です。

リークモデルを使用することは、カスタマーサポート、ドキュメンテーション、UXと一般的な品質基準、私たちのサービスの標準である暗号化を提供できません。また、これらのモデルはNovelAIを正確に反映したものではなく、私達はリークモデルを使用しないことを強く勧めます。自身のパソコンへのインストールやオンラインホストバージョンは、セキュリティとプライバシーのリスクを引き起こすかもしれません。 リークモデルを見かけた場合、法的措置を取る場合もあります

@novelaiofficial

その後、NovelAIはこのポストをしました。このツリーで「マージモデルはどうか?」と質問がありますが、NovelAIからの返信はありません。

アスカテスト

NovelAIによる「リークモデル使わないでね」のポストがあってから、「アスカテスト」「アスカチャレンジ」といわれる手法でモデルをチェックするのが一瞬流行りました。NAIリークモデルの出力に近いものが出たら黒、みたいなテストです。

アスカテストって「アスカが足を組んで椅子に座ってる」画像を表示させるテストなので、正しくアスカを学習した高性能のモデルならNAIみたくなるのは当たり前なんですよね。 一致(または酷似も?)したらリークなんだろうけど。

@Ai_tensa

ただし、このようなことをおっしゃる方もいて、現状NAIリークモデルが混ざってるかどうかは判別することはできないようです。

問題

知的財産権の侵害という法的な問題、「盗品とわかってて使うのはよくないよね」という倫理的な問題があります。

調べた限りだと、NAI流出は不正競争防止法の営業秘密侵害行為類型に該当して、3つの要件を満たし且つ、パリ条約等により外国であっても適用され、更に平成28年施行法により三次的取得者以降の者も処罰対象になる (資料は経済産業省 知的財産政策室による)

しかし、図に書かれているように、法では知らなければ対象外、知らずに契約して取得したものは契約の範囲内なので、隠せば無罪、賢いという指摘は正しいような気がする なお不正競争防止法は昨日初めて読んだので詳しい人の指摘いただけると勉強になります

@K4JZ2fj6ek96984

不正競争防止法についてはこのような解釈もあるようです。ただし、この方は法曹や法学者ではないと思われますのでその点はご留意ください。

NAIリークモデルを使用して金銭を稼いでいたという事実はクリエイターにとっての汚点となる可能性がある。

AI絵師と著作権の問題、いろいろごっちゃにしてません? -①AIモデル編- Sepia

倫理的な問題として、特にプロクリエイターの方、プロを目指している方はこのことを認識しておいた方がいいでしょう。(この「リークモデル」という単語はリークマージモデルを含むと思います)

例えば、現在著名なゲーム制作者の方が「昔マジコンを使っていた」と暴かれて炎上するような、そういう事例と似た事がSD1系でも起こらないとは言えません。

画像AIのSDXL+加筆で、AIっぽい違和感が気にならない縦読みカラー漫画が作れないか実験してみた のびsiro

こちらのnoteでも言及されています。

関わりたくない方は…

NAIリークモデルはSD1.5系のモデルで、マージできるのは同じSD1.5系のモデルのみです。ですので、SD2系やSDXL系のモデルを使えば大丈夫だと言われています。(個人的には、リークモデルの生成物で学習しててもいいのか?というのが気になっていますが)(多分大丈夫なのかな)

この問題に関わりたくないなら、SD1.5系の「リークを含まない」と明記しているモデル(あるのかな?あるはず)も避けた方がいいと思います。生成したものを見て、何のモデルを使ってるかがわからなくても「SD1.5系だな」というのはわかる場合が多いからです。SD1.5系=NAIリークモデルが含まれている、と判断されるかもしれません。

私がSD1.5系を使っている理由

ここまで書いたリスクを認識した上で、私はSD1.5系のモデルを使用しています。リークモデルや、リークマージモデルだと言われているものは使っていませんが、普段使っているモデルにリークモデルが混ざってないかどうかは判別できません。

SD1.5系のモデルを使用している理由は、ControlNetの精度がいいからです。SD2やSDXL用のControlNetの精度が上がるか、自分が妥協できるようになれば、SD1.5系を使うのはやめると思います。

このブログでは主に SD1.5 系を扱っているので、一応書いておいたほうがいいかなと思って書きました。「みんな知ってるよ!」って感じかもしれないけど…。

2024/5/1追記

現在は1.5系のモデルは使っていません。相変わらずXL系の ControlNet は1.5系ほどの精度は出ないのですが、自分がそこまでの精度を求めなくなったというところが大きいです。AIにかけることで自分の絵が多少変わっても「まあ加筆すればいいだけだし」というマインドになってきました。慣れですね。

それと lineart を使ったAI塗りに関しては、copainter が優秀なので自分で webUI でやる必要がなくなったというのもあります。今までありがとう lineart 。

NAIリーク問題に終止符か?(2024/9/8追記)

AI画像生成分野の進展に伴い、研究、個人使用、履歴の保存のために、弊社の初代画像生成モデル(NovelAI Diffusion Animeキュレート版/フルおよびFurry)のウェイトを公開します。

@novelaiofficial

2024/8/23、NovelAIから初代画像生成モデルが公開されました。これはリークされたものと同じバージョンであり、同じモデルだと考えられます。

モデルは、当初のCreativeML Open RAIL-Mライセンスとクリエイティブ・コモンズBY-NC-SA 4.0ライセンスの両方の条件を適用するデュアルライセンスに基づいて公開されます。これにより、上記条件のもとで適切に帰属され配布される限り、非商用目的での利用、再配布、二次的著作物の作成が可能です。

NovelAI Diffusion V1 Weights Release (JP)

公開されたモデルはライセンスに従って利用することが認められました。これによりリークモデルを使用することなく合法的にNAIの恩恵を受けることができるようになりました。

既存のリークマージモデル等には先述したような問題が残っています。しかし、そもそもSD1.5系自体がもう使ってる人がだいぶ少なくなってると思いますし、「NAIリーク問題は過去の話…」のような雰囲気になっていたところで今回の公開でした。完全解決とは言えませんが、公式モデルを使うという法的にも倫理的にもクリアな選択肢が提供されたことで、ユーザーが安心できる環境になったと思います。

おわり。

その他,未分類SD1.5系

Posted by 令五