Prisma が究極の「AI」画像編集アプリだった時代を覚えていますか?ええ、それ以来、私たちは確かに長い道のりを歩んできました。 DALL-E や Midjourney などのプロンプトベースの AI 画像ジェネレーターの台頭により、アートやディープフェイクの作成は、ほぼすべての人が利用できるようになりました。

でも限界はありますよね? Midjourney にさまざまなプロンプトを想像させ、それが何を投げ出すかを確認するという最初の目新しさの後、それはすべてかなり退屈になります。または、少なくとも私にとってはそうでした。

自己陶酔的なエネルギー?

見てください、私は内向的です。つまり、外出があまり好きではないということです。しかし、あなたは私が好きなことを知っていますか?おそらく決して行かない場所で自分の写真を撮る。ねえ、私も行けない場所。

当然、さまざまな状況や場所での自分の画像を A​​I ツールに作成してもらいたいと思いました。ただし、結果が良いことを期待して、ランダムな Web サイトに自分の画像をアップロードしたくもありませんでした。それがDreamboothについて読んだときです。

ゲームを始めましょう…

本当に頭のいい人たちが、Stable Diffusion のようなものを大衆にもたらしました。さらに、他の人たちは彼らと協力して、文字通り誰でもある程度の忍耐力を持って、独自の Stable Diffusion モデルを作成し、完全にオンラインで実行できるようにしました.

だから、私は M1 MacBook Air を持っていますが、ディープ ラーニング画像生成モデルのトレーニング マシンとして使用することを意図したものではありません。Google Colab ノートブックを実行して、Google のサーバーですべてを無料で実行できます。

私が本当に必要としていたのは、自分の写真が 2 枚だけでした。

AI 画像ジェネレーターのトレーニング

独自の画像ジェネレーターのトレーニングはまったく難しくありません。ヘルプが必要な場合はオンラインで利用できるガイドが多数あり、基本的にすべて非常に簡単です。 Colab ノートブックを開いて写真をアップロードし、モデルのトレーニングを開始するだけです。これらはすべて非常に迅速に行われます。

公平を期すために、テキスト エンコーダーのトレーニングは 5 分以内という非常に迅速に行われます。ただし、パラメーターをデフォルトに設定して UNet をトレーニングするには、かなり長い時間がかかります (15 ~ 20 分近く)。しかし、AI モデルが私の顔を認識して描画できるように実際にトレーニングしているという事実を考えると、20 分はそれほど長い時間ではないように思えます。

トレーニング中に、モデルをトレーニングする程度をカスタマイズする方法はたくさんあります。オンラインで多くの人の経験を読んで理解したのは、ここには、本当の「画一的な」戦略はありません。ただし、基本的なユースケースでは、デフォルト値はほとんどの人にとって問題なく機能するように見え、私もそれらに固執しました.理由の 1 つは、ほとんどのことの意味を本当に理解できなかったためです。また、別のトレーニング パラメーターを使用して複数のモデルをトレーニングして、何が最良の結果をもたらすかを確認するのが面倒だったためです。

結局のところ、私は自分の半分まともな画像を作成できる楽しい AI 画像ジェネレーターを探していました。

期待を超える

私はどう考えても AI の専門家ではありません。ただし、512×512 ピクセルにトリミングされた 8 つの jpeg ファイルを使用して Google Colab ノートブックで安定拡散モデルをトレーニングしても、実際には特別な結果にはならないことは理解しています。

私はなんて大間違いだったのでしょう。

トレーニングしたモデルを使用する最初の試みでは、「akshay」という単純なプロンプトから始めました。以下が生成した画像です。

よくないですね。しかし、それもそれほど悪くはありませんよね?

しかし、その後、UI で使用できるいくつかのパラメーターをいじり始めました。複数のサンプリング方法があり、サンプリング ステップ、CFG スケール、スクリプトなどがあります。モデルのさまざまなプロンプトとセットアップを試して、少し夢中になる時が来ました。

明らかに、これらの画像の結果は完璧ではありません。私を見た人なら誰でも、これらが「私の」画像ではないことがわかるでしょう。ただし、それらは十分に近いです。特に注意してモデルをトレーニングすることさえしませんでした。

Reddit やインターネット上の他の場所で、トレーニングを改善し、Dreambooth と Stable Diffusion からより良い結果を得る方法について説明している数え切れないほどのガイドに従っていれば、これらの画像はさらに現実的なものになったかもしれません。 (そして間違いなく、もっと怖い)。

この AI 画像ジェネレーターは恐ろしいほど優れています

ほら、私は AI 技術の改善に大賛成です。テクノロジー ジャーナリストとして、私はここ数年、消費者向け AI の絶え間なく変化し、改善している分野を追ってきましたが、ほとんどの場合、深く感銘を受け、楽観的です。

しかし、Dreambooth のようなものが動作しているのを見ると、コンピュータとインターネットにアクセスできる基本的に誰でも AI と ML ベースのツールを簡単に利用できる非倫理的な方法について疑問に思います.

世界中に悪役がたくさんいることに疑いの余地はありません。このような簡単にアクセスできるテクノロジーの無害なユースケースは確かに存在しますが、テクノロジーに関する長年のレポートで私が学んだことが1つあるとすれば、製品を何百万人もの人々の手に渡すことは、間違いなく多くの望ましくない結果をもたらすということです..せいぜい予想外の何かであり、最悪の場合はまったく嫌なものです。

5 枚から 10 枚の顔写真を入手できる限り、ほぼすべての人物のディープフェイク画像を作成できますが、使い方を誤ると非常に危険です。誤報、不実表示、さらにはリベンジ ポルノを考えてみてください。ディープフェイクは、これらの問題のあるすべての方法で使用される可能性があります。

セーフガード?

Dreambooth だけではありません。 Dreambooth と Stable Diffusion は、それ自体がよく使われ、AI ができることを体験できる素晴らしいツールです。しかし、私がこれまでに経験したことから、この技術に対する真の安全策はありません。もちろん、画像に完全なヌードを生成することはできません。少なくともデフォルトでは。ただし、そのフィルターをバイパスして、誰の身元にも基づいて想像できるほとんどすべてを作成できる拡張機能がたくさんあります.

そのような拡張機能がなくても、このようなツールを簡単に入手して、人々の不快で評判の悪いさまざまな画像を作成できます.

さらに、十分に強力な PC を使用すると、保護手段を一切使用せずに、使用したいトレーニング データに基づいて独自の AI モデルをトレーニングできます。

ディープフェイクは新しいものではありません。実際、オンラインにはディープフェイクの動画やメディアが大量に存在します。しかし、最近まで、ディープフェイクの作成は、「有能なハードウェアを持つ人々」と「技術的ノウハウ」の交差点に存在する比較的少数の (それでも多数ではありますが) 人々に限定されていました。

現在、Google Colab で無料の (使用制限付き) GPU コンピューティング ユニットにアクセスし、Google のサーバーで AI モデルをトレーニングして使用できる fast-dreambooth のようなツールを利用できるようになったことで、その数の人々が飛躍的に上がります。それはおそらくすでに起こっています—それは私にとって恐ろしいことであり、あなたにとってもそうあるべきです.

私たちにできること

それが、私たちがこの時点で自問すべき質問です。 DALL-E、Midjourney、そしてそうです、Dreambooth や Stable Diffusion などのツールは、一般的な人間の品位で使用すると確かに印象的です。 AI は飛躍的に進歩しています。これは、過去 2 か月間の AI 関連のニュースの急増を見ればわかるでしょう。

したがって、これは、AI が倫理的に使用されることを保証する方法を見つける必要がある重要なポイントです。どのようにそれを行うことができるかは、私が答えを持っているかどうかはわかりませんが、高速のdreambooth AI画像ジェネレーターを使用したことは知っています. 、頑張りすぎずに。

3 コメント

昨年、MSI は Intel Core i9-12900HX と RTX 3080 Ti ラップトップ GPU を搭載した Titan GT77 を発売しました。これは地球上で最も強力なゲーミング ラップトップでした。 iPhone 14 シリーズが発売されてから数か月が経ち、今年が Pro モデルの年であることは定評があります。しかし、飾り気のない長所を求めるなら、シェルの量は […]

Wondershare は、過去数年間、私たちの生活と創造的な努力を簡素化するための最高のソフトウェアとツールをいくつか開発してきました。特に、Wondershare Filmora は数々の称賛を受けています。ビデオ編集リーダー賞の受賞者でした […]

Categories: IT Info