AIはあなたが昨年の夏に何をしたか知っています。

ブログ

ホームページホームページ / ブログ / AIはあなたが昨年の夏に何をしたか知っています。

Apr 08, 2024

AIはあなたが昨年の夏に何をしたか知っています。

Matt Barrie フォロー -- 6 聞く シェア [これは長文です。私は最近、優れたポッドキャスト Macrovoices でこのエッセイについてインタビューも受けました。よかったら聞いてください:

マット・バリー

フォローする

--

6

聞く

共有

[これは長文です。私は最近、優れた Macrovoices ポッドキャストでこのエッセイについてインタビューを受けました。よかったら聞いてください:

https://www.macrovoices.com/1230-macrovoices-390-matt-barrie-the-awesome-power-and-risk-of-artificial-intelligence

https://podcasts.apple.com/us/podcast/macro-voices/id1079172742?i=1000625553151

私のインタビューに対するフィードバック:「私が聞いた中で最も重要なポッドキャストの 1 つ」 @SteveBigpon

「(Macrovoices)これはあなたの最高のポッドキャストの 1 つでした。 実際、ナンバー1の有力な候補です。 ありがとう。" @kdogni]

2022 年 8 月 22 日、スカイネットはオンラインになり、等比速度で学習を開始しました。

少なくとも、グラフィックイラストレーターにとってはそう感じていたはずだ。

その日、深層学習のテキストから画像へのモデルである Stable Diffusion がリリースされました。 他の多くの人たちと同じように、私もダウンロードして遊び始めました。

「バイクに乗ってクマに追われている男性」のような文を入力します。 出来上がったものは、少なくとも私にとってはむしろ悪夢のように見えた。夢のような場面で体の余分な部分や歪んだ顔を持つ人々の芸術的でありながら、しばしば恐ろしい画像だった。 サルバドール・ダリが描いたピカソを彷彿とさせる、人物と物体の融合は驚くべきものでありながら、不安を抱かせるものでした。

しかし、入力されたコンセプトをイラストに表現するこのソフトウェアの驚異的な能力には、本当に息をのむようなものがありました。

ポジティブなキーワードとネガティブなキーワード、生成に必要なステップ数、プロンプトの強さなどのパラメーターを何時間もいじりました。 時々、リロールすると、驚くようなものが手に入ることがあります。

明らかにボンネットの下で魔法のようなことが起こっていました。

インターネットを閲覧すると、正しい呪文を伝えて一貫した画像を生成する専門家になった人もいました。 ソフトウェアから何かを得ようとして、オクタン レンダー、4K、ハイパーリアリスティックなどのモディファイアをカット アンド ペーストしたり、生成ステップの数をいじったりしましたが、あまり成功しませんでした。

イラストレーターの仕事が安全であることは明らかでした。

Stable Diffusion で特に斬新だったのは、コードがオープンソースだったということです。 私は何年もの間、シリコンバレーの大手テクノロジー企業の内部で密かに画期的な進歩があったという噂を聞いていましたが、時折、彼らは何かを誇示していました。

いくつかのコードが公開されたことで、公共のイノベーションが爆発的に起こりました。

2 か月半後、Stable Diffusion を利用した AI 写真編集アプリの Lensa が「マジック アバター」をリリースし、世界を席巻しました。 誰でも自分の画像を 2 枚アップロードして、クレイジーなアバターを生成できます。 ダウンロード数が上限に達したため、このアプリは急速に広まりました。

その後、Midjourney がバージョン 4 をリリースし、すべての地獄が解き放たれました。

不気味の谷とは、ロボット オブジェクトの人間のような外観と不完全な類似性が、不気味な、または奇妙に馴染みのある不安や嫌悪感を引き起こす関係を説明するために使用される用語です。

Lensa と同様に、Midjourney も、インターネットから収集したテキスト説明を含む 58 億 5,000 万枚の画像からなる LAION-5B データセットでトレーニングされました。 LAION-5B は、オープンにアクセスできる以前の最大のデータセットである LAION-400M の 14 倍の大きさでした。

規模がさらに大きくなったことで、『ミッドジャーニー』は見事に不気味の谷を越えることができました。

もはや悪夢のような画像ではなく、突然、ソフトウェアはあらゆるものの驚くほど写実的な画像を出力します。

なんてクソだ。

イラストツールの軍拡競争が始まった。 ミッドジャーニーがリードしていたが、その差は急速に縮まっていた。 Midjourney がツールとして選ばれた理由は、Midjourney が生成する画像に美しくファンタジーな要素があったためです。

このスタイルは、グレッグ・ルトコウスキーというポーランドのイラストレーターのスタイルに非常に似ていました。 それは、AI デザイン アプリの多くがデフォルトのキーワードとして greg rutkowski を使用していたためです。 グレッグは、『ダンジョンズ & ドラゴンズ』や『マジック: ザ・ギャザリング』のアートをデザインしたことでオタクの間で非常に人気がありました。