ImageFX: Googleの新しいテキストから画像への生成AIツール

Googleが最新の生成AI技術で進化を遂げ、その最新成果の一環として新たに登場したのが「ImageFX」です。この驚くべきツールは、テキストから画像への生成において新しい可能性を切り拓くものとして期待されています。本記事では、ImageFXの特長や使い方、そしてその他の関連情報について深堀りしていきましょう。Googleが提供するこの革新的なツールが、クリエイターやデザイナーにどのような影響をもたらすのか、その魅力に迫ります。

ImageFXとは何か?

ImageFXとは何か?

ImageFX

ImageFX

ImageFXは、Googleが開発した新しいテキストから画像への生成AIツールです。このツールは、独自の「表現的なチップ」を備えたインターフェースを持っており、これによってユーザーは創造的なアイデアを素早く試すことができます。その特徴は、隣接する次元での実験を促進することにあります。

ImageFX

新機能とアップデート

GoogleはImageFXの導入と同時に、関連するツールであるMusicFXとTextFXにも改良を加えました。

MusicFXのアップデート

MusicFX

MusicFXでは、MusicLMモデルがアップグレードされ、より高速な音楽生成と高品質なオーディオが実現されました。新しい機能も追加され、生成される曲の長さが最大70秒に延長されました。

TextFXの改善

TextFx Google

TextFXには、ナビゲーションと全体的なユーザーエクスペリエンスの向上を目指した使いやすさのアップデートが導入されました。

SynthIDとIPTCメタデータ

SynthIDとIPTCメタデータ

ImageFXで生成された画像やMusicFXで生成された音声は、SynthIDと呼ばれるデジタルウォーターマークでタグ付けされます。これにより、これらがAIによって生成されたものであることが検索やChromeで表示された際に明示されます。ImageFXの作品にはまた、IPTCメタデータが含まれており、「AIによって生成された画像」に関するユーザーに追加の情報を提供します。

利用可能な国と言語

これらの新機能やアップデートは、アメリカ、ケニア、ニュージーランド、オーストラリアのユーザーがAI Test Kitchenで試すことができます。ただし、現時点ではこれらのツールは英語のみで提供されています。

Imagen 2モデルの役割

新しい画像生成機能の中心となっているのはImagen 2モデルです。このモデルは、Bard、Search、Ads、WorkspaceのDuet AI、およびVertex AIなど、さまざまなGoogleの生成AIオプションを駆動しています。Imagen 2は、Googleが提供する最高品質のAI生成画像を実現する役割を果たしています。モデルは、画像に不要なアーティファクトが残らないようにし、これまでのツールが苦しんでいた画像生成の課題を改善しています。

Imagen 2は、Google AdsやWorkspaceのDuet AIなどでテキストから画像への機能を提供しており、最新の情報によれば、GoogleのSGE(Search Generative Experience)にも組み込まれています。SGEは昨年10月にGoogle Image Searchのユーザー向けに画像生成ツールを提供し始め、Imagen 2を使用して画像を生成します。ユーザーは希望する画像の種類を指定するプロンプトを入力し、SGEはSGEの対話型エクスペリエンスで直接4つの結果を返します。

Vertex AIでは、Imagen 2はGoogle Cloudの顧客向けにAPIを介して利用可能です。また、Imagen 2はBardを介しても利用可能になりました。BardはGoogleのAI駆動のチャットボットで、Imagen 2を使用してシンプルまたは複雑なプロンプトを理解し、高品質な画像を生成できるようになりました。例えば、「サーフボードに乗った犬の画像を作成」といった説明を入力すると、Bardはアイデアを具現化するためのカスタムで幅広いビジュアルを生成します。

一方で、GoogleはImagen 2のトレーニングに使用したデータをまだ明らかにしていません。これは残念なことですが、GenAIベンダーが公に利用可能なデータ(たとえ著作権のあるものであっても)でモデルを訓練し、それを商品化できるかどうかは、法的な問題として未解決のままです。

Imagen 2トレーニングデータの安全性

GoogleはImagen 2のトレーニングデータの安全性に重要な投資を行っており、過激な、攻撃的な、または性的に露骨なコンテンツなど、問題のある出力を制限するガードレールを導入しました。これは、モデルが写実的な画像を生成できるようになったためであり、潜在的に問題のある有害なコンテンツを検出し対処するために広範な対抗テストも行っています。

BardのGemini Proの拡充

BardのGemini Proの拡充

BardのGemini Proは、本日より40以上の言語と230以上の国や地域で利用可能となりました。同時に、多くの国のユーザーはBardで英語の画像を無料で生成できるようになりました。これらの生成画像にはSynthIDのウォーターマークが付与されます。

結論

GoogleのImageFXは、テキストから画像への新しい生成AIツールとして、その豊富な機能とアップデートにより、クリエイターやユーザーに革新的な体験を提供しています。SynthIDやIPTCメタデータなど、AI生成コンテンツを透明性を持って表示する手法も導入され、ユーザーエクスペリエンスを向上させています。GoogleはImagen 2モデルを通じて高品質なAI生成画像を実現し、同時にトレーニングデータの安全性にも重点を置いています。これらのツールはAI Test Kitchenで試せるほか、Gemini Proの拡充により多くの言語と国で利用可能となり、クリエイターにとって強力な支援ツールとなっています。

こちらも参照  LINE内で画像を分析する「LINE AIアシスタント」