こんにちは、pekopokoです。
私は現在、フォトストック(素材販売)による副業を目指し、普通の撮影に加えて生成AIを使った画像の作成にも取り組んでいます。
この記事では、**「Gemini」「ChatGPT(GPT-4o)」「PhotoRoom」**の3種AI画像生成ツールを使ってみて、それぞれの特徴やクセの違いについて比較します。
使い方の流れ:共通スタイル
-
プロンプトはAIに英語で作成してもらう
→ AIは英語の方が指示を理解しやすいため。 -
日本語原文
「最新のスマートな作業スペースにいるハンドメイド作家。作家が最後の仕上げをしている隣で、透明なディスプレイに浮かぶAIアシスタントが、作品の画像を解析し、自動的にInstagram投稿用の魅力的なキャプションを生成している様子。未来的な青と白を基調としたクリーンなイメージ。」 -
英語プロンプト
実際には、この共通プロンプトを各AIに入力し、それぞれの出力を比較しました。
PhotoRoomでの生成結果(有料版を利用)
良かった点
-
指の本数や手の表現が自然
-
Instagramのロゴっぽいものがきちんと再現されている。
-
全体の仕上がりが高品質で、一見でもそのまま素材に使えそうにみえる
気になった点
-
机上の小物の描写がなんだろうこれ?という感じ
-
実際のハンドメイド作業感より、やや抽象的な雰囲気
Geminiでの生成結果(無料版を利用)
良かった点
-
作家の雰囲気や世界観をうまく表現できている
-
無料版でも十分にクリエイティブな画像を生成できる
気になった点
-
指が不自然に曲がっている箇所がある
-
スマホを持つ角度が現実的でなく、違和感を覚える
- 右下にGeminiで生成した証であるロゴが入る
ChatGPT(GPT-4o)での生成結果
良かった点
-
机上のハンドメイド作品や小物はリアルで質感が高い
-
全体的に細部描写が細かく、リアリティを感じさせる部分もある
気になった点
-
PC画面や背景に意味不明な文字やロゴが混ざる
-
全体として統一感が弱く、「何を伝えたい画像か」が曖昧になる
各AIの最新動向と特徴
-
Gemini
Geminiは、写真を「ちょっと雰囲気を変える」「色合いを調整する」「別の小物を合成する」といった写真の編集やアレンジが得意になっています。たとえば「背景を夕方っぽくして」とお願いすると、自然な仕上がりに変えてくれる、といった感じです。
ChatGPT(GPT-4o)
ChatGPTは「文字も絵も同時に扱える」新しいタイプのAIです。画像の中にリアルな小物や質感を描くのは得意ですが、まだ変な文字や意味不明なマークを入れてしまうことがあるのが弱点です。たとえるなら、字は書けるけど、漢字を時々間違えちゃうような感じです。
PhotoRoom
PhotoRoomは、もともと写真をきれいに見せることが得意なサービスです。背景を一瞬で消したり、商品写真をプロっぽく仕上げたりできるので、ネットショップやフォトストック用の画像を作るのに向いています。「とりあえず売れる写真がほしい!」という時には一番即戦力になります。
まとめ|どのAIを使うべき?
-
PhotoRoomが最も即戦力
背景処理や高解像度生成が安定しており、フォトストック素材向きだと感じました。私の場合ハンドメイド副業をしているので、作品の背景変更では重宝しています。よって、同じくハンドメイドやせどり副業をしている方なら、このアプリを使えばついでにフォトストック副業をしてみようかな? と思った時におすすめです。 -
Geminiはクリエイティブ表現に強み
少し違和感は残るものの、雰囲気重視のコンセプト画像作成に向く。 -
ChatGPTは細部のリアルさで光る
特に机上小物の質感再現は良好。ただし、文字やロゴが混ざるため、フォトストックにはそのまま使い
次回は実際にフォトストックを始めて1週間経ったので、経過の報告をしたいと思います。
コメント