AI EngineeringSeptember 10, 202512 min read
    SC
    Sarah Chen

    画像生成のためのプロンプトの書き方 - 第2部 - 高度なテクニックとベストプラクティス

    画像生成のためのプロンプトの書き方 - 第2部 - 高度なテクニックとベストプラクティス

    How to Write Prompts for Image Generation: Part 2 - Advanced Techniques and Best Practices

    推奨: プロンプトを作成する前に、ターゲットのシーンを3つの具体的な詳細で定義して方向性を固定します。主題、設定、照明を記述し、次に目標を全体的な生成と一致させます。

    ヒント: 異なるスタイルでのテストを加速するために、コレクション準備済みプロンプトをライブラリに構築します。確認済みプロンプトと達成された結果を示す簡単なチェックリストを維持し、最良のパフォーマーを再利用のために保存します。

    規律あるテストワークフローを適用します:多数のバリエーションを保持しますが、一度に1つの要素(主題、環境、照明、またはスタイル)のみ変更します。レンダリング時間、忠実度、一貫性を簡単なルーブリックで追跡し、結果をデータベースに記録します。チームメンバーに結果を確認させ、洞察をチームにフィードバックします。

    プロンプトを構築する際は、明確な構造を使用します:主題環境照明スタイル、および構成。例:「頑丈な山脈が夜空にあり、光る星、太陽のようなカラーパレット、低いカメラアングルから捉えられた、フォトリアリスティック。」これは、ロシア語の名詞が英語の記述子と混在してモデルをガイドする方法を示しています。

    チーム向けの実践的な注意: 利用可能な多数のバリエーションを保持し、ライブラリに検証済みのプロンプト(プロンプト)を公開してサービス開発者用にします。ユーザーからのフィードバックとパフォーマンスメトリクスを定期的にレビューしてプロンプトを洗練し、SF、自然主義的、グリッティな都市設定を含む多数のスタイルオプションを拡張します。

    具体的な属性で正確な視覚目標を定義:主題、スタイル、パレット、照明、構成

    1つの絵に対して単一で正確な視覚目標を定義します。5つの具体的な属性を固定:主題、スタイル、パレット、照明、構成。計画で正確なパラメータを記述し、それらをプロンプトで結びつけます。無料の参照と慎重な選択を使用して焦点を維持します。ボットアプリのワークフローをテストする場合、生成間で同じ要素を保持して後で結果を比較します。

    主題:明確で読みやすい単一の主題を選択し、鮮明なシルエットにします–例えば、大きな目をしたキツネ。ザラついた表面のシンプルな背景に配置してテクスチャを追加します。以前にバージョンを描いた場合、その参照を再利用して外観とスケールの整合性を保ちます。

    スタイル:カートゥーン、フォトリアル、または画家風から単一の美学を選択します。明確さと親しみやすさのために、カートゥーンから始め、それがプロフェッショナルであることを記します。この設定により、サムネイルからポスターまで線がよく読み取れ、迅速に作業できます。

    パレット:3-5色に制限;色相を指定し、彩度を設定し、コントラストを制御します。パンチのために鮮やかなトーンを使用するか、ムードのためにくすんだミックスを使用します。コンパクトなスナックパレットを構築し、生成間のドリフトを避けるためにトーンの選択を厳密に保ちます。必要に応じてパラメータを調整して再試行します。

    照明:光の方向(側面、背面、上部)、色温度、強度、影の品質を指定します。例:夜明けの光、柔らかいフィル、ザラついた表面に優しい影、色とテクスチャが読み取りやすいように。照明をパレットに結びつけて一貫性を維持します。

    構成:生成前にフレーミングルールを設定:3分の1の法則、ネガティブスペース、主語へのリーディングライン。プロンプトに簡潔な行としてエンコード:「主語を中央から外し、クリーンなクロップ、顔へのライン。」いくつかの生成を実行して安定性をテストします。バリエーションを生成した場合、最良のものを選び、パラメータを調整します。一貫性の原則:イテレーション間で主題、スタイル、パレット、照明を一定に保ちます。例えば、大きな目の主題にはより多くのスペースを与え、内省的な瞬間にはよりタイトにクロップします。目標は:明確で正確な視覚目標です。

    予測可能な階層でプロンプトをレイヤー化:ベースコンセプト、スタイル指令、パラメータ修飾子

    Layer prompts in a predictable hierarchy: base concept, style directives, and parameter modifiers

    まずベースコンセプトを固定:主題、シーン、アクションを定義します。これにより、プロンプトが幅広いサービスユーザーにアクセスしやすく、画像生成のエラーを減らします。堅固なベースコンセプトから構築し、次にスタイル指令を追加し、最後に精度と繰り返しのためにパラメータ修飾子を調整します。この順序を保つことで、複雑なプロンプトに入っても明確さを失いません。

    • ベースコンセプト
      • 主題:具体的なキャラクターやオブジェクトを選択、例:少女や猫、曖昧なシルエットではなく。
      • 設定:アクションを明確に配置、例:川沿いや、目に見えるケーキの中心件がある居心地の良いキッチンで。
      • アクションまたはポーズ:主題が何をしているかを定義(立っている、見ている、何かを持っている)。ナラティブフックを望む場合、ムードをサポートするシンプルな瞬間を記述、例:少女が平和な川の上空の雲を観察する。
      • 制約:非交渉事項(構成、焦点距離、またはネガティブスペース)を記し、異常を減らすためにリクエストを簡潔に保ちます。
    • スタイル指令
      • メディアと外観:カートゥーン、水彩、フォトリアリスティック、またはベクター;ベースコンセプトに合う視覚言語を選択。
      • パレットとトーン:色ファミリー(パステルトーン、暖色、高コントラスト)とテクスチャ(柔らかいシェーディング、鮮明な線画)を指定。
      • ナラティブフィール:陽気、夢のような、厳粛–ムードをベースコンセプトに合わせます。複数の画像で一貫したトーナルスレッドを望む場合に特に有用。
      • 参照プロンプト:レクシカのようなアプローチを活用し、生成間で繰り返したい形容詞とモチーフを命名、例:「おいしいパレット」や「日光のトーン」。
      • 言語タグ:ジェネレーターがサポートする場合、ロシア語スタイルやバイリンガルプロンプトでシグナル;これによりフレージングとタイポグラフィをガイド–例えば、シーンで手書きのキリルアクセントに似せた文字やスクリプトを望む場合。
      • コピーする例:「川辺のカートゥーン少女、柔らかいパステルカラー、優しいシェーディング、気まぐれなムード。」
    • パラメータ修飾子
      • アスペクト比とフレーミング:シネマティックなフィールのために--ar 16:9、クラシックなルックのために--ar 4:3を使用。
      • 品質とステップ:詳細に影響を与える--stepsを設定(例:50–100)、速度と忠実度のバランスを取る--qualityまたは--q。
      • シードと変動性:トナリティと形状の特定の配置を再現するために--seedを割り当て;ベースコンセプトとの整合性を締め付けるまたは緩めるために--cfgまたは同等のスケールを調整。
      • 画像数とイテレーション:サービスがサポートする場合、わずかな摂動でプロンプトをループして多数の出力を収集し、バリエーションを比較(エラーや異常を捉えるのに役立つ)。
      • ハードウェアまたはレンダリング好み:サービスが複数のエンジンを提供する場合、解像度またはモデルフレーバーを示す、例:専用の「カートゥーン」モデルまたは「リアリスティック」モデル。

    レイヤー化されたプロンプトの例(イラストラティブ):ベースコンセプト:川辺の少女、ムード:瞑想的;スタイル:カートゥーン、パステルトーン、柔らかいシェーディング、レクシカ風プロンプト;修飾子:--ar 16:9 --steps 60 --seed 98765 --quality 2。この構造により、画像を予測可能に保ち、単純な公開や画像のシリアルセットで一貫した結果が必要な場合に複数イテレーションを減らします。

    望ましくない要素から逸らすためにネガティブプロンプトと除外用語を活用

    具体的な推奨から始めます:簡潔なネガティブプロンプトを最初に付け、明確な除外用語を組み合わせることで望ましくない要素から逸らします。-blurryでぼやけを防ぎ、-noiseで粒状を抑え、-lowresで詳細をシャープに保ちます。パラメータで小さな制約セットを定義して、モデルが複数のバリエーションで意図に準拠します。プロンプトコミュニティやYouTubeチャンネルからの信頼できるソースを参照して、プロが除外をどのように表現するかを確認し、それらのパターンを自分のワークフローに適応します。ソロで作業する場合、トラや少女などの単一の主題に焦点を当て、全バリエーションで一貫して除外を適用します。

    実践では、2層の除外戦略を構築:すべての生成画像に適用されるグローバル除外と現在のタスクのためのプロジェクト固有除外。プロンプトの端にネガティブ用語を追加して全イテレーションに影響を与えます。プロンプターが使用する証明されたフレーズのソースを参照し、YouTubeチュートリアルからアイデアを集め、再利用可能な除外リストを組み立てます。このアプローチにより、サイトやポートフォリオ内でクリーンな結果を生成し、生成後の画像再作業の必要性を最小限に抑えます。

    一般的な除外

    -blurry詳細を劣化させるぼやけと柔らかさを避ける
    -noise粒状とランダムな斑点を減らす
    -lowres鮮明なエッジと明瞭さを保つ
    -yellowish黄色のキャストと暖色ティントを排除
    -pastel tonesコントラストを洗い流すパステルカラーパレットを避ける
    -cartoonishリアリズムまたは選択したスタイルを維持
    -tiger必要ない場合に動物のシルエットを除外

    実践的な実行のために、これらの用語をプロンプトに付加される簡潔な除外ブロックに組み立てます。ブロックをコンパクトで一貫して保ち、異なるサンプリングパラメータでテストして安定性を確認します。どの除外が望ましくない特性を最も信頼性高く抑制するかを追跡し、ソースプロンプトをそれに応じて洗練します。結果がまだ望ましくない方向に傾く場合、ソース素材の画像参照をダブルチェックし、トーン、照明、構成に対する制御を締め付けるためにプロンプトを調整します。この規律あるアプローチにより、クリーンな画像を生成し、イテレーションサイクルを減らし、YouTubeチュートリアルやチームのワークフロー内で後調整の時間を少なくします。

    共通タスク(ポートレート、風景、製品ショット)のための再利用可能なテンプレートとプリセットを構築

    3つのマスターテンプレートとプロジェクト間で再利用できるシンプルなプリセットパックから始めます。ポートレート、景観シーン、製品ショットのプロンプト1ベースラインを作成し、ベースに保存して迅速に調整を適用します。このアプローチにより、ユーザーが高速閲覧を望み、生成間で高い品質を保ちます。パステルパレットの場合、柔らかく暖かいトーンを優先し、鮮やかなアクセントが必要な場合、プロンプトをゼロから書き直さずにビビッドバリエーションをトグルできます。

    ポートレートテンプレート:85mmのパースペクティブ、浅いDOF、柔らかい拡散照明でタイトなフレームを中心に構築。パステルパレット、ブリーフが暖かさを求める場合に大きな目のルック、最小限の背景を使用して distractionsを避けます。ポストプロセッシングのために主題を分離するオプションのマスクレイヤーを含めます。これをprompt1_portraitとして保存し、高解像度バリエーションをhighでタグ付けしてクライアントとユーザーに簡単に配信します。

    製品ショットテンプレート:1:1のアスペクトとマクロ準備のクローズアップ、完璧なエッジ、クリーンで中立的な背景を対象。制御されたハイライトでテクスチャを強調し、真のトーンを保存する微妙なカラグレード。精度が重要の場合にオブジェクトをバックドロップから分離するマスクを使用し、ボールドブランディングのためのシンプルベースと高コントラストpromepteバリエーションを提供。bases/productの下に保存し、prompt1_productをクイックスタートとして参照。

    景観シーンテンプレート:16:9または3:2比率の広いビスタ、自然照明、深い色深度を目指します。リッチだがバランスの取れたトーン、大気のヒント、グレアなしで詳細を保つ抑制されたシャープネスを好みます。フレームにクローズアップ要素が現れる場合のみマクロ調整を含め、必要に応じて前景要素を分離するスケーラブルマスクオプションを保持。このプリセットはbases/sceneにあり、異なるムードに適合するために単一トグルで交換できます。

    ワークフローをシンプルに保つために、プリセットを明確に命名し、予測可能な階層に合わせます:bases、パステル、vivid、マクロ、promptyバリエーションのようなpromtеまたはprompte。プロンプトのコレクションは自分のサイトや内部リポジトリ内で簡単に閲覧可能で、同僚とクライアントに迅速に共有(поделиться)できます。このアプローチにより、ユーザーが(пользователей)自身のプロジェクトで迅速にイテレートし、一貫性を維持します。

    保存と再利用のヒント:チームのニーズに合う小さなライブラリを維持します。タスク、比率、ムードをエンコードした簡潔な命名規則を使用(例:portrait_v1_85mm_warm、scene_v2_16x9_rich)。各プリセットに1行のノート(対象タスクと主な調整)をドキュメントし、シンプルな変更ログを保持。同じベースプロンプトをスタジオとオンサイトシュート両方に迅速に適応でき、promптеイテレーションの時間を節約し、どんなブリーフにも準備万端です。

    例プロンプト

    Prompt1_portrait_high: クローズアップの主題、85mm、f/1.4、柔らかい拡散光、パステルパレット、大きな目の表情、最小限の背景、オプショナルマスク、高解像度。

    Prompt1_product_simple: 製品中央、1:1、マクロ詳細、中立背景、鮮明なエッジ、穏やかなスペキュラハイライト、製品を分離するマスク、クリーンなブランディングのためのpromtеバリエーション。

    Prompt1_scene_warm: 広いビスタ、16:9、自然光、リッチだが制御された色、前景が際立つ浅い深度、必要に応じて前景要素のマスク、ビビッドトーンの補助バリエーション。

    迅速なテストで迅速にイテレート:バッチプロンプト、結果比較、徹底したログ

    プロンプトを16、32、または64のグループにバッチし、単一セッションで実行します。これにより出力を直接比較し、異なる値が結果にどのように影響するかのパターンを特定できます(значения)。生きているプロンプトライブラリを保持し、各エントリにプロンプトが何をテストするかを簡潔にノートでタグ付け、何か特定のものを含みます。実践では、バッチ選択が高コントラストプロンプトと微妙でニュアンスのあるものを対象とし、モデルが生命のような詳細で輝く場所と失敗する場所を見極めます。結果を公正に保つために比較のための1つのベースラインを使用します。

    バッチパラメータを定義:入力フレージング、シードまたはランダム性、対象テクスチャまたはトーン(тоны)の3つの次元でプロンプトをテスト。色の場合、黄色プロンプト(желтыми)とビビッド(яркие)テクスチャを試します。最良の結果を生んだリクエストをドキュメントし、プロンプト自体(сама)を参照として保持。イテレーション間のデルタを測定するための単一ベースラインを維持します。

    結果比較:サイドバイサイドグリッドまたはCSVのシンプルマトリックスを使用して、各画像を明確な基準に対して評価:プロンプトへの整合性、色精度、テクスチャの豊かさ(текстур)、全体的な影響。客観的に保ち、0–5スケールでスコアを割り当て。テストの大部分で、リクエストに一致し、まとまったトーンを保つ出力が勝ちます。リクエスト列に偏差を記録。サイズ、アスペクト比、ポストプロセッシングノートなどの正確な詳細をキャプチャ。他のチームと作業する場合、異なる側からのバイアスを避けるために共有ルーブリックに同意します。

    ログ:フィールドで軽量ログ構造を構築:prompt_text、batch_id、item_id、timestamp、model_name、seed、parameter(параметр)、notes。キー指標の値(значения)と元のプロンプト(сама промпта)への参照を含みます。結果をCSVまたは会社が使用するサイトに保存;これによりプロジェクト間で実験を監査し再現しやすくなります。また、プロンプト生成に使用したコードのコピー(кода)を保持して後で再現を可能にします(сейчас)。

    リズムと自動化:各バッチ後、迅速にレビュー;上位20–30%の結果を引き出し、共通の特徴を抽出して次のセットに適用します。これにより学習を加速し、単一のパスで停滞を防ぎます;ほとんどの改善はプロンプトやテクスチャキュー(текстур)の小さな調整から来ます。パラメータスイープを使用しますが、クエリの数を爆発させないように焦点を絞ります。

    実践的なヒント:ベーステンプレートからプロンプトを生成する自動スクリプトを使用;英語プロンプトと翻訳(английском)の両方をテスト。多数のプロンプトを扱うチームの場合、プロンプトと結果のバージョンコントロールを構築;効果的なフレーズを再利用する場合、どのプロジェクトに属するかをノートします。会社(компании)やサイト(сайт)から資産を管理する場合、画像(картинке)で使用したソースデータセットとテクスチャ(текстур)に戻すために正確なリクエストIDをログします。

    📚 AI生成とプロンプトに関する詳細

    関連記事

    Ready to leverage AI for your business?

    Book a free strategy call — no strings attached.

    Get a Free Consultation