AI EngineeringSeptember 10, 202515 min read
    SC
    Sarah Chen

    Midjourneyのプロンプトの書き方 - ステップバイステップガイド

    Midjourneyのプロンプトの書き方 - ステップバイステップガイド

    How to Write Prompts for Midjourney: A Step-by-Step Guide

    明確な主題と単一の焦点スタイルから始めましょう。 Midjourneyのプロンプトでは、メッセージのウィンドウで一つのアイデアにロックオンし、次に正確な詳細で拡張する必要があります。前のプロンプトでは、核心概念を短い名詞句で捉え、最初に置きます。最初の節内で、ムードを設定し、視覚的なアンカーを定義することで、出力が後での洗練にもかかわらず焦点を保ち、予測可能になります。

    特徴とトーンを明確にアウトラインしましょう。 欲しい要素をリストアップ:照明、テクスチャ、カラーパレット、構成レイアウト特徴を使って最終的なルックに沿ったものに保ちます。主題の後に主要な名詞と動詞を置き、後で詳細を交換しても構造を再構築せずに済むようにします。主題とこれらのキーワードが、ドリフトを最小限に抑えるタイトなブループリントを形成します。

    スタジオセットアップと参照を活用してスタイルをガイドしましょう。 いくつかの参照を文脈的なヒントとして付け、期待される結果を示すの行を含めます。プロンプト内で、ウィンドウテーブル、ランプを言及して照明を結晶化します。このアプローチは、ショット全体で一貫したルックを生み出し、迅速なイテレーションをサポートします。

    複数の構成を探求するためのプロンプト構造化。 ベースプロンプトから始め、形容詞と角度を交換してバリアントに分割します。高コントラストの光が暗い背景に対する対立要素を含めて、コンセプトを過度に複雑化せずに深みを加えます。各バリアント内で、視点と要素間の関係を調整して、意図されたナラティブを強調します。

    再利用可能なプロンプトスケルトン。 主題 + コンテキスト + スタイル + 詳細 + 参照。例えば:「主題:雨のウィンドウのネオンライトのテーブル、焦点のテーブル;コンテキスト:小さなスタジオの隅、早朝の霞;スタイル:サイバーパンク、高テクスチャ;詳細:反射、濡れた表面、粒状;参照:URL1、URL2.」このパターンを使用してイテレーションを加速し、プロンプトを1行または2行以内にコンパクトに保ちます。

    安定した結果のための実践的なヒント。 シネマティックな幅のために--ar 16:9を使用、詳細のために--q 2、縁をシャープに保つために--no blurを使用します。プロンプトの長さを約120-180語に制限して迅速な調整を。常に小さなセットの参照に対して出力を検証し、照明とカラーバランスを主な色を交換して調整して、より速い収束を。練習を通じて、長いテストなしで出力をビジョンに向ける方法を学びます。

    コンセプトに適したバージョン、モデル、アスペクト比を選択する

    シネマティックなコンセプトのためにバージョン5、デフォルトモデル、16:9のアスペクト比を使用します。このベースラインは照明、カラー、構成を一貫させ、イテラティブな調整を単純化し、この時間内の迅速なドラフトサイクルを節約します。

    制御されたウィンドウライトのムーディーで高コントラストのルックのために、バージョン4を選択して強いテクスチャと深い影を強調し、バージョン5は自然な照明とシャープな詳細を保持します。触覚的なテクスチャの詳細を目指す場合、このベースラインはカラーの忠実度を好み、焦点のオブジェクトの望ましい結果を伝えるのに役立ちます。結果を比較する際、各バージョンで暗い雰囲気がどのようにシフトするかを注意し、感情的な意図に沿ったものを選び、特にシーンの最も感情を運ぶ部分周りで。

    ほとんどのプロンプトでデフォルトモデルを選択してシーン全体の一貫性を維持;コンセプトが明確に異なるルックから利益を得る場合のみ、より芸術的またはアニメのようなモデルに切り替えます。このアプローチは使用同じ構成をし、モデルを交換する代わりにプロンプトを通じてテクスチャを調整します。シネマティックなフレームでキャラクターの微妙な微笑みの場合、モデル選択は顔のプロポーションとムードを保持し、ショットの感情が視聴者に明確に読まれるのを助けます。主題が強い視覚的な対立を運ぶ場合、ベースモデルを保持して意図しない歪みを避け、照明の忠実度を維持します。

    コンセプトにアスペクト比を合わせる:ポートレートやロゴのような構成のために1:1;プリントや額装アートのために4:3;広いシネマティックな風景のために16:9;垂直モバイルプレビューために9:16;拡張シーンために21:9。深みとカラー制御のために、16:9または21:9はウィンドウの輝きとスライドデッキ全体のカラー一貫性を保持します。オブジェクトを焦点に保つタイトな構成が必要な場合、この制約で1:1を強制し、バリアントを実行してコンセプトを調整するに主題がフレーム内にどのように収まるかを比較できます。このアプローチはプレゼンテーションを一貫させ、スライドからスライドへの明確なナラティブフローを保持し、特にムードと照明のサンプルをテストする迅速なイテレーション中に。

    具体的なプロンプトキュー(例):バージョン5、デフォルトモデル、--ar 16:9、暗いウィンドウ照明、カラーリッチなシーン、前景のオブジェクト、微妙な微笑み、余分な詳細なし、ムードとコントラストについての追加の明確化を加えて望ましい効果を達成。詳細を徐々にレイヤリングし、フィールと構成を記述する言葉を使用し、望ましい出力に合うように比率を調整できます。テクスチャにズームインする必要がある場合、詳細と物理的なテクスチャはバージョン、モデル、アスペクト比の選択から現れ、コンセプトがこの方法で視聴者に響く画像に翻訳されるのを確保します。この方法はプロンプトをベースルールに接地させ、同じコンセプトをこの時間内にイテレートする際にドリフトを避け、ビジョンした結果に到達するのを助けます。

    スタイルを戦略的にレイヤリング:複数のアートスタイルをブレンドするタイミングと方法

    単一のベーススタイルから始め、顔を焦点に保ち、カラーを一貫させるために慎重なブレンドで2番目の補完的なアプローチをレイヤリングします。

    1. コアセットアップ:ルックの基礎を定義し、顔が現れるフィールドを設定します。これにより、二次スタイルがメインのメッセージを覆い隠すことなく相互作用する方法が決定されます。

    2. スタイルペアリング:注意を奪わずにテクスチャやムードを追加する2番目のスタイルを選択します。ベースが画家風の場合、微妙なフィルムグレインが深みを加え、カラーを保持できます。おばあちゃんのノスタルジアやクリシェを避け;新鮮なフィールを狙います。

    3. ブレンドコントロール:2つのスタイルをバランスさせるために不透明度とブレンドモードを使用します。二次レイヤーの不透明度を20-30%から始め、滑らかなトランジションを作成するために縁をマスクし、主題から注意をそらす過度に忙しい縁を避けます。

    4. プロンプト戦略:プロンプトでコアルックをロックし、正確なパラメータでレイヤーの追加を記述します。二次スタイルをメインの顔を変えずにムードを伝えるグレーズとして想像します。望ましくないアーティファクトを除外するために--noを含めます。

    5. カラーとテクスチャの整合:両レイヤー全体でとトーナルハーモニーを確保します。フィルムのようなルックはを統一でき、二次詳細を抑制してシーンが一目で明確に読まれるようにします。

    6. 検証と最適化:ビフォー/アフターのチェックを使用して顔が認識可能に残り、結果が達成に沿うかを確認します。間違ったバイブを伝える場合、2番目のスタイルの重みを締めたりマスクを洗練したり;プロセスを簡潔で実用的 に保ち、長いワークフローを避けます。

    7. 実験とイテレーション:異なる二次スタイルで3つのバリアントを作成して比較し、望ましい影響を達成するものを選びます。最高のブレンドを将来のプロジェクトのためのプロンプトテンプレートとして保存;このようなアドバイスは再適用を加速し、可能性の拡張を可能にします。

    プロンプトウェイトで出力を制御:マルチプロンプトで要素をバランスさせる

    正確な制御を達成するために、各プロンプトセグメントにウェイトを割り当てます。メインテーマのウェイトを0.65–0.75に、カラーと照明を0.15–0.25に、テクスチャや背景詳細を0.05–0.15に設定します。ダイナミックなバージョンでは、グループ間で0.05–0.10をシフトして異なる強調を探求します。(subject:0.75) (color:0.25) (texture:0.15)のような構文を使用して、マルチプロンプトで優先順位を強化します。

    ウェイト:割り当てと調整方法

    タスクを基礎要素に分ける:主題、カラー、テクスチャ、照明、環境、ムード。プロンプトを各要素がウェイトを得るレイヤーのセットとして考えることができます。合計を1.0近くに保ち、望ましい結果ごとに調整:明るい明るいシーンでは照明とカラーを0.1–0.2ブースト;謎めいた雰囲気ではミストとテクスチャを0.2–0.3にプッシュ。森やビンテージスタイルでは、森とビンテージキーワードに結合ウェイト0.4–0.6を与え、他を緩めます。

    フィードバックが必要な場合、同僚にアウトプットとバージョンを評価してもらい、後続のバージョンでウェイトを洗練して望ましい構成と視覚体験への信頼を締めます。このアプローチはダイナミックで、バージョンとプロンプト全体の実験をサポートします。

    実践的なプロンプトと例

    Practical prompts and examples

    例1:(forest:0.9) (винтаж:0.4) (color:0.8) (texture:0.3) (mist:0.5) (photography:0.8) – 明るくノスタルジックなバイブを目指し、明確な構成と微妙なテクスチャで。

    例2:(subject:0.7) (background:0.2) (color:0.6) (texture:0.2) (light:0.5) (gloom:0.25) – 劇的な照明とシャープな視覚方向を強調し、全体のバランスを安定に保ちます。リクエストが過度に明るい要素を出力する場合、対立するウェイトを0.05減らし、次のバージョンでテスト。

    モディファイアを調整:Stylize、Quality、Seed、Negative Promptsで精度を

    精度のためにモディファイアを調整する場合、Stylize、Quality、Seed、Negativeプロンプトに焦点を当てます。特性を明確に影響したい場合、各パラメータを調整したときに何が起こるかを観察します。主題の背後からのバックライトグロウとフロント照明がムードを設定;輝くアクセントと深みキューがフォーマットと深みをガイドします。簡潔なプロンプトを作成することで意図が明確に残り、自信を持ってレンダーをステアするために直接的な言語を使用(時間)。

    StylizeとQuality:意図を持ってルックを形成

    Stylizeはモデルが内部美学にどれだけ強く傾くかを制御します。低い値(50–150頃)は言葉をあなたの言葉にタイトに縛り、高い値(300–1000)はより創造的なテクスチャとキャラクターに向かいます。正確で技術的な結果が欲しい場合、Stylizeを控えめに保ち、バックライトとフロント照明で記述されたランス、プロポーション、照明を明示的に呼び出します。Stylizeを上げると、よりイラスト的なアプローチ(またはより芸術的な'look')を期待し、選択したフォーマットに意図を合わせます。mokや輝く縁のシーンでは、いくつかのStylize値をテストし、最終画像の深みと詳細を比較します。

    Quality(--qualityパラメータ)は忠実度対速度を制御します。1.0でバランスの取れたレンダー;2.0に上げるとより多くの詳細化、リッチなテクスチャ、強い深みの感覚が生まれますが、レンダー時間(時間)を延長し、より多くの画像(画像)数につながります。微妙なシェーディング、正確なバックライト相互作用、清潔なボケが必要な場合に高い品質を使用。時間が限られている場合、品質を1.0に保ち、光、ミスト、ランスについての焦点プロンプトで補います。常に深み、フォーマット、トーンへの明確な意図でこれらのパラメータをバランスさせます。

    SeedとNegative Promptsで再現性と精度を

    Seedはランダム性を固定し、同じプロンプトで結果を再現できます。シードを設定(例:--seed 12345)してテクスチャ、深み、全体のフィールをロックします。バリエーションを奨励するために、意図の枠内でシードを変え;一貫性を保持するために関連フレームで同じシードを使用。Negativeプロンプトは望ましくない要素を除外するのに役立ちます。「no watermark」、「no blur」、「no text」、または「no fog」のような明示的な除外を追加してボードを洗練し、ミストやボケに余計な要素が忍び込むのを防ぎます。深みとバックライトバランスを保持しつつ望ましくない特性を除去したい場合、--noをそれらの特性をキャンセルしフロント照明とビューを保持するフレーズとペアにします。

    例のプロンプト:「ダンサーの正面ポートレート、バックライトグロウ、周囲の渦巻くミスト、浅い被写界深度、ボケ、異なる肢のプロポーション、輝くエッジ、厳格なフォーマット」with --stylize 400 --quality 2 --seed 9876 --no watermark, text, blur。この組み合わせは意図を強化し、望ましいランスとバックライトに沿い、より制御された画像を生み出します。

    マルチプロンプト構文をマスター:構造、順序、実世界の例

    コアシーンとバイブを設定する焦点のベースプロンプトから始め、固定順序でモジュラープロンプトをレイヤリング。 これによりプロンプトを簡潔で予測可能に保ち、最終レンダーに向かってプロンプトがどのように構築されるかを制御します。

    構造は3つのレイヤーに基づく:ベースシーン、モディファイア、テクニカル。レイヤー全体でタスクを管理するためのコマンドのツールボックス(ツールボックス of コマンド)を使用。各レイヤーで3–5のトークンを目指し、プロンプトをカンマで分離します。ベースはフレームを定義、モディファイアは詳細を注入、テクニカルプロンプトはスタイル、照明、カラー、アスペクトを調整します。森のムードを作成する場合、森とレトロバイブを含め、微笑みの少女を追加;これはキー詳細を示し、パスをシンプルに保ちます。次に、レイヤーをシャープで予測可能に保ち、詳細以外で雰囲気と明確さのバランスを保持。

    順序が重要:主題と環境から始め、次にワードローブまたはプロップ、ムード、照明、カメラキュー、最後に詳細と制約を追加します。最も重要な要素を前方に置いて、レンダリング時にモデルが優先します。重要な用語を強調するために括弧やブラケットを控えめに使用し、単一のレイヤーで同じ言葉を繰り返しすぎないようにします。例のアプローチ:ベース → 主題 → 環境 → ワードローブ → ムード → 照明 → カラー → 詳細 → カメラ → 制約。これにより明確なフローを提供し、一つの要素を交換しても残りを壊さずに済みます。次に、ステップバイステップでテスト:一度に一つの部分を置き換えて影響を見て、より正確な決定を下します。

    実世界の例はフローの適用を示します。例A:ベース:「森、レトロムード」;モディファイア:「少女、微笑み、ビンテージドレス」;環境:「柔らかい夜明けの光」;詳細:「シャープなテクスチャ、葉の表面、苔のテクスチャ」;テクニカル:「--ar 16:9 --v 5」;結果:ムードと明確さのクリーンなバランス。このチェーンは優先順位を示し、ノイズを低減します。例B:ベース:「アーバンレトロポスター」;モディファイア:「モデル、雨に濡れた通り、ネオン反射」;ムード:「ムーディー」;詳細:「高コントラスト、シャープな縁」;テクニカル:「--ar 9:16 --v 5」;結果:シャープな表面テクスチャと強い視覚パンチのボールドな構成。例C:ベース:「森の光のポートレート」;モディファイア:「レトロスタイルの服、少女、微笑み」;詳細:「自然な肌トーン、明るい目、表面テクスチャが見える」;テクニカル:「--q 2 --ar 3:4」;注:このアプローチは制御された周辺の人間の焦点を提供します。

    一貫性のためのヒント:2–3のコア要素をカバーする再利用可能なベースを保持し、新しいシーンで変動するモディファイアとテクニカルを追加します。現在のプロンプトを新しいファイルにコピー&ペーストし、一度に一つのレイヤーを修正でき、構造全体を上書きせずに必要なムードシフトを伝えます。シンプルなパターンに常に従う:ベース → モディファイア → テクニカル;これはモデルのエンジン管理を単純化し、結果の再現性を改善します。前のプロジェクトの詳細を迅速なスタートに使用し、非常に正確な制御は一度に一つの要素を連続的に変更することで達成されることを覚えておいてください。

    長さと具体性がイテレーション全体の一貫性に与える影響

    イテレーション全体の一貫性を最大化するために、短く正確なプロンプトを使用します。この方法は長さを制約し、具体的な詳細を要求することで出力をアンカーし、画像と英語圏のオーディエンス全体のドリフトを防ぎます。単一の主題と固定ムードに焦点を当て、本当にルックを形成する詳細のみを含めます。

    プロンプトを3つの部分に構造化:コンテキスト、主題、制約。コンテキストでシーンを設定;主題でメイン要素を定義;制約でトーン(トーン)とスタイルをロックし、詳細を指定します。英語圏のオーディエンス全体の写真のためにルックをガイドする繰り返しのパターン(ペア)を使用、たとえ数回のイテレーションでも。

    --widthでアスペクトを設定してサイズを固定します。これにより構成の明確さが与えられ、イテレーション全体のバリエーションを低減します。最終画像の一貫性を保持するためにラン全体で幅を一定に保ちます。

    変数の数を制限します。指定された照明領域、カメラアングル、カラーパレットのような数少ないキー詳細(詳細)のみを使用します。このアプローチは視点を一貫させ、結果を詳細化し、曖昧にしません。

    一貫性を保持しつつワークフローを近代化するために、スタイルとパターンを定義するコアフレーズを再利用;イテレーションごとに一つの変数のみ更新します。これによりバリエーションを低減し、プロジェクト全体で一貫した感じの詳細化された結果を維持します。似たような一つのパラメータで異なるペアのプロンプトから始め、一貫性を壊さずに影響を比較できるようにします。

    建築、ファッション、インテリアのようなドメイン全体でテストし、同じ方法を保持して視点を保持します。英語圏のオーディエンスの期待に合わせ、コア用語を繰り返し、トーン(トーン)とスタイルを一定に保ちます。画像全体でパターンを再利用して、英語圏の視聴者のための認識可能な視覚語彙を構築します。

    迅速な検証のためのチェックリスト:3–5の詳細のみで長さを簡潔に;本質的な情報のみ使用;--widthとサイズを固定;照明領域とカメラアングルを指定;感情と視点を定義し、出力が写真スタイルで詳細化されるように。ペアのイテレーションを実行して比較;ドリフトが現れた場合、制約を締め、同じコア表現を再利用して一貫性を壊さずにプロンプトを近代化します。

    スタイルとモディファイアをミックスする際の一般的な落とし穴と迅速な修正

    明確なスタイルアンカーから始め、数個のモディファイアを使用;ベースバイブを正確に保ち、今(現在)2つの迅速なバリエーションをテストして効果を確認します。プロンプト作成の領域では、曖昧な主題、対立するキュー、過度に長いリストのような数個のトラップが存在します。これらの落とし穴はノイズに向かうドリフトを許し、厳格な焦点を設定し、各モディファイアが全体のフィールをどのようにシフトするかに注意を保ちます。目標を言葉で書き、曖昧なフレーズではなく、自分の言葉で記述して色、照明、構成の正確な期待をロックします。理想的なバランスは小さな意図的な変更(変更)と、本当に重要なものに追加情報を制限することから生まれます。

    スタイルをミックスする場合、プロンプトの視点側を覚えておいて:一つのイテレーションで機能するものが明確に意図を記述しない限り別のものでは失敗する傾向があります。一つの絵に多すぎるアイデアをプッシュする傾向があり;この長いリストはしばしば意図を薄めます。今が簡略化の瞬間:効果を増幅するコア要素のペアを使用し、追加物を積み重ねる代わりにベーススタイルを通じてテクスチャをレイヤリングします。このアプローチはレンダラーを圧倒せずに理想的な結果への信頼できる道を与えます。

    PitfallQuick Fix
    Unclear base style leads to muddy result単一のスタイルアンカーをロックし、モディファイアをペアに制限;2つの小さなバリアント(現在)を実行して効果を比較し、明確に優れた方向を選択。
    Conflicting color cues (цветами) disrupt mood調和の取れたパレットを選択、言葉(言葉)でカラーターゲットを指定し、結束を保持するために色を4色範囲内に保ちます。
    Modifiers clash in meaningタイプの曖昧な用語の代わりに正確な記述子を使用;アンカーに沿った2–3のモディファイアを選択し、非互換のバイブのミックスを避けます。
    Wrong order weakens emphasis最も重要なモディファイアを右側に置く;順序のシフトが主題の効果をどのように変えるかをテストし、明確さに向かって調整。
    Too many modifiers overload the prompt理想的な2–4のモディファイアに制限;テクスチャのためにベーススタイルに頼り、追加詳細をイテレーションラウンドに予約。
    Prompts drift over time with constant togglingバージョン(バージョン)で変更(変更)をドキュメント化し、すべての追加調整を簡潔に保つ;これによりトラッキングとスケーリングを助けます。

    📚 More on AI Generation & Prompts

    Ready to leverage AI for your business?

    Book a free strategy call — no strings attached.

    Get a Free Consultation