「動画 構成」で検索すると、起承転結やPREP法といったフレームワークの解説記事が並びます。しかし実際に自社の動画を企画してみると、「どのフレームワークを使えばいいのか」「型に当てはめてみたが、しっくりこない」という壁にぶつかることがあります。
フレームワークは構成設計の出発点ですが、答えそのものではありません。この記事では、制作会社が実際にどのように構成を判断しているかを、映像制作を手がけるStokedBaseの現場視点から解説します。フレームワークの使い分け基準に加え、「型に当てはめた後の判断プロセス」までを扱います。
目次
動画の構成とは、「どの情報を、どの順番で、どのくらいの時間をかけて見せるか」を決める設計図です。構成がしっかりしていれば、撮影で何を撮るべきかが明確になり、編集でも迷いが減ります。
構成と混同されやすい「台本」や「絵コンテ」との違いを整理します。
| 用語 | 役割 | 具体的な内容 |
|---|---|---|
| 構成 | 情報の取捨選択と順序の設計 | セクションの配列、各セクションの時間配分、伝える情報の優先度 |
| 台本 | 具体的な言葉の設計 | ナレーション原稿、セリフ、テロップの文言 |
| 絵コンテ | 映像の設計 | カメラアングル、画面レイアウト、カット割り |
構成は台本や絵コンテよりも上流の工程です。構成が固まっていない状態で台本を書き始めると、何度も書き直すことになります。
構成がなぜ重要かを示すデータがあります。動画の視聴者は最初の10秒で約20%が離脱し、30秒で約33%、60秒を超えると半数以上が離脱するとされています(Funusual社記事、smarvee社記事より)。構成の設計次第で、視聴者が最後まで見てくれるかどうかが大きく変わります。
フレームワークを選ぶ前に、まず整理すべきことがあります。「目的」「視聴者」「視聴シーン」の3つです。この3つが曖昧なまま構成を組むと、フレームワークの型に情報を押し込めただけの動画になります。
動画制作を依頼する前に整理すべきことの全体像については、「動画制作を依頼する前に準備すべきこと」で詳しく解説しています。ここでは構成判断に直結する3項目に絞ります。
動画の目的を「採用動画を作りたい」「会社紹介をしたい」で止めると、構成の方向性が定まりません。目的は「この動画を見た人に、何をしてほしいか」まで落とし込む必要があります。
たとえば、同じ「採用動画」でも、「求人サイトから自社ページに来た求職者に応募ボタンを押してもらう」と「合同説明会で自社ブースに足を止めてもらう」では、構成が変わります。前者は仕事内容や社員の声を丁寧に見せる構成が向いていますし、後者は冒頭数秒で関心を引く構成が必要です。
構成を考えるとき、「20代の求職者」「取引先の担当者」のような属性だけでは不十分です。その人が動画を再生した瞬間に「何を期待しているか」まで想定する必要があります。
採用動画であれば、求職者が知りたいのは「この会社で実際に働くとどんな感じなのか」です。会社の沿革や経営理念を並べても、求職者の期待には応えられません。視聴者の期待を起点に情報を選ぶことで、構成に「軸」が生まれます。
動画がどこで再生されるかによって、冒頭の設計が変わります。
| 視聴シーン | 視聴者の状態 | 冒頭に求められる設計 |
|---|---|---|
| SNSのフィード(Instagram、X等) | スクロール中。止まる理由がなければ通過する | 最初の2-3秒で「何の動画か」を視覚的に提示。テキストやキャッチコピーで関心を引く |
| 自社の採用サイト | 興味を持ってアクセスしている。ある程度の視聴意欲がある | 冒頭で「この動画を見ると何がわかるか」を伝え、視聴を継続する理由を示す |
| YouTubeの検索結果 | 特定の情報を探している。サムネイルとタイトルで期待値が形成されている | サムネイル・タイトルで作った期待に対して、冒頭15秒以内に応える内容を入れる |
| 展示会・説明会のスクリーン | 周囲に雑音がある。映像が目に入っても音声は聞こえにくい | テロップやビジュアルだけで内容が伝わる設計。音声依存の構成は避ける |
このように、視聴シーンを特定することで「冒頭の何秒で何を見せるか」の判断基準が明確になります。
前提条件を整理したら、構成のベースとなるフレームワークを選びます。ここでは代表的な3つのフレームワークの概要と、それぞれ「どんな目的・視聴者の動画に向いているか」の判断基準を整理します。
フレームワークの詳細な解説は他の記事でも多く扱われています。この記事では使い分けの判断基準の提示にとどめ、次のセクションで「フレームワークの先にある判断プロセス」を掘り下げます。
「起」で状況を提示し、「承」で展開し、「転」で変化や気づきを起こし、「結」で結末を見せる構成です。密着動画やドキュメンタリー型の動画に向いています。
視聴者が「この先どうなるのか」という期待を持って見続けるため、視聴維持率を高めやすい特徴があります。一方、情報を効率的に伝えたい動画(商品説明、手順解説等)には不向きです。結論が最後に来るため、途中で離脱されると肝心の情報が届きません。
向いている動画: 採用密着動画、ブランディング動画、企業ストーリー動画
「Point(結論)→ Reason(理由)→ Example(具体例)→ Point(結論の再提示)」の構成です。結論を最初に提示するため、視聴者が動画の趣旨を早い段階で理解できます。
サービス紹介動画、商品説明動画、教育・研修動画など、伝えるべき情報が明確に決まっている動画に適しています。ストーリー性は弱くなるため、感情に訴える動画には不向きです。
向いている動画: サービス紹介、商品説明、社内研修、FAQ動画
CAMS(Catch→Appeal→Motivate→Suggest)やABCD(Attract→Brand→Connect→Direct)は、視聴者の行動を促すことに特化した構成です。冒頭で注意を引き、訴求ポイントを提示し、動機づけをして、具体的な行動(問い合わせ、購入、申し込み等)を促します。
広告動画、LP用の短尺動画、キャンペーン動画など、明確なコンバージョンを狙う動画に向いています。
向いている動画: 動画広告、LP埋め込み動画、キャンペーン告知
目的と視聴者の状態から、おおまかな方向性を判断できます。
| 判断基準 | 選ぶフレームワーク |
|---|---|
| 視聴者に感情の変化を体験させたい(共感、驚き、感動等) | 起承転結型 |
| 視聴者に情報を効率的に伝えたい(仕組み、手順、特徴等) | PREP型 |
| 視聴者に特定の行動を起こさせたい(問い合わせ、購入等) | CAMS/ABCD型 |
| 動画の尺が30秒以内 | CAMS/ABCD型(短尺では結論先行+行動喚起が有効) |
| 動画の尺が3分以上 | 起承転結型(長尺ではストーリーの力で視聴を維持) |
ただし、これはあくまで出発点です。実際の構成設計では、フレームワークを選んだ後に「この動画の場合はどうするか」を個別に判断する必要があります。次のセクションでは、その判断プロセスを解説します。
フレームワークを選んだだけでは、構成は完成しません。「起承転結にしよう」と決めた後、「起で何を見せるか」「承から転への切り替えをどこに置くか」といった具体的な判断が必要です。
このセクションでは、StokedBaseが動画制作の現場で実際に行っている構成の判断プロセスを解説します。フレームワークの型に当てはめた後に考えるべきことを、5つの観点から整理しています。
構成設計で最も重要なのが冒頭です。冒頭15秒以内に明確な価値を提示した動画は、1分時点の視聴維持率が約18%高いというデータがあります(Retention Rabbit 2025年レポート)。YouTube全体の平均視聴維持率が23.7%であることを踏まえると、冒頭設計が視聴維持率に与える影響は非常に大きいことがわかります(同レポート)。
StokedBaseの制作現場では、冒頭設計を「視聴者が再生ボタンを押した理由に最初に応える」工程と位置づけています。
たとえば採用動画であれば、求職者は「この会社で実際にどう働くのか」を知りたくて再生しています。そのため冒頭には、オフィスの外観や社名ロゴではなく、実際の仕事風景や社員の表情を見せます。「この動画を見れば、この会社の仕事がわかる」と感じてもらえれば、視聴が続きます。
逆に、会社の沿革や理念からスタートすると、求職者の期待と動画の内容が乖離し、冒頭で離脱されます。冒頭に何を置くかは、「視聴者が最も知りたいこと」から逆算して決めるのが原則です。
構成を組むとき、発注者がやりがちなのが「自分が伝えたい順番」で情報を並べることです。経営理念、会社の歴史、事業内容、社員紹介、職場環境、と、パンフレットの目次のように並べてしまう構成です。
しかし、視聴者が知りたい順番はこれとは異なります。たとえば採用動画を見る求職者は、まず「この会社でどんな仕事をするのか」「どんな人が働いているのか」を知りたいのであって、設立年や資本金には関心がありません。
情報の配列は、「発注者が伝えたいこと」ではなく「視聴者が知りたいこと」を起点に組むのが原則です。StokedBaseでは、視聴者の期待から逆算して情報の優先順位を決め、重要度の高い情報を前半に配置しています。
動画は情報だけでなく、感情の流れを設計する必要があります。情報が淡々と続く動画は、内容が正しくても視聴者が飽きます。
構成にリズムを作るには、「感情の山(盛り上がり)」と「谷(落ち着き)」を意図的に配置します。たとえば密着動画であれば、仕事の大変さを見せた後に、同僚と笑い合う場面を入れる。緊張感のある作業シーンの後に、休憩時間の穏やかな会話を入れる。この山と谷の繰り返しが、視聴者を引き込む力になります。
一本調子で「良いこと」だけを見せ続ける動画は、かえって信頼感を失います。仕事の大変さや苦労を正直に見せることで、その後に見せる「やりがい」や「達成感」が際立ちます。
ブリッジとは、動画のセクションとセクションをつなぐ要素です。たとえば「仕事紹介」のセクションが終わって「社員インタビュー」に切り替わるとき、何のつなぎもなく場面が変わると、視聴者は「もう見たい部分は終わったかもしれない」と感じて離脱します。
StokedBaseでは、セクションの切れ目に「次のセクションへの期待を作る要素」を入れています。たとえば、仕事紹介のセクションの最後に社員の「この仕事で一番大変だったのは…」という言葉を入れ、次のインタビューセクションへの関心をつなぐ手法です。
テレビ番組のCM前に「この後、衝撃の展開が…」と予告を入れるのと同じ原理です。次に何が来るかをほのめかすことで、視聴者の「続きを見たい」という気持ちを維持します。
動画のラスト(最後の15-30秒)は、「視聴者が動画を見終わった後に何を感じるか」を決める重要な部分です。
よくある失敗は、ラストに情報を詰め込みすぎることです。「会社概要」「問い合わせ先」「URL」「QRコード」を一気に表示する動画がありますが、視聴者はその情報を覚えていません。
ラストに必要なのは、「この動画で一番伝えたかったこと」の余韻です。採用動画であれば、社員の「この仕事の面白さは…」という一言で終わる方が、視聴者の印象に残ります。問い合わせ先やURLは、動画の概要欄やWebページに記載すれば十分です。
ここまでの判断プロセスは、動画のタイプを問わず共通して使える考え方です。ただし、動画のタイプ(密着・インタビュー・会社紹介等)によって、構成上の力点が変わります。ここでは3つの主要な動画タイプについて、構成判断のポイントを整理します。
密着動画やドキュメンタリー動画は、撮影時点では「何が撮れるか」が完全にはわかりません。台本通りに進む動画と違い、現場で起きることをベースに構成を組み立てます。
だからこそ、撮影前に「構成の骨格」を設計しておくことが重要です。StokedBaseでは、密着動画の構成設計で以下の点を事前に決めています。
密着動画は「撮れ高次第」と思われがちですが、構成の骨格が決まっていれば、撮影で押さえるべきポイントが明確になり、編集もスムーズに進みます。
インタビュー動画の構成は、「質問の順番と内容」がそのまま動画の構成になります。つまり、質問設計が構成設計の大部分を占めます。
構成上のポイントは、「聞きたいことを聞く」のではなく「視聴者が知りたいことを引き出す順番で聞く」ことです。たとえば採用向けのインタビューであれば、いきなり「やりがいは何ですか」と聞くよりも、「最近、一番大変だった仕事を教えてください」から入る方が、具体的なエピソードとともにやりがいが語られます。
インタビュー動画の質問設計について詳しくは「インタビュー動画の作り方|話を引き出す質問設計が動画の質を決める」で解説しています。
会社紹介動画や商品紹介動画は、伝えるべき情報が事前に決まっているため、構成を組みやすいタイプです。しかし、「情報を並べるだけ」になりがちな罠があります。
よく見る構成は「会社概要→事業内容→強み→社員紹介→まとめ」です。この構成は情報を網羅していますが、視聴者が「なぜこの動画を最後まで見るべきか」の理由がありません。結果として、冒頭の会社概要で離脱されることが多くなります。
情報整理型の動画でも、「視聴者にとって最も関心の高い情報を先に見せる」原則は同じです。会社紹介動画であれば、会社概要から始めるのではなく、「この会社で働くと何が得られるか」「この会社の製品・サービスが顧客のどんな課題を解決するか」から入ると、視聴が続きます。
会社紹介動画の構成パターンについて詳しくは「会社紹介動画の作り方|構成の基本と成果につなげるポイント」をご覧ください。
構成に起因する失敗には、共通するパターンがあります。StokedBaseの制作現場で実際に見てきた失敗パターンを3つ紹介します。
YouTube等のプラットフォームに動画を公開する場合、視聴者はサムネイルとタイトルを見て「この動画を見れば○○がわかる」という期待を持って再生ボタンを押します。
この期待と動画の中身がずれていると、冒頭で離脱されます。たとえば、サムネイルに「1日密着」と書いてあるのに、動画の冒頭が会社概要の説明から始まるケースです。視聴者は「密着映像」を期待して再生しているので、期待と違うと感じた瞬間に離脱します。
これは構成の問題です。構成を組む段階で「サムネイル・タイトルで何を約束するか」を決め、冒頭でその約束に応える設計にする必要があります。構成とサムネイルを別々に考えてしまうと、この乖離が起きます。
会社紹介動画でよく見られる失敗です。冒頭に会社のロゴアニメーション、設立年、所在地、代表者名が表示される動画があります。この情報は視聴者が「今、知りたいこと」ではありません。
前述のとおり、視聴者は最初の10秒で約20%が離脱します(Funusual社記事、smarvee社記事より)。冒頭の10秒を会社概要に使ってしまうと、動画の本題にたどり着く前に視聴者がいなくなります。
冒頭に配置すべきは、「この動画で最も価値のある情報の一端」です。採用動画なら社員が仕事に集中している場面、商品紹介なら商品の最も印象的なシーン。視聴者が「もっと見たい」と思う要素を最初に見せることが、構成設計の基本です。
3分の動画に、会社概要、事業内容、商品説明、社員インタビュー、社長メッセージ、採用情報を全部入れようとするケースです。1つ1つの情報が薄くなり、結局何も印象に残らない動画になります。
構成設計では「何を入れるか」と同じくらい「何を捨てるか」が重要です。動画の目的に照らして、「この動画で伝えるべき最も重要なメッセージは1つだけ」と決めると、構成が引き締まります。
伝えきれない情報は、別の動画に分けるか、Webページやパンフレットなど別のメディアに委ねます。1本の動画に全てを詰め込む必要はありません。
動画制作全般の失敗パターンについては「動画制作の失敗はなぜ起きる?原因と防ぎ方を制作会社が解説」で構造的に解説しています。
構成が固まったら、構成表(構成シート)に落とし込みます。構成表とは、動画の各セクションの内容・秒数配分・映像の概要を1枚にまとめた資料です。
| 項目 | 内容 | 記載の目的 |
|---|---|---|
| セクション番号と名称 | 「01. 冒頭」「02. 仕事紹介」等 | 全体の流れを俯瞰する |
| 秒数配分 | 各セクションの目安秒数 | 尺の超過を防ぐ。重要セクションに十分な時間を確保する |
| 画面内容 | そのセクションで映す映像の概要 | 撮影で「何を撮るか」を明確にする |
| ナレーション/テロップ要旨 | セリフやテロップの方向性 | 台本作成のベースになる |
| 音楽/SE指示 | BGMやSE(効果音)の方向性 | 編集時の作業効率を上げる |
構成表のポイントは、「テンプレートの欄を埋める」のではなく、「前のセクションまでの判断の結果をテンプレートに落とし込む」ことです。目的・視聴者・視聴シーンの整理、フレームワークの選定、冒頭設計や情報の配列の判断を経て、その結果を構成表に記録します。
テンプレートから始めて欄を埋めていくと、前提条件の整理やフレームワーク選定のプロセスを飛ばしてしまいがちです。構成表はゴールではなく、判断プロセスの記録です。
構成表は、制作会社と発注者が「動画の完成イメージ」をすり合わせるためのコミュニケーションツールでもあります。
すり合わせの場では、以下の点を確認すると認識のズレを防げます。
動画の構成は、フレームワークの型を選ぶことで完成するものではありません。この記事で解説した内容を3つのポイントに整理します。
StokedBaseは映像制作を手がける制作会社です。構成の設計段階からプロジェクトに入り、「どんな動画を作るか」だけでなく「なぜその構成にするか」の判断プロセスを一緒に進めています。
構成の段階から相談できる動画制作をお考えの方は、お気軽にご連絡ください。
動画制作会社の選び方も参考になります。