カテノイドは様々な分野に最適化されたビデオサービスを提供しています。
[メディア&放送] Loomexを活用した放送の多国語字幕制作機能 | |
---|---|
作成日 : 2021-06-29ヒット : 344 | |
添付ファイル |
main_solution_media_2.jpg |
デジタルメディアサービスとAI, ML (Machine Learning)を連係するケースも増えていて、主な事例としては多国語字幕制作機能とメディアインデックス機能です。 <一般的な字幕(Caption)編集> 字幕(Caption)はメタデータとして管理される項目で、メディア資産(Media Asset)を管理する際に修正・編集作業が必要になるケースがあります。また字幕の編集はClosed Captionを適用することが一般的です。特に複数段階に渡ってコンテンツが活用される場合には後半作業の重要度が高まります。
映像と字幕ファイル(主にClosed Caption)は入手経路が異なる場合が多いです。放送の場合、プロンプター(Prompter)な台本をそのままアップロードすることもあり得ますが、映像や音声とシンクが合わない可能性を考慮したり、ウェブアクセシビリティ(Web Accessibility)を守る必要がある場合には検収作業が必要になります。 日々正確度が向上しているAIとMLをコンテンツの音声分析と多国語字幕の制作に活用するケースもあります。
商用のクラウドAI/MLと連動された拡張機能を通してアップロードしたビデオファイルからオーディオファイルを抽出しながら同時に音声に対しての字幕ファイルを生成します。このオーディオファイルの特徴は話者(登場人物)を区別してそれぞれの音声ファイルを生成が可能なところです。 そのため映像とオーディオ波形、そして生成される字幕を同期化(synchronization)することが重要です。
クラウドの拡張機能を使用して原本映像から話者別の字幕が生成されたとしても、多国語に転換するためには言語に合う表現や用語に変更する検収作業が必要になるケースが多くあります。Loomexの字幕編集画面は、映像を見ながら翻訳を確認することができるため、検収用途に活用することも可能です。
映像ファイルから音声ファイルを抽出してSTT (Speech To Text)を使用して原本字幕を生成してから外部クラウドのAI/MLと連係した多国語変換までのワークフローを生成します。以降、既存ファイルに統合するかまたは新しいバージョンとして生成するかのオプションを設定するところまで構築することが可能です。(外部AIはAWSを採用しています。) 生成された字幕は編集インターフェースから話者別に修正・編集が可能です。この過程はAIとの連係以外にもメタデータ変種のワークフローが精巧に連結されている必要があります。 このようなクラウド連係による拡張機能はビデオ流通ワークフローの効率性を向上するだけでなく、データの収集まで連係する場合サービスプラットフォームの価値を更に向上させることができます。テレビショッピングの事例ではSTT (Speech To Text)を活用してショッピングナビゲーターのコメントと映像をデータに変換し、視聴履歴と購入履歴データを加工することで顧客行動に基くデータ体系を作ることができます。 |
|
前へ | 売上向上のためのモバイルライブコマース環境の改善 |
次の記事 | デジタルコンテンツ流通プラットフォームの必要性 |