説明

国際特許分類[H04N5/278]の内容

国際特許分類[H04N5/278]に分類される特許

1 - 10 / 153


【課題】3D映像の奥行きを好適に制御して、臨場感及び娯楽性の高い3D映像を生成する。
【解決手段】奥行き制御部106は、音声解析部104による映像解析結果に基づいて、映像内の文字部用の奥行き情報を生成する。例えば、音声の大きい場合は手前に、小さい場合は奥になるように文字部の奥行き情報を作成する。また、音声の大きさ、周波数の変化に合わせて、文字部の奥行き情報が変化する速度を制御する。また、音声の種類に合わせて、文字部の奥行き情報が変化する方法を制御する。 (もっと読む)


【課題】 CM素材のCM期間中の字幕表示の合否を判定する機能を持つ字幕監視装置は、CM素材のCM期間中の字幕表示の合否判定についてはユーザーがIN点とOUT点をその都度設定することが必要不可欠であった。本発明は、上記問題を解決し、CM素材のCM期間を抽出することを含めて字幕表示の合否判定を自動化することを課題としている。
【解決手段】 本発明の字幕監視装置は、音声1kHzのはじまりとおわりをトリガとしてCM素材のCM期間を自動判別し、そのCM期間中の字幕表示の合否判定をする機能をもつことを特徴としている。
この発明によれば、音声1kHzをトリガとしてCM期間のIN点とOUT点が判別されるので、CM素材のCM期間については開始と終了をユーザーが手動で設定する必要がなくなり、ユーザーの手を煩わせることなく、CM期間の抽出と字幕表示の合否判定の自動化が可能となる。 (もっと読む)


【課題】画像データとともに、字幕翻訳データを表示させるコンテンツデータを、低コストで作成することができる字幕付加装置を提供する。
【解決手段】本発明の字幕付加装置は、画像データの表示欄と、画像データ上の領域に対応付けられた翻訳言語毎の字幕翻訳データ入力欄を含む画面を表示する表示部と、画像データ上の領域の選択と、選択された画像上の領域に対応する字幕翻訳データを入力する入力部と、画像データ上の領域と、入力された字幕翻訳データを対応付ける制御部と、画像データを管理する画像データベースと、字幕翻訳データを管理する字幕データベースを記憶する記憶部とを備える。 (もっと読む)


【課題】素材データをビデオ記憶装置にファイリングした後、該素材データの字幕データを更新する必要が生じた場合に、該ファイリングした素材データを、再生することなく、直接データ伝送する方法でビデオ記憶装置から取り出し、映像音声ファイル更新システムとして、字幕更新処理を行うことで、素材データの字幕更新処理を簡単かつ高速にすること。
【解決手段】ビデオサーバ2は、ビデオ記憶装置1から、再生することなく、直接データ伝送された映像音声ファイルの内、字幕データの更新を要する映像音声データを選出して、字幕データ重畳制御装置3にデータ伝送する。字幕データ重畳制御装置3は、該データブロックに含まれているタイムコードが、差し替え用の字幕データに付与されているタイムコードと一致する場合、当該映像音声データに当該差し替え用の字幕データを重畳し、ビデオサーバ2にデータ伝送する。 (もっと読む)


【課題】画像に付加された複数の情報を容易に選択すること。
【解決手段】携帯電話端末(撮影装置)1は、撮影部40と、撮影部によって取得された画像を表示する表示部2と、撮影部40によって取得された画像に関連するオブジェクトを画像に重ねて表示部2に表示させる制御部22とを備える。制御部22は、オブジェクトのうち、画像に含まれる所定の物体の表示領域と重なるオブジェクトを選択処理する。 (もっと読む)


【課題】 画像データの適切な位置に挿入画像を挿入する。
【解決手段】 被写体の像を撮像して画像データを生成する撮像手段と、前記画像データに対する顔認識処理の結果に基づいて、前記画像データの画像における主要被写体の分布を示す分布情報を生成する認識手段と、前記分布情報と前記被写体のコントラスト情報とに基づいて、前記画像データに挿入画像を挿入する挿入位置を決定する決定手段とを備え、前記決定手段は、前記分布情報と前記コントラスト情報との重み付けを、前記主要被写体の前記被写体全体に対する面積比率に基づいて決定し、前記重み付けを加味して、前記分布情報と前記コントラスト情報とに基づく前記挿入位置を決定する。 (もっと読む)


【課題】TTML(Timed Text Markup Language)ベースで字幕強制表示機能を実現する。
【解決手段】文書の要素を定義するタグ内に字幕強制表示に係る所定の属性情報を記述したTTMLデータとする。コンテンツの再生側では、上記TTMLデータ内の上記所定の属性情報に基づき、当該属性情報が書き込まれたタグにより指定されるテキストデータに基づく文字が、字幕表示設定のオン/オフに関わらず表示部に表示されるように制御を行う。このような構成により、TTMLデータ内の各文書要素(字幕としてのテキストデータ)のうち、所定の文書要素としてのテキストデータを、字幕表示設定のオン/オフに関わらず表示することができる。すなわち、TTMLベースで字幕強制表示機能を実現できる。 (もっと読む)


【課題】画像内の被写体を検出し、検出した被写体に関連した文字列を付加した合成画像を生成することができる画像処理装置、画像処理方法、および撮像装置を提供する。
【解決手段】入力された画像中の被写体を抽出し、抽出した被写体の特徴に基づいて、抽出した被写体に所定の重み付けを行った重み付け情報を生成する被写体認識部と、被写体認識部が抽出した被写体の中から、文字列を付加する対象の対象被写体を特定する対象物特定部と、重み付け情報に基づいて、所定の言語データベースから対象被写体を含む抽出した被写体に適合する文字列を検索する言語検索部と、言語検索部によって検索された対象被写体に適合する文字列を、入力された画像中の対象被写体に関連付けて合成した合成画像を生成する画像合成部と、を備える。 (もっと読む)


【課題】字幕が付加されている画像を再生する際に字幕と同時に画面上に表示する画像をユーザが変更すること、を支援することを図る。
【解決手段】表示順序が定められた複数のフレーム画像を有する画像データファイル内のフレーム画像を表示順序に従って画面上に並べて表示し、且つ、字幕及び字幕と同時に表示される字幕表示対象フレーム画像を特定するフレーム識別情報を有する字幕データファイル内の字幕を当該字幕表示対象フレーム画像と共に前記画面上で表示する字幕編集画面を出力する編集画面出力部51と、字幕編集画面に基づいたユーザによる操作情報を入力する操作情報入力部52と、該操作情報に応じて字幕データファイルの内容を変更する字幕データファイル編集部53と、を備える。 (もっと読む)


【課題】映像の字幕を生成し、視聴端末で同期表示するように字幕と映像とを配信すること。
【解決手段】字幕生成配信システムは、音声を含む映像を取得する撮影装置10と、撮影装置10で取得された映像を所定時間遅延させる映像バッファ41と、編集端末20から受信した字幕情報とを視聴端末50に配信する配信部42を含む配信サーバ40と、撮影装置10で取得された映像に含まれる音声に対する音声認識結果を取得する音声認識サーバ30と、音声認識サーバ30で取得された音声認識結果をユーザが編集するための編集画面を表示し、編集画面から字幕を取得する編集部22と、映像バッファ41で映像を遅延させた所定時間と、音声認識サーバ30および編集部22での処理に要した時間とに応じて決定される時間、字幕を遅延させる字幕バッファ23とを含む編集端末20と、を備える。 (もっと読む)


1 - 10 / 153