説明

録画装置

【課題】録画された動画からユーザー所望のシーンを簡易且つ迅速に抽出して表示することが可能な録画装置の提供を目的とする。
【解決手段】デジタルテレビ放送を受信して記録媒体に記録する録画装置100において、デジタルテレビ放送に含まれる動画を構成するフレーム画像から、出演者分類DB70に登録された出演者の顔画像を抽出し、出演者分類DB70に登録された出演者に対応付けられているジャンルを、顔画像の抽出を行ったフレーム画像に付加する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は録画装置に関し、特に動画を記録媒体に記録する録画装置に関する。
【背景技術】
【0002】
近年、多彩かつ多様な映像コンテンツが作成されており、視聴者は膨大なコンテンツの中から所望のコンテンツを探し出して視聴しなければならなくなってきている。このような実状に鑑みて、膨大なコンテンツの中から好みの番組を探し出すための各種技術が提案されている。
【0003】
例えば、特許文献1には、映像や音声の特徴を認識することにより出演者の名前を判別し、EPG情報等から視聴者の好みの番組を推薦する番組推薦装置について開示されている。当該番組推薦装置では、ユーザーは好みの出演者をデータベースに登録し、番組推薦装置はデータベースに登録された出演者の特徴量との相関係数が一定の範囲内になる特徴量を持った有名人を、ユーザーの好みの人物に似ている有目人として、ユーザーに推薦する。
【0004】
また、例えば、特許文献2には、映像音声コンテンツの一部を構成するシーン属性を、ユーザーの視聴した番組から抽出して統計し、当該統計と相関性の高い番組をユーザーに推奨する番組推奨装置について開示されている。当該番組推奨装置によれば、録画された番組が番組情報や属性情報を有していない場合であっても、ユーザーの嗜好や興味に応じた番組を推奨することが出来る。
【0005】
また、例えば、特許文献3には、フレームに対して付与されたメタデータにおけるキーワード、ジャンル、あるいはコメントの有無などの条件によって各フレームに重み付けを行い、優先度が最大となるフレームの画像からサムネイル画像を作成する映像記録装置について開示されている。当該映像記録装置によれば、視聴者にとって簡略な操作で、番組を判別するためのサムネイル画像を番組内容をよく反映したものとすることができる。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2009−296346号公報
【特許文献2】特開2010−074518号公報
【特許文献3】特開2008−103784号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
ところで、従来の録画装置では、番組単位での分割録画、シーンの切り換わりを検出して当該切り換わりで分割する分割録画、指定した時間単位での分割録画、が主であった。しかしながら、実際の映像は、1つの番組内でも多用なジャンルの内容を含むことがあるし、シーンが切り換わっても必ずしもジャンルが変化するとは限らない。従って、従来の手法で行われた分割録画では、ユーザーは、録画された番組の中の所望のジャンルにかかるシーンを視聴するためには、録画された番組を全て視聴するか、早送りしたりやサムネイルを参考にして所望のジャンルにかかるシーンを探し出して視聴する必要があった。
【0008】
本発明は、前記課題に鑑みてなされたもので、録画された動画からユーザー所望のシーンを簡易且つ迅速に抽出して表示することが可能な録画装置の提供を目的とする。
【課題を解決するための手段】
【0009】
前記課題を解決するために、本発明にかかる録画装置では、動画を記録媒体に記録する録画装置において、動画を構成するフレーム画像毎にシーン情報を付加するシーン情報付加部を備える構成としてある。
当該構成においては、フレーム画像毎にシーン情報を付加してあるため、所望のシーン情報を付加されているフレーム画像を選択的に視聴することが可能となる。よって、録画された動画からユーザー所望のシーンを簡易且つ迅速に抽出して表示することが可能となる。
【0010】
本発明の選択的な一態様は、特徴画像とシーン情報との対応関係を規定したデータベースを更に備え、前記シーン情報付加部は、前記データベースを参照し、前記動画のフレーム画像から画像認識により抽出された特徴画像に対応するシーン情報を当該フレーム画像に付加する構成とされる。
当該構成によれば、フレーム画像からデータベースに登録されている特徴画像を抽出し、前記データベースにおいて前記特徴画像に対応付けられているシーン情報を、前記特徴画像の抽出元であるフレーム画像に付加している。このように、予め用意されたデータベースを利用してフレーム画像に付加すべきシーン情報を決定しているため、簡易な処理でシーン情報を決定できる。
【0011】
本発明の選択的な一態様は、前記データベースには、各特徴画像に対応付けられた各シーン情報について重みが設定されており、前記シーン情報付加部は、動画を構成するフレーム画像から抽出された特徴画像が1つであって当該特徴画像に対応付けられたシーン情報が複数の場合に、前記重みが最も大きいシーン情報を当該フレーム画像に付加する構成とされる。
当該構成によれば、フレーム画像から抽出された特徴画像に対し、前記データベースにおいて複数のシーン情報が対応付けられている場合であっても、単純な比較ロジックにより、フレーム画像に付加すべきシーン情報を適切に決定できる。
【0012】
本発明の選択的な一態様は、前記データベースには、各特徴画像に対応付けられた各シーン情報について重みが設定されており、前記シーン情報付加部は、動画を構成するフレーム画像から複数の特徴画像が抽出された場合に、対応付けられたシーン情報が最も少ない特徴画像に対応付けられたシーン情報の中で重みが最も大きいシーン情報を当該フレーム画像に付加する構成とされる。
当該に構成よれば、前記データベースに登録された特徴画像がフレーム画像から複数抽出された場合であっても、単純な比較ロジックにより、フレーム画像に付加すべきシーン情報を適切に決定できる。
【0013】
本発明の選択的な一態様は、前記データベースには、各特徴画像に対応付けられた各シーン情報について重みが設定されており、前記シーン情報付加部は、動画を構成するフレーム画像から複数の特徴画像が抽出された場合であって対応付けられたシーン情報が最も少ない特徴画像が複数ある場合に、各特徴画像に対応付けられたシーン情報の中で最も重みの大きいものを特徴画像毎にそれぞれ選出した複数のシーン情報の中で最も多いシーン情報を当該フレーム画像に付加する構成とされる。
当該構成によれば、前記データベースに登録された特徴画像がフレーム画像から複数抽出された場合であって、対応付けられたシーン情報が最も少ない特徴画像が複数存在する場合であっても、単純な比較ロジックにより、フレーム画像に付加すべきシーン情報を適切に決定できる。
【0014】
本発明の選択的な一態様は、動画から抽出された特徴画像について、所定の操作部を介して入力されたシーン情報を対応付けて前記データベースに登録するデータベース作成部を更に備える構成とされる。
当該構成によれば、前記データベースをユーザー自ら構築できるため、前記データベースに登録される特徴画像をとシーン情報がユーザーの嗜好や考え方を良好に反映したものとなる。よって、各フレーム画像に付加するシーン情報が、より適切なものとなる。
【0015】
本発明の選択的な一態様は、前記シーン情報付加部は、所定時間以上連続して同じシーン情報が付加された複数のフレーム画像に対し、ひとまとまりのシーンであることを示す情報を付与する構成とされる。
当該構成によれば、同じシーン情報が付加された所定時間以上連続する複数のフレーム画像が、ひとまとまりのシーンであることを示す情報を付与されるため、当該ひとまとまりのシーンを再生することにより、同じシーン情報が付加された連続するフレーム画像を再生することが出来るようになる。
【0016】
本発明の選択的な一態様は、前記シーン情報付加部は、前記動画において同じシーンが所定時間以上継続する場合は、当該継続するシーンを構成する各フレーム画像をひとまとまりのシーンとして分類する構成とされる。
【0017】
なお、上述した録画装置は、他の機器に組み込まれた状態で実施されたり他の方法とともに実施されたりする等の各種の態様を含む。また、本発明は前記録画装置を備える録画システム、上述した装置の構成に対応した工程を有する制御方法、上述した装置の構成に対応した機能をコンピュータに実現させるプログラム、該プログラムを記録したコンピュータ読み取り可能な記録媒体、等としても実現可能である。
【発明の効果】
【0018】
以上説明したように本発明によれば、録画された動画からユーザー所望のシーンを簡易且つ迅速に抽出して表示することが可能な録画装置を提供することができる。
請求項2にかかる発明によれば、簡易な処理でシーン情報を決定できる。
請求項3〜5にかかる発明によれば、単純な比較ロジックにより、フレーム画像に付加すべきシーン情報を適切に決定できる。
請求項6にかかる発明によれば、各フレーム画像に付加するシーン情報が、より適切なものとなる。
請求項7,8にかかる発明によれば、連続する同じシーンを容易にまとめて再生出来るようになる。
【図面の簡単な説明】
【0019】
【図1】録画装置の構成を示すブロック図である。
【図2】データベース登録処理の流れを示すフローチャートである。
【図3】データベース登録処理を説明する図である。
【図4】シーン情報付加処理の流れを示すフローチャートである。
【図5】ジャンル確定処理の第1の流れを示すフローチャートである。
【図6】ジャンル確定処理の第1の流れを説明する図である。
【図7】地上デジタル放送のTSパケットの構造を示す図である。
【図8】ジャンル確定処理の第2の流れを示すフローチャートである。
【図9】ジャンル確定処理の第2の流れを説明する図である。
【図10】ジャンル確定処理の第3の流れを示すフローチャートである。
【図11】ジャンル確定処理の第3の流れを説明する図である。
【図12】シーン判定処理の流れを示すフローチャートである。
【図13】記録媒体の記録イメージである。
【図14】記録イメージを再生を説明する図である。
【発明を実施するための形態】
【0020】
以下、下記の順序に従って本発明の実施形態を説明する。
(1)録画装置の構成:
(2)データベース登録処理:
(3)シーン情報付加処理:
(4)ジャンル確定処理:
(5)シーン判定処理:
(6)視聴にかかる処理:
(7)まとめ:
【0021】
(1)録画装置の構成:
図1を参照して録画装置の電気的構成を説明する。なお、以下で説明する実施形態では、デジタルテレビ放送を受信して録画する録画装置を例に取り説明を行うが、むろん、これに限るものではない。例えば、デジタルテレビ放送(ワンセグ放送、地上デジタル放送、デジタル衛星放送、ケーブルテレビ放送等のように動画を放送するサービス)の動画を受信しつつ録画する装置、オンデマンド放送(インターネット等のネットワークを介して動画を配信するサービス)を受信しつつ録画する装置、記録媒体に記録された動画を読み出して別の記録媒体に録画する装置等、動画を記録媒体に録画する装置であれば如何なる装置であっても本発明を適用可能である。
【0022】
図1に示すように、録画装置100は、デジタルテレビ放送を受信して動画を抽出する放送受信部10と、所定時間の動画をバッファする受信バッファ部20と、画像認識により動画に出演している出演者を特定する出演者特定部30と、出演者に基づいて各フレームのシーンを特定する放送シーン特定部40と、放送シーン特定部40によって特定されたシーンを動画の各フレームに付加するシーン情報付加部50と、動画を記録媒体に記録する録画部60と、出演者とシーンとの対応関係を記録した出演者分類DB70と、出演者とシーンとの対応関係を作成して出演者分類DBに登録する出演者登録部80と、を備えている。
【0023】
放送受信部10は、例えば、デジタルテレビ放送のチューナー、デマルチプレクサ、MPEG2のデコードを行うMPEGデコーダ等を含んで構成され、地上デジタル放送信号からいずれかチャンネルを選局して放送信号を抽出し、当該放送信号にデマルチプレクッスやMPEGデコード等を行うことによりトランスポートストリーム(TS)信号を復元する。放送受信部10は、不図示のリモコン等でユーザが指定したチャンネル、もしくは予め録画予約されていたチャンネルを選局する。なお、本実施形態においては、当該TS信号が動画を構成し、当該TS信号を構成するMPEG−2のTSパケットに含まれる画像がフレーム画像を構成する。
【0024】
受信バッファ部20は、例えば、フレームメモリーにより構成され、所定時間のTS信号をバッファすることができる。なお受信バッファ部20のフレームメモリーは、出演者特定部30の行う出演者を特定する処理、放送シーン特定部40の行うシーンを特定する処理、シーン情報付加部の行うシーン情報を付加する処理、において必要とされる時間のTS信号をバッファ可能な容量が用意される。
【0025】
出演者特定部30は、例えば、画像認識プログラムを実行するCPUやRAM等のプログラム実行環境により実現される。画像認識には公知の各種の技術が採用可能である。むろん、出演者特定部30は、これと同等の機能を実現するIC(Integrated Circuit)等により実現してもよい。
【0026】
放送シーン特定部40は、例えば、CPUやRAM等のプログラム実行環境において、後述のシーン確定処理やシーン判定処理におけるシーン判断を実行することにより実現される。むろん、放送シーン特定部40は、これと同等の機能を実現するIC(Integrated Circuit)等により実現してもよい。
【0027】
シーン情報付加部50は、例えば、CPUやRAM等のプログラム実行環境において、動画の各フレーム画像にシーン情報を付加する処理を実行することにより実現される。むろん、シーン情報付加部50は、これと同等の機能を実現するIC(Integrated Circuit)等により実現してもよい。
【0028】
録画部60は、HDD(Hard Disk Drive)、DVD(Digital Versatile Disk)、ネットワークストレージ等のように、不揮発性の記憶媒体と当該不揮発性の記憶媒体に対するデータの記録を制御する制御部との組み合わせにより実現され、入力された動画を不揮発性の記憶媒体に録画する。
【0029】
出演者分類DB70は、半導体メモリ、HDD、ネットワーク上のサーバ等の不揮発性の記憶媒体により実現され、出演者とシーンとの対応関係を記録されている。出演者分類DB70は、出演者特定部30の要求に応じていずれかの出演者に対応付けられたシーン情報を出演者特定部30へ送信したり、出演者登録部80から入力される出演者とシーン情報の対応関係を不揮発性の記憶媒体に記録したりする。
【0030】
出演者登録部80は、後述のデータベース登録処理を実行するCPUやRAM等のプログラム実行環境と、ユーザの操作入力を受け付けるリモコン等の操作部と、所定のディスプレイに動画やユーザインターフェースを表示するための表示部と、により構成される。むろん、データベース登録処理を実行するプログラム実行環境は、これと同等の機能を実現するIC(Integrated Circuit)等により実現してもよい。出演者登録部80は、表示部に動画を表示しつつ、表示部に表示された動画から操作部の操作により選択された特徴画像と当該特徴画像に対応付けるべく操作部を介して入力されたシーン情報とを対応付けて出演者分類DB70に記憶させる。
【0031】
(2)データベース登録処理:
次に、図2、図3を参照しつつデータベース登録処理について説明する。図2はデータベース登録処理の流れを示すフローチャート、図3はデータベース登録処理を説明する図である。データベース登録処理は、ユーザがデーベース登録の開始を指示する所定の操作入力を操作部を介して行ってしたときに、出演者登録部80によって実行される。ユーザは、例えば、録画済みの動画やテレビ放送等の視聴中に所定の操作入力を行うことにより当該データベース登録処理を実行させることができる。
【0032】
処理が開始されると、出演者特定部30に、所定の操作入力が行われたときにディスプレイに表示されていた動画のフレーム画像に含まれる顔画像を顔認識により抽出させ(S100)、抽出した顔が出演者分類DB70に登録されているか否かを検索させる(S110)。その後、ステップS100で抽出させた顔画像が出演者分類DB70に登録済みである場合は(S120:Yes)当該顔画像に対応するシーン情報の編集画面を表示部に表示し(S130)、ステップS100で抽出させた顔画像が出演者分類DB70に未登録の場合は(S120:No)当該顔画像の新規登録画面を表示部に表示する(S150)。
【0033】
例えば、図3に示すようにフレーム画像が人物A,Bの顔画像を含んでいる場合は、これらの人物A,Bの顔領域を顔認識によって検出し、人物A,Bの顔画像の画像特徴量を抽出する。そして、出演者分類DB70に登録済みの人物の中に当該画像特徴量を備える人物がいるか否かを検索する。なお、出演者分類DBは、人物の顔画像そのものが登録されていいてもよいし、人物の顔画像から抽出された画像特徴量が登録されていてもよい。前者であれば、出演者分類DB70に登録されている顔画像から画像特徴量を抽出しつつ、ステップS100で抽出された顔画像を検索することになる。
【0034】
人物A,Bの顔画像が未登録の場合は、各人物に対して識別子とジャンルとの設定画面をディスプレイに表示する(S150、S160)。ここで設定する識別子やジャンルは、ユーザーが人物に対して任意に設定するものであり、人物を識別しやすい名称を識別子として設定し(S150)、人物Bが登場すると思われる1以上のジャンルを設定する(S160)。
図3に示す例では、ユーザーは、人物Aに識別子Aとジャンル「ドラマ」を付加し、人物Bに識別子Bとジャンル「ミュージック」「ドラマ」を付加している。すなわち、ユーザーは、ドラマには出演するもののその他の歌番組等には出演しない(と思われる)人物Aに対しては、単一のジャンル「ドラマ」を付加し、ドラマにも歌番組にも出演する(と思われる)人物Bに対しては、複数のジャンル「ミュージック」「ドラマ」を付加している。なお、本実施形態においては、ここで言うジャンルがシーン情報を構成する。
【0035】
また、人物に対して1以上のジャンルを設定する場合は、各ジャンルに重みを設定する。すなわち、図3に示す人物Bのようにジャンル「ミュージック」「ドラマ」を設定した場合は、いずれが人物Bが出演する頻度の高い(と思われる)ジャンル「ミュージック」を上位におくことにより、ジャンル「ミュージック」の重みをジャンル「ドラマ」よりも大きくしている。
【0036】
一方、人物A,Bが登録済みの場合は、各人物に対して設定されているジャンルの編集画面をディスプレイに表示する(S130)。図3に示す例では、例えば、本データベース登録処理の実行時に既に人物Aにジャンル「ドラマ」が設定され人物Bにジャンル「ミュージック」が設定されていた場合に、人物Bに対して新たにジャンル「ドラマ」を設定する場合が、これに該当する。
【0037】
以上のようにして、設定もしくは編集された識別子やジャンルは、出演者分類DB70に登録される(S140)。以上のように、ユーザーは、動画の視聴中にジャンルを追加・削除・変更したい人物を発見したタイミングでデータベース登録処理を開始させ、新たに出演者分類DBに人物を追加したり、出演者分類DBに既存の人物の情報を呼び出して当該人物のジャンルを編集したりすることができる。従って、録画装置100のユーザーは、出演者分類DB70を自分のイメージに近くなるように容易に編集可能であり、後述のシーン情報付加処理において動画の各フレーム画像に付加されるシーン情報がユーザーにとって最も適切な形で付加されるように出演者分類DBを改良していくことができる。
【0038】
なお、上述した実施形態においては、画像認識の一例として、人物の顔画像を特徴画像として認識する顔認識を例にとって説明したが、植物や動物、山や風景等の他の画像を特徴画像とする画像認識を利用してシーン判断を行ってもよいことは言うまでもない。
【0039】
(3)シーン情報付加処理:
次に、図4を参照してシーン情報付加処理について説明する。図4は、シーン情報付加処理の流れを示すフローチャートである。同図に示すシーン情報付加処理は、動画を記録媒体に記録する際に、シーン情報付加部50によって実行される。なお、デジタルテレビ放送を録画するときは、放送受信部10の出力するTSパケットが、逐次、受信バッファ部20に記憶されている。
【0040】
処理が開始されると、受信バッファ部20に記録されている各TSパケットについて、出演者特定部30に、顔画像を顔認識により抽出させる(S200)。出演者特定部30は、TSパケットに顔画像を検出すると(S200:Yes)、出演者分類DBを参照し、検出した顔画像が出演者分類DBに登録済みであるか否かを判断する(S210)。ここで、検出した顔画像が出演者分類DBに登録済みの場合は(S210:Yes)、ジャンル確定処理によって当該顔画像に付加すべきジャンルを特定する(S220)。なお、ジャンル確定処理の詳細については後に詳述する。一方、検出した顔画像が出演者分類DBに未登録の場合は(S210:No)、ステップS200にて判断対象とされたTSパケットについて該当するジャンルが無いものと判断する(S240)。
【0041】
以上のようにして、ステップS200にて判断対象とされたTSパケットは、ジャンルが特定され(S220)もしくは該当ジャンル無しと判断される(S240)ことによりジャンルが確定すると、シーン判定処理の対象となる。シーン判定処理では、シーン判定処理の対象となるTSパケットに対してシーン情報を付加すべきか否か判断する(S230)。シーン情報を付加すべきと判断されたTSパケットについては、ステップS220で特定されたジャンルが付加され、シーン情報を付加すべきでないと判断されたTSパケットについては、ステップS220でジャンルが特定されていてもジャンルは付加されない。以上のシーン情報付加処理を行うことにより、各TSパケットに対して適切なジャンルが付加される。
【0042】
(4)ジャンル確定処理:
次に、図5〜図11を参照して、図4のステップS220のジャンル確定処理について詳細に説明する。図5、図8、図10は、ジャンル確定処理の流れをフローチャートにて示しており、図6、図9、図11には、ジャンル確定の各手法を説明する図であり、図7は、TSパケットの構造を説明する図である。
【0043】
ジャンル確定処理が開始されると、まず、出演者の人数に応じて最適なジャンル確定の手法を選択する判断処理を行う(S220a)。すなわち、出演者が単数の場合と複数の場合とで最適なジャンル確定のアルゴリズムを選択するものであり、出演者の人数が1人の場合はステップS220b〜S220dの処理を実行し(S220a:Yes)、出演者の人数が2人以上の場合は図8に示すステップS220e〜220iや図10に示すステップS220j〜S220oの処理を実行する(S220a:No)。ここで、出演者の人数とは、TSパケットのフレーム画像に含まれる出演者のうち既にジャンルを付加されている出演者の人数であり、具体的には、上述したステップS200,S210の顔認識により検出されて出演者分類DBに登録されていると判断された顔画像に対応する出演者の人数となる。
【0044】
出演者の人数が1人の場合は(S220a:Yes)、当該出演者に対応付けられたジャンルの中から最も重み付けの大きいジャンルを設定し(S220b)、この設定したジャンルを判断対象となっているTSパケットのジャンルとして確定する(S220c)。
例えば、図6に示すように、判断対象となっているTSパケットに識別子Bを付与された出演者Bが含まれると出演者特定部30が判断し、出演者Bにジャンル「ミュージック」とジャンル「ドラマ」が付与されている場合は、出演者Bの各ジャンルに付与されている重みを比較する。図6に示す例では、ジャンル「ミュージック」の重みが80%であってジャンル「ドラマ」の重みが20%である。そこで、より重みの大きい「ミュージック」が、判断対象となっているTSパケットのジャンルとして設定・確定される(S220b,S220c)。確定したジャンルは、TSパケットに付加される(S220d)。
【0045】
なお、図7に示すように、地上デジタル放送にかかるTSパケットのヘッダは任意の情報を付加することができる領域「Etc」を有しており、ジャンルにかかる情報は当該領域「Etc」に記録することができる。むろん、ジャンルに関する情報を記録するための領域を新たにヘッダに追加し、当該追加されたヘッダにジャンルに関する情報を記録してもよい。このように専用のヘッダを追加すれば、任意に利用可能な「Etc」に他の用途が想定されている場合であってもジャンルに関する情報を確実に各フレーム画像に付加することが出来る。また、領域Etcのような自由に利用可能な領域を備えない規格を採用している動画であっても、ジャンルに関する情報を各フレーム画像に付加することが出来る。さらに、動画の規格に依存することなく、ジャンルに関する情報を各フレーム画像に付加することができるというメリットもある。
【0046】
一方、出演者の人数が複数の場合は(S220a:No)、複数の出演者の中で付与されたジャンル数が最も少ない出演者を抽出する(S220e)。
例えば、図9に示すように、判断対象となっているTSパケットが、識別子Aを付与された出演者Aと識別子Bを付与された出演者Bを含むと出演者特定部30が判断し(S220a:No)、出演者Aにジャンル「ドラマ」が付与され、出演者Bにジャンル「ミュージック」とジャンル「ドラマ」が付与されている場合は、付与されているジャンル数の少ない出演者Aをジャンルの判断に利用する。より確実なシーン判断を行うためである。その結果、ジャンル「ドラマ」が、判断対象となっているTSパケットのジャンルとして設定・確定される(S220g,S220h)。確定したジャンルは、TSパケットに付加される(S220i)。
【0047】
ただし、複数の出演者には付与されたジャンル数が同じ出演者が存在する場合もある。そこで、上述のように付与されたジャンル数の最も少ない出演者が何れか1人である場合は(S220f:Yes)、ステップS220g〜S220iの処理を行うが、付与されたジャンル数の最も少ない出演者が複数人いる場合は(S220f:No)、図10に示すステップS220j〜S220oの処理を実行する。
【0048】
ステップS220jでは、出演者特定部30が抽出した全出演者について、それぞれ最も大きく重み付けされているジャンルを、各出演者のジャンルと擬制する。
例えば、図11に示す例では、判断対象となっているTSパケットが、識別子Aを付与された出演者Aと識別子Bを付与された出演者Bと識別子Cを付与された出演者Cとを含んでおり、出演者Aにはジャンル「ドラマ」が付与され、出演者Bにはジャンル「ミュージック」とジャンル「ドラマ」が付与され、出演者Cにはジャンル「ミュージック」が付与されている。すなわち、出演者Aと出演者Cに付与されているジャンル数は何れも1つであり、ジャンル数による優先順位がつけられない。そこで、ジャンル「ドラマ」を出演者Aのジャンルと擬制し、ジャンル「ミュージック」をジャンルと擬制し、ジャンル「ミュージック」をジャンルと擬制する(S220j)。このように擬制したとき、最も多いジャンルは「ミュージック」となり(S220k)、ジャンル「ミュージック」が、判断対象となっているTSパケットのジャンルとして設定・確定される(S220l:Yes,S220m)。確定したジャンルは、TSパケットに付加される(S220n)。
【0049】
ただし、ステップS220jで各出演者のジャンルと擬制したジャンルの中でも同数のジャンルが存在する場合がある。ステップS220jで各出演者のジャンルと擬制したジャンルの中から最も多いジャンルが特定できる場合は(S220l:Yes)、ステップS220m〜S220nの処理を行うが、ステップS220jで各出演者のジャンルと擬制したジャンルの中から最も多いジャンルが特定できない場合は(S220l:No)、判断対象となっているTSパケットには該当するジャンルが無いと判断する(S220o)
【0050】
以上のジャンル確定処理を行うことにより、各TSパケットに対してジャンルが付与される。このようにして付与されたジャンルを正式に付与して録画してもよいが、フレーム画像毎にジャンルを付与した場合、連続するフレーム画像に付与されるジャンルが頻繁に切り替わる可能性もあり、特定のジャンルを指定して後述の視聴を行ったときに画像がフレーム画像単位で飛び飛びに表示されてしまう可能性もあり、視聴しづらくなる。そこで、本実施形態では、以下のシーン判定処理を行って、ジャンルが連続的に付与される場合に限ってジャンルが付与されるようにしている。
【0051】
(5)シーン判定処理
図12は、シーン判定処理の流れを示すフローチャートである。シーン判定処理では、順次、各TSパケットについてジャンルを付与するか否かの判断を行う。ジャンルを付与する基準は、判断対象となるTSパケットのジャンルが、当該TSパケットを含んで規定時間以上連続するTSパケットと同じジャンルであるか否かとされ、規定時間以上連続するTSパケットに同じジャンルが付与されている場合に限って、上述したジャンル確定処理において付与したジャンルを付与した状態で記録媒体に記録する。なお、規定時間は、チャプターとして分類可能な最小録画時間等とすることができるが、むろん、当該最小録画時間以上であれば様々に設定することができる。
【0052】
より具体的には、シーン判定処理が開始されると、まず、判断対象となっているTSパケットに、上述したジャンル確定処理においてジャンルが付与されているか否かを判断する(S230a)。ジャンルが付与されている場合は(S230a)、次に、直前に判断したTSパケットのジャンルと、判断対象となっているTSパケットとで、同じジャンルが設定されているか否かを判断する(S230b)。同じジャンルが設定されている場合は(S230b:Yes)、ジャンル付与の判断に利用するカウンターのカウントをインクリメントし(S230c)、同じジャンルが設定されていない場合は(S230b:No)、当該カウンターのカウントをクリアする(S230g)。カウンターのカウントをクリアすると、判断対象となっているTSパケットは、チャプター分類を行われること無く録画部60へ出力され、記録媒体へ記録される(S230f)。
【0053】
カウンターのカウントをインクリメントすると、当該カウンターが規定時間以上のカウント値であるか否か判断する(S230d)。カウント値が規定時間以上になっている場合は(S230d:Yes)、判定対象となっているTSパケットと連続して同じジャンルを付加されている複数のTSパケットについてチャプター分類を行い(S230e)、これら複数のTSパケットをチャプター分割しつつ録画部60へ出力され、記録媒体へ記録される(S230f)。
【0054】
図13は、以上のようにして記録媒体に記録される記録イメージである。同図に示す例では、グレーで示したTSパケットはジャンルが付加され、白抜きで示したTSパケットはジャンルが付加されていない。また、上述した規定時間は、TSパケットの2コマ分としてある。
同図において、左から3コマ目のTSパケットは、前後のTSパケットにジャンルが付加されていないため、チャプター分類されない。また、左から7コマ目〜9コマ目は、3コマ連続して同一のジャンル「ミュージック」でが付加されているため、これらのTSパケットは「ミュージック」にチャプター分類される。同様に、左から13コマ目と14コマ目も2コマ連続して同一のジャンル「ミュージック」が付加されているため、これらのTSパケットも「ミュージック」にチャプター分類される。なお、本実施形態では、ここで言うチャプターが、ひとまとまりのシーンであることを示す情報を構成する。
【0055】
(6)視聴にかかる処理:
以上のようにしてジャンル確定とシーン判定が行われつつ記録媒体に記録された動画の再生について、図14を参照して説明する。
同図の(a)は、ある日の30分のニュース番組において割当てられたチャプターを示してある。同図に示すように。0〜10分はジャンル「ニュース」にチャプター分割されており、例えば、アナウンサーやキャスター等がニュースを読む通常のニュース放送であることがわかる。また、10〜15分はジャンル「野球」にチャプター分割されており、例えば、野球のハイライトシーン等のダイジェスト放送が行われている事が分かる。また、15〜20分はジャンル「サッカー」にチャプター分割されており、例えば、サッカーのハイライトシーン等のダイジェスト放送が行われている事が分かる。また、20〜25分はジャンル「相撲」にチャプター分割されており、例えば、相撲のハイライトシーン等のダイジェスト放送が行われている事が分かる。また、25〜30分はジャンル「天気」にチャプター分割されており、例えば、天気キャスターが行う天気予報の放送が行われていた事が分かる。
【0056】
以上のように、1つのニュース番組の中でも各種の報道がなされており、電子番組情報(EPG)や新聞などのテレビ欄では単一のニュース番組とされていても、実際の画像は各種のシーンが含まれている。
このようなニュース番組について従来の技術でシーン判別すると、例えばEPGを利用して判別した場合は、ニュース番組の全てがニュースに判別されるし、仮に出演者の名前からジャンル判別したとしても、出演者がキャスターでも歌手でもある場合はシーンが歌番組であるにも関わらずニュースと判別されるなどの誤判定が発生する可能性がある。
本実施形態では、上述したシーン情報付加処理ではフレーム画像毎にジャンル判別してフレーム画像毎にジャンルを付加しているため、実際の映像に基づくチャプター分類が適切に行われる。
【0057】
また、同図の(b)は、ある日の30分の音楽番組において割当てられたチャプターを示している。同図に示すように。0〜5分や20〜25分はジャンル「ポップ」にチャプター分割されており、例えば、ポップシンガーが出演している事ことが分かる。また、5〜10分や15〜20分は「ロック」にチャプター分割されており、例えば、ロックシンガーが出演している事が分かる。また、10〜15分はジャンル「演歌」にチャプター分割されており、例えば、演歌歌手が出演している事が分かる。また、25〜30分はジャンル「バラード」にチャプター分割されており、例えば、バラードシンガーが出演している事が分かる。
【0058】
以上のように、1つの音楽番組の中でも各種ジャンルの歌手が登場しており、電子番組情報(EPG)や新聞などのテレビ欄では単一の音楽番組とされていて登場する歌手名等は記載されていても、実際にどのタイミングで各歌手が登場するかが不明である。
このような音楽番組について従来の技術でシーン判別すると、例えばEPGを利用して判別した場合は、音楽番組の全てがミュージックに判別されるし、仮に出演者の名前からジャンル判別したとしても、出演者がキャスターでも歌手でもある場合はシーンが歌番組であるにも関わらずニュースと判別されるなどの誤判定が発生する可能性がある。
本実施形態では、上述したシーン情報付加処理ではフレーム画像毎にジャンル判別してフレーム画像毎にジャンルを付加しているため、実際の映像に基づくチャプター分類が適切に行われる。
【0059】
ユーザーは、以上のようにしてチャプター分割された番組について、視聴したいジャンルを指定することにより、所望のジャンルが実際に映像に含まれている箇所のみを視聴することが出来る。例えば、図14(d)に示すように、ユーザーが野球を指定すると、ニュース番組の中から野球に関する映像が含まれている箇所のみをダイジェスト視聴(ザッピング)することができるし、複数の番組にまたがって野球に関する映像が含まれている箇所のみをダイジェスト視聴(ザッピング)することもできる。むろん、図14(c)に示すように、番組の全てを指定して、番組全体を視聴することもできる。
【0060】
(7)まとめ:
以上説明した実施形態においては、デジタルテレビ放送を受信して記録媒体に記録する録画装置100において、デジタルテレビ放送に含まれる動画を構成するフレーム画像から、出演者分類DB70に登録された出演者の顔画像を抽出し、出演者分類DB70に登録された出演者に対応付けられているジャンルを、顔画像の抽出を行ったフレーム画像に付加している。よって、シーン情報を利用して容易に所望のシーンを抽出可能となり、録画された動画からユーザー所望のシーンを簡易且つ迅速に抽出して表示することが可能となる。
【0061】
なお、本発明は前記実施例に限られるものでないことは言うまでもない。当業者であれば言うまでもないことであるが、
・前記実施例の中で開示した相互に置換可能な部材および構成等を適宜その組み合わせを変更して適用すること
・前記実施例の中で開示されていないが、公知技術であって前記実施例の中で開示した部材および構成等と相互に置換可能な部材および構成等を適宜置換し、またその組み合わせを変更して適用すること
・前記実施例の中で開示されていないが、公知技術等に基づいて当業者が前記実施例の中で開示した部材および構成等の代用として想定し得る部材および構成等と適宜置換し、またその組み合わせを変更して適用すること
は本発明の一実施例として開示されるものである。
【符号の説明】
【0062】
100…録画装置、10…放送受信部、20…受信バッファ部、30…出演者特定部、40…放送シーン特定部、50…シーン情報付加部、60…録画部、70…出演者分類DB、80…出演者登録部

【特許請求の範囲】
【請求項1】
動画を記録媒体に記録する録画装置において、
動画を構成するフレーム画像毎にシーン情報を付加するシーン情報付加部を備えることを特徴とする録画装置。
【請求項2】
特徴画像とシーン情報との対応関係を規定したデータベースを更に備え、
前記シーン情報付加部は、前記データベースを参照し、前記動画のフレーム画像から画像認識により抽出された特徴画像に対応するシーン情報を当該フレーム画像に付加する請求項1に記載の録画装置。
【請求項3】
前記データベースには、各特徴画像に対応付けられた各シーン情報について重みが設定されており、
前記シーン情報付加部は、動画を構成するフレーム画像から抽出された特徴画像が1つであって当該特徴画像に対応付けられたシーン情報が複数の場合に、前記重みが最も大きいシーン情報を当該フレーム画像に付加する請求項2に記載の録画装置。
【請求項4】
前記データベースには、各特徴画像に対応付けられた各シーン情報について重みが設定されており、
前記シーン情報付加部は、動画を構成するフレーム画像から複数の特徴画像が抽出された場合に、対応付けられたシーン情報が最も少ない特徴画像に対応付けられたシーン情報の中で重みが最も大きいシーン情報を当該フレーム画像に付加する請求項2または請求項3に記載の録画装置。
【請求項5】
前記データベースには、各特徴画像に対応付けられた各シーン情報について重みが設定されており、
前記シーン情報付加部は、動画を構成するフレーム画像から複数の特徴画像が抽出された場合であって対応付けられたシーン情報が最も少ない特徴画像が複数ある場合に、各特徴画像に対応付けられたシーン情報の中で最も重みの大きいものを特徴画像毎にそれぞれ選出した複数のシーン情報の中で最も多いシーン情報を当該フレーム画像に付加する請求項2〜請求項4の何れか1項に記載の録画装置。
【請求項6】
動画から抽出された特徴画像について、所定の操作部を介して入力されたシーン情報を対応付けて前記データベースに登録するデータベース作成部を更に備える請求項2〜請求項5の何れか1項に記載の録画装置。
【請求項7】
前記シーン情報付加部は、所定時間以上連続して同じシーン情報が付加された複数のフレーム画像に対し、ひとまとまりのシーンであることを示す情報を付与する請求項1〜請求項6の何れか1項に記載の録画装置。
【請求項8】
前記シーン情報付加部は、前記動画において同じシーンが所定時間以上継続する場合は、当該継続するシーンを構成する各フレーム画像をひとまとまりのシーンとして分類する請求項1〜請求項7の何れか1項に記載の録画装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図14】
image rotate

【図13】
image rotate


【公開番号】特開2012−134831(P2012−134831A)
【公開日】平成24年7月12日(2012.7.12)
【国際特許分類】
【出願番号】特願2010−286161(P2010−286161)
【出願日】平成22年12月22日(2010.12.22)
【出願人】(000201113)船井電機株式会社 (7,855)
【Fターム(参考)】