説明

国際特許分類[G10L19/00]の内容

物理学 (1,541,580) | 楽器;音響 (32,226) | 音声の分析または合成;音声認識;音響分析または処理 (17,022) | 冗長を減らすための音声または音響信号の分析合成技術,例.ボコーダーにおける;音声または音響信号のコード化またはデコード化,例.圧縮,拡張,ソースフィルターモデルまたは心理音響分析のためのもの (3,650)

国際特許分類[G10L19/00]の下位に属する分類

国際特許分類[G10L19/00]に分類される特許

61 - 70 / 2,383


【課題】 MPEG標準化に符合しつつ、多チャンネルBSACの性能を向上させる。
【解決手段】 オーディオデータを復号化する段階と、オーディオデータのペイロードの終結を示す識別コードを検出する段階と、拡張データのペイロードの開始を示す識別コードを検出する段階と、拡張データのタイプを検出する段階と、検出されたタイプが、オーディオデータのチャンネルをマルチチャンネルに拡張する拡張データを示しているか否かを判断する段階と、判断段階で示していると判断されれば、オーディオデータのチャンネルをマルチチャンネルに拡張する拡張データを復号化する段階と、を含み、拡張データは、少なくともオーディオチャンネルの構成を表し、チャンネルをスピーカにマッピングするときのチャンネルの数を規定するチャンネル構成インデックスで表現される拡張チャンネルのタイプ情報を含む。 (もっと読む)


【課題】スピーカの種類に応じて音響特性をより適切に補正する。
【解決手段】会議端末のスピーカ装置は、放音を行うための音信号を受け取ると(S3;YES)、所定のタイミングにおいて、この音信号に対し、属性情報を重畳して(S5)、放音する(S6)。会議端末はマイクロホンによって放音された音を収音し(S7)、この音を表す音信号から属性情報を抽出する(S8)。会議端末は、各々の属性情報と補正量とが対応付けられた音響特性補正テーブルにおいて、抽出した属性情報に対応付けられている補正量を特定する(S10)。そして、会議端末は、スピーカ装置に供給する音データを、特定した補正量で補正してから音信号をスピーカ装置に供給する(S11)。スピーカ装置は補正後の音信号に応じた音を放音する(S12)。 (もっと読む)


【課題】最小の帯域幅を用いて、複数のソース信号を送信する方法を提供する。
【解決手段】いくつかのオーディオソース信号を、ソース信号を復号化後に、波面合成、マルチチャネルサラウンドまたはステレオ信号を混合する目的で、送信または記憶する必要がある。ソース信号間に冗長性がない場合でさえ、ソース信号をジョイント符号化したときに、それら信号を別々に符号化する場合に比べ、顕著な符号化利得が得られる。これは、ソース信号の統計的特性、ミキシング技術の特性および空間聴覚を考慮することにより可能になる。ソース信号の和は、最終的に混合されたオーディオチャネルの知覚的に重要な空間キューを概ね決定するソース信号の統計的特性とともに送信される。ソース信号は、その統計的特性が元のソース信号の対応する特性に近似するよう受信機で回復される。 (もっと読む)


【課題】本発明は従来技術の上記した問題を実質的に軽減ないし克服することを目的とする。
【解決手段】BTSCエンコーダ(200)は、デジタル左チャンネル音声信号(L)を受信しデジタル左フィルタ処理された信号を発生するための左デジタルハイパスフィルタ(212)、デジタル右チャンネル音声信号(R)を受信しデジタル右フィルタ処理された信号を発生するための右デジタルハイパスフィルタ(214)、デジタル左および右フィルタ処理された信号を加算しまたデジタル和信号(L+R)を発生するための加算器(216)、およびデジタル左および右フィルタ処理された信号の一方からデジタル左および右フィルタ処理された信号の他方を減じデジタル差信号(L−R)を発生するための減算器(218)を含むマトリックス、デジタル差信号(L−R)をデジタル的に処理するための差チャンネルプロセッサ(230)、およびデジタル和信号(L+R)をデジタル的に処理するための和チャンネルプロセッサ(220)を含んでいる。 (もっと読む)


【課題】通信網を介して加入者端末機に送信されるオーディオ信号の出力改善のためのオーディオ信号の処理方法およびこの方法を採用したオーディオ信号処理装置を提供する。
【解決手段】本発明は、通信網を介して加入者端末機に送信されるオーディオ信号を処理してオーディオ信号を符号化するコーデックモジュールでオーディオ信号を音声信号として判断できるようにすることで、加入者端末機に送信されるオーディオ信号の音質低下を防ぐオーディオ信号の処理方法およびこの方法を採用したオーディオ信号処理装置に関する。本発明によれば、通信網を介して送信されるオーディオ信号を音声コーデックを用いて前処理することで、通信網を介して該当するオーディオ信号が送信されるときに、コーデックモジュールで該当するオーディオ信号を音声として判断する確率を高めることができる。 (もっと読む)


【課題】同一地域内にいる複数のユーザが音声によりコミュニケーションできるようにする。
【解決手段】車両13などの移動体に備えられる通信端末12から、通信端末12の固有IDや車両13の現在位置などの情報がセンタサーバ11へ送信される。センタサーバ11は、これらの情報に基づいて、通信端末12に対してサービスを提供する音声コミュニティを決定する。センタサーバ11は、音声コミュニティに参加している通信端末12から圧縮音声データを受信し、それらをデータベースに記憶し、音声コミュニティに参加している通信端末12へその情報を配信する。 (もっと読む)


【課題】収録音源を自動解析して正確にクリップノイズ発生時刻を検出することができるクリップノイズ検出装置を提供する。
【解決手段】信号を入力とし、当該入力信号をN個(Nは2以上の整数)のフィルタからなるフィルタバンクを通過させて、N個のサブバンド信号を出力するフィルタバンク処理部と、N個のサブバンド信号を入力とし、当該N個のサブバンド信号に直交検波を行って、N個の複素解析信号を出力する直交検波部と、N個の複素解析信号を入力とし、N個の複素解析信号から選択した任意の2個の複素解析信号の相関関係を求め、当該求められた相関関係から時刻ごとにクリップ強度値を計算し、当該計算されたクリップ強度値を出力するクリップ強度計算部と、クリップ強度値を入力とし、当該クリップ強度値が予め定めた閾値を超過する場合に、当該超過が発生した時刻をクリップノイズ発生時刻として出力する判定部とを備える。 (もっと読む)


【課題】本発明は、内蔵又は標準FEC処理を持たないスピーチコーダにおいてパケットロス又はフレーム消去の隠蔽(FEC)を実行する方法及び装置に関する。
【解決手段】復号器を備えた受信器が、符号器によって送信された、圧縮されたスピーチ情報の符号化されたフレームを受信する。受信器の遺失フレーム検出器が、符号化されたフレームが、送信中に失われた又は破損されたかどうか又は消去されたかどうかを判断する。符号化されたフレームが消去されていなければ、符号化されたフレームは復号器によって復号され、一時メモリが復号器の出力によって更新される。所定の遅延期間が追加された後、音声フレームが出力される。遺失フレーム検出器が、符号化されたフレームが消去されたと判断した場合、FECモジュールが、信号にフレーム隠蔽処理を施す。FEC処理は、消去されたフレームに対して、自然に聞こえる合成スピーチを生成する。 (もっと読む)


【課題】情報をより適切にADPCM圧縮する量子化パラメータテーブルをより高速に選択すること。
【解決手段】複数のADPCM値より多い複数の統計用ADPCM値を用いて情報を統計用符号化情報にADPCM符号化するステップS12と、その統計用符号化情報にその複数の統計用ADPCM値がそれぞれ出現する複数の出現回数を算出するステップS13と、その複数の出現回数に基づいて複数の量子化パラメータテーブルから選択された最適量子化パラメータテーブルを用いてその情報をADPCM符号化するステップS16とを備えている。このような符号化方法は、その複数の量子化パラメータテーブルを用いてその情報をADPCM符号化することにより最適量子化パラメータテーブルを選択する他の技術に比較して、最適量子化パラメータテーブルをより高速に選択することができ、その情報をより高速にADPCM符号化することができる。 (もっと読む)


【課題】録音中に代表的な静止画像を自動的に撮影及び記録する。
【解決手段】スクリーン上の映像が撮影領域内に収まるように、撮像部を備えた録音装置を録音現場に設置し、音声信号の記録を開始する。周期的に撮像部に撮影を行わせ、得られたテンポラリ画像を一時的に保存する。撮像部の出力に基づき、撮影領域内において映像(スライドショー用の映像)が表示されているスライド領域を検出すると共に、スライドタイトルが表示されているタイトル領域を検出する。その後、タイトル領域内における文字の変化を監視し、文字の変化が認められた場合、変化の直前に得られたテンポラリ画像を対象静止画像として取得する。対象静止画像の画像信号は、文字の変化タイミングを基準とした区間の音声信号に関連付けられて記録媒体に記録される。 (もっと読む)


61 - 70 / 2,383