FMUSER Wirlessはビデオとオーディオをより簡単に送信します!

[メール保護] WhatsApp + 8618078869184
言語設定

    オーディオの基本的な知識とコーディングの原則

     

     1.基本的な考え方

     

    1) ビット レート: エンコードされた (圧縮された) オーディオ データを表現する必要がある XNUMX 秒あたりのビット数を示し、単位は通常 kbps です。

     

    2) ラウドネスとインテンシティ: 音の主観的な属性。 ラウドネスは、音がどの程度大きく聞こえるかを示します。 ラウドネスは主に音の強さによって変化しますが、周波数にも影響を受けます。 一般的に、純粋な低周波や高周波の音よりも、純粋な中周波音の方が優れています。

     

    3) サンプリングとサンプリング レート: サンプリングとは、連続時間信号を離散デジタル信号に変換することです。 サンプリング レートは、XNUMX 秒間に収集されるサンプルの数を示します。

     

    ナイキストサンプリングの法則:サンプリングレートが連続信号の最高周波数成分の2倍以上の場合、サンプリングされた信号を使用して、元の連続信号を完全に再構築できます。

     

    2. 一般的なオーディオ形式

     

    1) WAV 形式は、Microsoft によって開発されたサウンド ファイル形式で、ウェーブ サウンド ファイルとも呼ばれます。 これは、Windows プラットフォームとそのアプリケーションで広くサポートされている最も初期のデジタル オーディオ形式であり、圧縮率が低いです。

     

    2) MIDI は、Musical Instrument Digital Interface の略で、Musical Instrument Digital Interface とも呼ばれ、デジタル音楽/電子合成楽器の統一国際規格です。 これは、コンピューター音楽プログラム、デジタル シンセサイザー、およびその他の電子機器が音楽信号を交換する方法を定義し、異なるメーカーの電子楽器をコンピューターに接続するケーブルとハードウェアおよびデバイス間のデータ転送プロトコルを指定し、複数の音楽のサウンドをシミュレートできます。楽器。 MIDI ファイルは MIDI 形式のファイルであり、一部のコマンドは MIDI ファイルに格納されています。 これらの指示をサウンド カードに送信すると、サウンド カードは指示に従ってサウンドを合成します。

     

    3) MP3 の正式名称は MPEG-1 Audio Layer 3 で、1992 年に MPEG 仕様に統合されました。MP3 は、高音質で低サンプリング レートのデジタル オーディオ ファイルを圧縮できます。 最も一般的なアプリケーション。

     

    4) MP3Pro はスウェーデンの Coding Technology Company によって開発され、3 つの主要な技術が含まれています。サーキット協会による。 MP3Pro は、基本的にファイル サイズを変更することなく、元の MP3 音楽の音質を向上させることができます。 オーディオ ファイルを低ビット レートで圧縮しながら、圧縮前の音質を最大限に維持できます。

     

    5) MP3Pro はスウェーデンの Coding Technology Company によって開発され、3 つの主要な技術が含まれています。サーキット協会による。 MP3Pro は、基本的にファイル サイズを変更することなく、元の MP3 音楽の音質を向上させることができます。 オーディオ ファイルを低ビット レートで圧縮しながら、圧縮前の音質を最大限に維持できます。

     

    6) WMA (Windows Media Audio) は、インターネット オーディオおよびビデオの分野におけるマイクロソフトの傑作です。 WMA 形式は、データ トラフィックを減らしながら音質を維持することで、より高い圧縮率を実現します。 圧縮率は通常 1:18 に達します。 さらに、WMA は DRM (デジタル著作権管理) を通じて著作権を保護することもできます。

     

    7) RealAudio は、Real Networks によって開始されたファイル形式です。 最大の特徴は、オーディオ情報をリアルタイムで送信できることです。特にネットワーク速度が遅い場合でも、データをスムーズに送信できるため、RealAudio は主にネットワークでのオンライン再生に適しています。 現在の RealAudio のファイル形式には、主に RA (RealAudio)、RM (RealMedia、RealAudio G2)、RMX (RealAudio Secured) などがあります。これらのファイルの共通点は、ネットワーク帯域幅の違いで音質が変化することです。 ほとんどの人は滑らかな音が聞こえるという前提で、帯域幅の広いリスナーの方が音質が良くなります。

     

    8) Audible には、Audible1、2、3、4 の 1 つの異なる形式があります。Audible.com の Web サイトは、主にインターネット上でオーディオ ブックを販売し、2 つの Audible.com 専用オーディオ形式のいずれかを介して販売する商品とファイルを保護します。 . 各フォーマットは、主に使用されるオーディオ ソースとリスニング デバイスを考慮します。 フォーマット 3、4、3 は異なるレベルの音声圧縮を使用しますが、フォーマット XNUMX は MPXNUMX と同じ低いサンプリング レートと同じデコード方法を使用します。 結果として得られる音声はよりクリアになり、インターネットからより効率的にダウンロードできます。 Audible は独自のデスクトップ再生ツールである Audible Manager を使用しています。 このプレーヤーでは、PC に保存されている Audible 形式のファイルや、ポータブル プレーヤーに転送したファイルを再生できます。

     

    9) AAC は、実際には Advanced Audio Coding の略語です。 AAC は、フラウンホーファー IIS-A、ドルビー、AT&T が共同開発したオーディオ形式です。 これは MPEG-2 仕様の一部です。 AAC で使用されるアルゴリズムは、MP3 のアルゴリズムとは異なります。 AAC は、他の機能を組み合わせてコーディング効率を向上させます。 AAC のオーディオ アルゴリズムは、圧縮機能において、以前のいくつかの圧縮アルゴリズム (MP3 など) をはるかに超えています。 また、最大 48 のオーディオ トラック、15 の低周波オーディオ トラック、より多くのサンプル レートとビット レート、多言語互換性、およびより高いデコード効率もサポートします。 つまり、AAC は MP30 ファイルよりも 3% 小さいという前提で、より良い音質を提供できます。

     

    10) Ogg Vorbis は、MP3 などの既存の音楽フォーマットに似た新しいオーディオ圧縮フォーマットです。 ただし、3 つの違いは、完全に無料で、オープンで、特許の制限がないことです。 Vorbis はこのオーディオ圧縮メカニズムの名前であり、Ogg は完全にオープンなマルチメディア システムを設計しようとするプロジェクトの名前です。 VORBIS も非可逆圧縮ですが、より高度な音響モデルを使用して損失を減らします。 したがって、同じビット レートでエンコードされた OGG は、MPXNUMX よりも音質が良くなります。

     

    11) APE は可逆圧縮オーディオ形式であり、音質を落とさないことを前提に、従来の可逆形式の WAV ファイルの半分にサイズを圧縮します。

     

    12) FLAC は、Free Lossless Audio Codec の略語で、よく知られた一連の無料オーディオ無損失圧縮コードで、無損失圧縮を特徴としています。

     

    3. オーディオコーディングの基本原理

     

    音声コーディングは、入力音声の高品質を維持しながら、送信に必要なチャネル帯域幅を削減することに専念しています。

     

    音声コーディングの目標は、可能な限り低いビットレートで高品質のデータ伝送を実現するために、複雑度の低いエンコーダを設計することです。

     

    1) ミュート閾値曲線: 静かな環境でのみ人間の耳がさまざまな周波数の音を聞くことができる閾値。

    2) 臨界周波数帯

    人間の耳は周波数ごとに解像度が異なるため、MPEG1 / Audioは、22kHz以内の知覚可能な周波数範囲を、異なるコーディング層と異なるサンプリング周波数に従って23〜26の重要な周波数帯域に分割します。 次の図は、理想的な臨界周波数帯域の中心周波数と帯域幅を示しています。 図に見られるように、人間の耳は低周波数のより良い解像度を持っています

    3) 周波数領域でのマスキング効果: 次の図に示すように、振幅が大きい信号は、周波数が類似し、振幅が小さい信号をマスキングします。

     

    4) 時間領域でのマスキング効果: 短期間に10つの音が現れた場合、SPL(音圧レベル)の大きい音がSPLの小さい音をマスキングします。 時間領域のマスキング効果は、前方マスキング (事前マスキング) と後方マスキング (事後マスキング) に分けられます。 ポストマスキングの時間は、プレマスキングの約 XNUMX 倍と長くなります。

    時間領域マスキング効果は、プリエコーを排除するのに役立ちます。

     

    4. コーディングの基本的な手段

     

    1) 量子化器と量子化器

     

    量子化と量子化器:量子化は、離散時間の連続信号を離散時間の離散信号に変換します。 一般的な量子化器は、均一量子化器、対数量子化器、および不均一量子化器です。 量子化プロセスが追求する目標は、量子化エラーを最小限に抑え、量子化器の複雑さを最小限に抑えることです(XNUMXつ自体は矛盾しています)。

     

    (A)均一量子化器:最も単純で最悪のパフォーマンスで、電話の音声にのみ適しています。

     

    (B)対数量子化器:均一量子化器よりも複雑で実装が簡単で、その性能は均一量子化器よりも優れています。

     

    (C)不均一な量子化器:信号の分布に従って、量子化器を設計します。 詳細な定量化は信号が密な場合に実行され、大まかな定量化は信号が疎な場合に実行されます。

     

    2) 音声エンコーダ

     

    音声エンコーダには次のXNUMXつのタイプがあります。(a)波形エンコーダ。 (b)ボコーダー; (c)ハイブリッドエンコーダ。

     

    波形エンコーダは、バックグラウンドノイズシートを含むアナログ波形を作成することを目的としています。 すべての入力信号に作用して、高品質のサンプルを生成し、高いビットレートを消費します。 ボコーダーは元の波形を再生成しません。 このエンコーダのセットは、音声生成モデルを導出するために受信側に送信されるパラメータのセットを抽出します。 ボコーダーの音声品質は十分ではありません。 波形エンコーダーとサウンダーの利点を組み込んだハイブリッドエンコーダー。

     

    2.1波形エンコーダ

     

    波形エンコーダの設計は、多くの場合、信号に依存しません。 そのため、さまざまな信号のコーディングに適しており、音声に限定されません。

     

    1) 時間領域コーディング

     

    a)PCM:パルス符号変調は、最も単純なエンコード方式です。 これは信号の離散化と量子化のみであり、対数化がよく使用されます。

     

    b)DPCM:差分パルス符号変調。サンプル間の差のみをエンコードします。 前のXNUMXつ以上のサンプルは、現在のサンプル値を予測するために使用されます。 予測に使用するサンプルが多いほど、予測値はより正確になります。 真の値と予測値の差は残差と呼ばれ、エンコードの対象となります。

                       

     

    c)ADPCM:適応差分パルス符号変調、適応差分パルス符号。 つまり、DPCMに基づいて、信号の変化に応じて量子化器と予測子が適切に調整されるため、予測値が実際の信号に近くなり、残差が小さくなり、圧縮効率が高くなります。

     

    (2)周波数領域コーディング

     

    周波数領域コーディングは、信号を一連の異なる周波数要素に分解し、独立したコーディングを実行することです。

     

    a)サブバンドコーディング:サブバンドコーディングは、最も単純な周波数領域コーディング手法です。 これは、元の信号を時間領域から周波数領域に変換し、それをいくつかのサブバンドに分割して、それぞれにデジタルコーディングを実行する技術です。 バンドパスフィルター(BPF)グループを使用して、元の信号をいくつかの(たとえば、m)サブバンド(サブバンドと呼ばれる)に分割します。 各サブバンドを単側波帯振幅変調と同等の変調特性に通し、各サブバンドをほぼゼロ周波数に移動し、それぞれBPF(合計m)を通過させてから、各サブバンドを所定のレートで転送します(ナイキストレート)サブバンド出力信号がサンプリングされ、サンプリングされた値は通常デジタルコード化され、m個のデジタルエンコーダが設定されます。 各デジタルコード化信号をマルチプレクサに送信し、最後にサブバンドコード化データストリームを出力します。

     

    異なるサブバンドに対して、異なる量子化方法を使用することができ、人間の耳の知覚モデルに従って、異なる数のビットをサブバンドに割り当てることができる。

     

    b)変換コーディング:DCTコーディング。

     

    5. ボコーダー

     

    チャネルボコーダー:位相に対する人間の耳の鈍感さを利用します。

     

    準同型ボコーダー:合成信号を効果的に処理できます。

     

    フォルマントボコーダー:音声信号の情報のほとんどは、フォルマントの位置と帯域幅にあります。

     

    線形予測ボコーダー:最も一般的に使用されるボコーダー。

     

    6. ハイブリッドエンコーダ

     

    波形エンコーダーは、コード化された信号の波形を保持しようとし、中ビットレート(32 kbps)で高品質の音声を提供できますが、低ビットレートの場合には適用できません。 ボコーダーは、エンコードされた信号と聴覚的に類似した信号を生成しようとし、低ビットレートで明瞭な音声を提供できますが、結果の音声は不自然に聞こえます。 ハイブリッドエンコーダは、両方の利点を兼ね備えています。

     

    RELP:線形予測に基づいて、残余がエンコードされます。 メカニズムは次のとおりです。残差のごく一部のみを送信し、受信側ですべての残差を再構築します(ベースバンドの残差をコピーします)。

     

    MPC:残差の相関を除去し、中間状態の欠陥なしにボコーダーの音声の有声と無声への単純な分類を補正するために使用されるマルチパルスコーディング。

     

    CELP:コードブック励起線形予測。声道予測とピッチ予測子のカスケードを使用して、元の信号をより適切に近似します。

     

    MBE: マルチバンド励起。その目的は、多数の CELP 計算を回避し、ボコーダーよりも高い品質を取得することです。

     

     

     

     

    すべての質問の一覧を表示

    ニックネーム

    メール

    質問

    当社の他の製品:

    プロフェッショナルFMラジオ局機器パッケージ

     



     

    ホテルIPTVソリューション

     


      サプライズを取得するには、メールアドレスを入力してください

      fmuser.org

      es.fmuser.org
      it.fmuser.org
      fr.fmuser.org
      de.fmuser.org
      af.fmuser.org ->アフリカーンス語
      sq.fmuser.org ->アルバニア語
      ar.fmuser.org ->アラビア語
      hy.fmuser.org ->アルメニア語
      az.fmuser.org ->アゼルバイジャン
      eu.fmuser.org ->バスク
      be.fmuser.org ->ベラルーシ語
      bg.fmuser.org ->ブルガリア語
      ca.fmuser.org ->カタロニア語
      zh-CN.fmuser.org ->中国語(簡体字)
      zh-TW.fmuser.org ->中国語(繁体字)
      hr.fmuser.org ->クロアチア語
      cs.fmuser.org ->チェコ
      da.fmuser.org ->デンマーク語
      nl.fmuser.org ->オランダ語
      et.fmuser.org ->エストニア語
      tl.fmuser.org ->フィリピン人
      fi.fmuser.org ->フィンランド語
      fr.fmuser.org ->フランス語
      gl.fmuser.org ->ガリシア語
      ka.fmuser.org ->グルジア語
      de.fmuser.org ->ドイツ語
      el.fmuser.org ->ギリシャ語
      ht.fmuser.org ->ハイチクレオール
      iw.fmuser.org ->ヘブライ語
      hi.fmuser.org ->ヒンディー語
      hu.fmuser.org ->ハンガリー語
      is.fmuser.org ->アイスランド語
      id.fmuser.org ->インドネシア語
      ga.fmuser.org ->アイルランド
      it.fmuser.org ->イタリア語
      ja.fmuser.org ->日本語
      ko.fmuser.org ->韓国語
      lv.fmuser.org ->ラトビア語
      lt.fmuser.org ->リトアニア語
      mk.fmuser.org ->マケドニア語
      ms.fmuser.org ->マレー語
      mt.fmuser.org ->マルタ語
      no.fmuser.org ->ノルウェー語
      fa.fmuser.org ->ペルシア語
      pl.fmuser.org ->ポーランド語
      pt.fmuser.org ->ポルトガル語
      ro.fmuser.org ->ルーマニア語
      ru.fmuser.org ->ロシア語
      sr.fmuser.org ->セルビア語
      sk.fmuser.org ->スロバキア
      sl.fmuser.org ->スロベニア語
      es.fmuser.org ->スペイン語
      sw.fmuser.org ->スワヒリ語
      sv.fmuser.org ->スウェーデン語
      th.fmuser.org ->タイ
      tr.fmuser.org ->トルコ語
      uk.fmuser.org ->ウクライナ語
      ur.fmuser.org ->ウルドゥー語
      vi.fmuser.org ->ベトナム人
      cy.fmuser.org ->ウェールズ
      yi.fmuser.org ->イディッシュ語

       
  •  

    FMUSER Wirlessはビデオとオーディオをより簡単に送信します!

  • お問い合わせ

    住所:
    No.305ルームHuiLanビルNo.273HuanpuRoad広州中国510620

    Eメール:
    [メール保護]

    Tel / WhatApps:
    +8618078869184

  • カテゴリー

  • ニュースレター

    名またはフルネーム

    電子メール

  • PayPalのソリューション  ウエスタンユニオン中国銀行
    Eメール:[メール保護]   WhatsApp:+8618078869184 Skype:sky198710021 私とチャットしてくれ
    FC2ブログ著作権2006-2020 www.fmuser.org

    お問い合わせ(英語)