ページの先頭です
普段、携帯音楽プレーヤーやスマートフォンで音楽を楽しんでいる方は多いと思いますが、オーディオに興味を持たれている方となるとそれ程多くはないかも知れません。しかし、数年前から新聞や一般紙で「ハイレゾ」関連記事を目にしたり、家電量販店のオーディオ売り場に「ハイレゾコーナー」が設置されたりしているのを見かけて、「最近、なんだかハイレゾというのが流行っているみたいだな…」と思われた方は結構いらっしゃるのではないでしょうか?「ハイレゾ」とは"High Resolution Audio" の略で、CD(Compact Disc)やDAT(Digital Audio Tape)を上回る高音質音楽コンテンツと対応再生機器を指しているのですが、Resolutionが上がると一体何がどう変わるのでしょうか?
「デジタルオーディオで広く利用されているPCM(Pulse Code Modulation)方式で音楽波形をデジタル信号に変換する場合、アナログ信号を一定間隔(数十~数百kHz)でサンプリングして、その大きさを所定の分解能(量子化ビット数)のデジタルコードに置き換えて表現しますので、アナログ信号は図-1のような棒グラフを並べたような階段波形の情報に変換されると思っていただければ良いと思います。
左側の階段波形を基準に眺めてみると、時間軸方向と階段の大きさ方向の両方を細かくした右側の階段波形が元のアナログ信号に最も近いのはすぐに分かりますが、時間軸方向だけ細かくした上の階段波形と階段の大きさ方向だけ細かくした下の階段波形も、左側の基準の階段波形と比べると元のアナログ信号との差が少なくなっていることがお分かりいただけるかと思います。このように分割の細かさを増やすことで元のアナログ波形に近づいた状態を「分解能(Resolution)が上がった」と言います。
時間軸方向を細かくすることはサンプリング周波数を上げることに、階段の大きさを細かくすることは量子化ビット数を上げることに相当しますので、左側の基準の波形をCDやDATと仮定すると、サンプリング周波数か量子化ビット数のいずれかが基準であるCDやDATを上回っていれば分解能が上がりますのでハイレゾということになります。逆に、いずれかが基準であるCDやDATを下回っているものはハイレゾとは言わないということです。
一般的にはハイレゾ=96kHz/24ビットみたいなイメージがあって20kHz以上まで常時信号が存在しているように思われがちですが、音楽信号では20kHz以上の成分が出ている時間はそう多くありませんから、サンプリング周波数が上がった結果、可聴帯域の信号がより元の波形に忠実になっていることが重要なのです。20kHz以上の成分が本質的に記録されていない古いアナログ録音の音源をハイレゾ音源化してもCD音源との違いがはっきり聴き取れるのは、マスターテープのヒスノイズ(※1)も含めてアナログ信号により忠実にデジタル化しているからであり、20kHz以上の信号が記録できない44.1kHzや48kHzのサンプリング周波数であっても、20ビットや24ビットであれば立派なハイレゾ音源であることが、この説明でお分かりいただけたのではないかと思います。
表-1は現在ダウンロード販売されているハイレゾ音源の種類の一覧です。ここに「量子化ビット数を増やしてResolutionを上げる」という前述の説明とは相反するようなDSD(Direct Stream Digital)という方式が載っていますが、DSDとは一体どういうものなのでしょうか。
DSDは、1999年5月に発売されたSuper Audio CD(SA-CD)のオーディオフォーマットとして採用された、高速1ビット量子化ΔΣ変調信号(Delta Sigma Modulation)を直接記録・伝送・再生するシステムの名称で、アナログ信号を階段波形の情報に変換するPCM方式と異なり、音の大きさを非常に早い間隔(数M〜十数MHz)で遷移する1と0の粗密の情報に変換する方式です(図-2)。
インクジェットプリンターが、黒インクのドットの密度の変化だけでグレイスケールのきれいな写真が印刷できるのと同じような仕組みと思っていただければ良いと思います。PCM のようにサンプリング周波数や量子化ビット数を変えることなく、ΔΣ変調の設計次第でダイナミックレンジの周波数特性を変えることが可能な自由度が高い方式で、原理的にアナログLow Pass Filter(LPF)(※2)を通すだけでアナログ信号に復調できるという、デジタル信号でありながらまるでアナログ信号のような特徴を持っています。
図-3は、SA-CDに採用されたCDの64倍のサンプリングレートの2.8224MHzのDSDの特性例です。固定のフォーマットでありながら、ΔΣ変調の設計次第で20kHz以下のダイナミックレンジを重視した特性(実線)や、聴覚感度を考慮して可聴帯域のダイナミックレンジを重視した特性(破線)にすることができるという自由度の高さを示しています。また、図-3の赤線を参照していただくと、どちらも可聴帯域内で24ビットを超える分解能を持っていることがお分かりいただけるかと思いますが、このように量子化ビット数に分解能が制限されない点もアナログ信号と似通っていて、オーディオ用途として大変重要なポイントだと思います。
さて、ここでダウンロード型音楽配信の歴史について振り返ってみたいと思います。次世代オーディオメディアとしてSA-CD が1999年5月に発売され、パッケージメディアの「ハイレゾ」化が17年前に始まったわけですが、実は、同じ時期にダウンロード型の商用音楽配信も始まっています。1999年12月のメモリースティック・ウォークマン"NW-MS7"の発売に合わせて、ソニー・ミュージック・エンタテインメントが"bitmusic" (2007年7月に"mora"へ一本化)を設立し、同社が原盤権を持つアーティストの楽曲の配信を開始しています。まだダイヤルアップ接続が一般的だった当時の一般家庭からのインターネットアクセス速度と音質とのバランスに配慮して、ソニー独自の著作権保護技術(Digital Rights Management:DRM)である"OpenMG" を付加した132kbpsの非可逆圧縮フォーマット"ATRAC3" ファイルの音源が販売されました。しかし、当時主流であったV.90アナログモデムの下り回線通信速度は最大56kbps(理論値)であり、良好な通信状態でも1曲のダウンロードに実演奏時間の3倍以上かかることから、時間従量制ダイヤルアップ接続の通信費も含めるとコスト的に見合うものとはとても言えず、携帯音楽プレーヤーの音源はCDからのリッピング(※3)データが主流であり続けました。2003年になると、米Appleが音楽配信サイト"iTunes Music Store"を立ち上げ、独自のDRMである"Fairplay"を付加した128kbpsの非可逆圧縮フォーマット"AAC"ファイルを1曲99セントで販売開始しました。
この頃になると先進国を中心に一般家庭へのxDSL接続が普及し始め、下り回線実効通信速度1Mbps程度のブロードバンド常時接続が可能となったことから、ダウンロード時間と通信費の問題も解決され、音楽市場に徐々に定着していくこととなりました。その後、xDSLの技術革新やCable Modem・FTTHの普及によって下り回線実効通信速度は数Mbps~数十Mbpsにまで改善されて「ハイレゾ」配信への道も開けてきたのですが、「ハイレゾ」配信を阻む要素がもう1つ残っていました。実は、それがDRMだったのですが、このことは一般にはあまり認識されていないかもしれません。
ブロードバンド接続の普及と通信速度の向上により、CDクオリティーの44.1kHz/16ビットの非圧縮ファイルであっても実演奏時間より短い時間でダウンロードできるようになったことから、早くも2005年8月にe-onkyo music(※4)が96kHz/24 ビットファイルのダウンロード販売を始めました。ただしこのときは、WMA losslessエンコードによるDRM付きであったため、ダウンロードしたWindows PCから持ち出すことすらできず、オーディオマニアのマーケットにさえ全く受け入れられませんでした。しかし、2006年に英LINN Records(※5)が自社音源のDRMフリー「ハイレゾ」配信を開始したことからマニア層に浸透し始め、2008年には米HDTracks(※6)が高音質レーベルの音源を集めてDRMフリーの「ハイレゾ」配信に参入したことで、機器に縛られずにコンテンツを楽しむことができるようになり、ちょうどCD再生から(リッピングしたCDの)ファイル再生に移行し始めていた米国のオーディオマニアを中心に、ハイレゾファイル再生に取り組む層が増え始めました。
これに呼応して高音質ファイル再生PCアプリケーションやオーディオマニア向けのUSB-DACが次々に市場導入されるようになり、日本でも2010年7月からe-onkyo musicがDRMフリーの「ハイレゾ」配信を開始しました。e-onkyo musicも当初はCDクオリティー(16bit)のファイルを配信していたのですが、ダウンロード数はハイレゾが圧倒的という状況からハイレゾ配信に注力するようになり、2013年5月にはCDクオリティーの配信を終了し、以降、ハイレゾ配信に特化したサイトとして音源の充実を図ってきています。
これらの「ハイレゾ」配信は、いずれもハイビット・ハイサンプリングで録音、又はマスタリングされたPCM音源を非圧縮WAV/AIFFファイルやロスレス圧縮FLACファイルに格納したもので、DSD音源が配信されることはなかったのですが、2010 年11月にKORG(※7)が自社製DSD対応レコーダーにバンドルしていた音楽再生・編集アプリケーション"AudioGate V2.1" (Windows/Mac)をフリーウェアとして公開したことで状況が一変しました。"AudioGate(※8)"を使用することで、DSD音源をPCMにダウンサンプリングして再生したり、DSDディスク(DSF形式のファイルを所定のディレクトリ構造に従ってDVD-Rに記録したもの)を作成してPlayStationⓇ3や一部のSA-CDプレーヤーで再生することが可能になったため、配信フォーマットとしての道が開けたのです。
2010年8月からOTOTOY(※9)が既に自社コンテンツのDSD フォーマットのファイル配信を開始していたのですが、2010年12月にはe-onkyo musicがDSDフォーマットの音楽配信に参入し、2011年以降、ハードメーカ各社からDSD対応USB-DAC発売が相次ぐきっかけとなりました。その後、欧米でもDSDファイルのダウンロード販売を行うサイトが増え、2014年には欧州にDSDに特化したnative DSD music(※10)が登場してオーディオマニアを驚かせ、2015年にはハイレゾ配信最大手のHDTracksがDSDファイルの取り扱いを開始するなど、ここ数年の間にDSD方式への注目が世界的に高まってきています。
図-4は、民生用デジタルオーディオの展開を簡単にまとめたものです。1982年のCD発売から1999年のSA-CD発売まで17年の期間を要したのと比べて、1999年のATRAC3配信から2010年のDSD配信までは11年しか要していません。また、音楽信号のビットレートの変化がCDからSA-CDへは4倍だったのに対し、ATRAC3からDSDは実に43倍に達しており、「ハイレゾ」音楽配信の立ち上がりスピードの速さには目をみはるものがあります。2013年にはSA-CDの倍の5.6448MHzサンプリングのDSD音楽ファイルと358.2kHz/24bitの(DXDとも呼ばれる)WAVファイルの市販が始まり、これまで単にDSDと表記されていたSA-CDと同じサンプリングレートのDSDファイルは「DSD2.8M 又は DSD64」、5.6448MHzのDSDファイルは「DSD5.6M 又は DSD128」と表記されるようになりました。更に2015年には、ほぼ100kHz近くまで広大なダイナミックレンジが得られる11.2896MHzサンプリングのDSD音楽ファイル(DSD11.2M 又は DSD256)の配信まで登場しました。SA-CD というメディアから自由になったDSDは、ブロードバンド接続の恩恵を最も受けたフォーマットと言えるでしょう。
ここまでくると、次はストリーミング型の音楽配信のハイレゾ化がすぐにも視野に入ってくるように思いますが、ネット環境の良好な自宅で音楽ファイルをダウンロードして自宅や外出先に持ち出して楽しむダウンロード型配信と異なり、ストリーミング型音楽配信のほとんどが携帯端末ユーザをメインターゲットとしているため、ほとんどが128kbps〜320kbpsの非可逆圧縮音声にとどまっているのが現状です。
ストリーミング型音楽配信の主なサービスとしては、まず2000年代初頭に広告収入を主な収入源とする基本無料のパーソナライズド・インターネットラジオという形式で米Pandora(※11)や英Last.fm(※12)がサービスを開始し、本格的なストリーミング配信としては2006年にスウェーデンで創業し2008年10月にサービスを開始したSpotify(※13)が最初のものと言われています。日本では、残念ながらSpotifyはまだサービスを開始していませんが、2015年にApple Music(※14)・AWA(※15)・LINE MUSIC(※16)が相次いでサービスを開始し、音楽配信のストリーミングへの移行を実感されている方も多いのではないでしょうか。
これらは現在も128kbps〜320kbpsの非可逆圧縮音声にとどまっていますが、2014年になるとスウェーデン/ノルウェーのAspiro社が運営するTidal(※17)と仏Deezer(※18)が、いずれも最上位のサービスとしてFLAC形式のロスレス圧縮を利用したCDクオリティーの有料ストリーミング配信を始めています。FLAC形式の圧縮率は楽曲によって変動しますが、平均で70%と言われていますので、約1.4MbpsのCDのビットレートが1Mbps前後でストリーミングされていることになります。この値はFTTHの実効回線速度からすると随分と余裕がありますから、本来はもっと高いビットレートの音源、すなわちハイレゾ音源のストリーミングも可能なはずですが、大量の楽曲を揃えて幅広いユーザに配信するビジネスモデルでは配信側のサーバや回線の負荷を考えると安易に手は出しにくい領域であり、これらのインフラを外部に頼る状況では実現が難しいのが実情だと思います。
このような市場状況において、IIJではハイレゾ・ストリーミング配信実現の可能性を実証するため、IIJ・KORG・SONY・サイデラマスタリングの4社協同プロジェクトを立ち上げました。そして、2015年4月5日の「東京・春・音楽祭」のマラソンコンサートを上野の東京文化会館から、同年4月11日のベルリンフィルハーモニー管弦楽団の演奏会をベルリンのフィルハーモニー大ホールから、DSD方式によるハイレゾ・ライブストリーミングを公開実験の形で敢行しました。DSD Live Streamingは図-5に示したように、MPEG-DASHの仕組みを利用してDSD信号を分割してmp4コンテナに格納して順次アップロードし、クライアントにmpdファイルと一緒にHTTPサーバから配信することでストリーミング配信を実現しています。
実証実験ではアップロード側に2台の「MR-8080U」と「LimeLight」を用意してDSD5.6MとDSD2.8Mを同時送信し、事前に無料配布したクライアントソフトウェア「PrimeSeat(※19)」を用いてKORGとSONYのDSD対応USB-DACをお持ちのユーザに試聴していただきました。Last one mileの回線状況により安定試聴できなかった一部ユーザを除き、日・米・欧・アジアの各国でDSD Live Streamingを楽しんでいただきました。これは自前のバックボーンを持ちCDN(Contents Delivery Network)を最適化できるIIJのインフラがあって初めて実現できたと言えます。
2015年10月22日、23日にはポーランドのワルシャワから第17回ショパン国際ピアノコンクールの受賞者コンサートを、同年10月30日にはオランダのアムステルダムからロイヤル・コンセルトヘボウ管弦楽団の演奏会を、それぞれの演奏会場の回線を利用してDSD Live Streamingを実施し、更にこのタイミングでKORGとSONY以外のDSD対応USB-DACの接続対応やリアルタイムPCM変換機能によるPC単体での試聴を可能にしたPrimeSeat v1.2をリリースして、ハイレゾストリーミング配信・再生のハードルが決して高いものではないことを実証しました。
ハイレゾ音源の中でも最も難度が高いDSD方式によるハイレゾストリーミングが安定して行えることを実証した意義は大きく、昨年4月以降、こんなに早くハイレゾをストリーミングで聴けるようになるとは思いもしなかったという驚きと期待に満ちたコメントを各所からいただいています。昨年12月23日には、ライブ配信とオンデマンド配信に加えて世界初のDSDインターネットラジオ「PrimeSeat」を提供開始しました。ストリーミングサービスの充実を図り、ビジネス化に向けて更に一歩前進したところです。今後の「PrimeSeat」の展開にご期待ください。
執筆者プロフィール
西尾 文孝 (にしお あやたか)
IIJ プロダクト本部 アプリケーション開発部 運用技術課 シニアエンジニア。
前職では主に業務用音響機器・オーディオ技術開発に従事し、2015年10月より現職。
25年を超える音楽制作現場での経験とSA-CD/DSD/ハイレゾの開発経験を活かして、ハイレゾ・ストリーミング配信の実現に邁進中。
ページの終わりです