【2023/10/29追記】
良い機会だと思って、記事をリニューアルした。
今後は新しい記事を見てもらうことにして、この記事は「2015年当時に私が辿り着いたもの」として歴史になってもらう。
【2023/09/12追記】
色々と思うところがあり、ネットワークオーディオの三要素における「再生機能」の呼び方を【プレーヤー】から【レンダラー】に変更した。
この記事は記録の意味も含めて【プレーヤー】表記のままにしておくが、あくまで役割/機能の呼称としてプレーヤーという言葉を使っている部分は、【レンダラー】に読み替えてもらえると幸いだ。いずれ【サーバー】【レンダラー】【コントロール】バージョンの記事を新たに作成する予定である。
【追記ここまで】
「はじめに」でも述べたように、ネットワークオーディオは決して理解不能な代物ではない。
ネットワークオーディオが兎角「難しそう」というイメージを持たれている理由のひとつに、「全体像の欠如」という問題があるように思う。
構築しようとしているシステムの全体像をきちんと把握する前に、NASは何がいいとか、どのプレーヤーが音がいいとか、そういった各論に終始してしまうのはよろしくない。というより、このような傾向に陥りがちなのはオーディオファンの悪い癖だ。
NAS、ネットワークプレーヤー、スマホにタブレット……機器そのものにばかり意識を向けるのではなく、それらが果たす「機能」あるいは「役割」を理解することで、ネットワークオーディオ全体、ひいてはファイル再生全体に対する理解は大きく深まる。
そして、それらを理解すればこそ、実際の機器に求めるものも見えてくる。
そこで、ネットワークオーディオの全体像を掴んでもらうべく、
■サーバー
■プレーヤー
■コントロール
という三要素を提示する。
ネットワークオーディオを理解・説明するための、特定の仕組み・ソフト・機器・システム・プラットフォーム等に限定されない普遍的な方法。以上の三要素は、私自身でそれを考えて考えて、考え続けた結果辿り着いたものだ。
各要素の呼称が真に適当かどうかはさておいて、少なくともここ「Audio Renaissance」では、「サーバー」・「プレーヤー」・「コントロール」それぞれの定義は一貫させている。
ちなみにこのアイデアの出発点は、DLNAにおける「デバイスクラス」である。
目次
サーバー
サーバーとは、音源を読み込み、データベース化して音楽ライブラリとして機能させ(このように音源を管理・運用するための機能をAudio Renaissanceでは「ライブラリ機能」と呼称する)、プレーヤーに配信するもの。
あくまで機能であり、システムにおいて果たす役割。
配信という言葉はネットワークの存在が前提となるので、もっと単純に、プレーヤーから見た「音源の在り処」と考えてもいい。
音源ファイルの保存場所(ストレージ)は必ずしもサーバー機器本体とは限らない。サーバー機器それ自体にストレージが搭載されていなくても、音源の保存場所としてUSBドライブやNASを接続・指定して使うことができる。いずれにせよトータルで考えれば、「保存」もサーバーを構成する要素であることにかわりはない。
そしてサーバーの置き場所は、ローカルでも、クラウドでも構わない。TIDALといった音楽ストリーミングサービスは、「インターネット上の巨大なサーバーを利用する」というイメージで捉えることができる。
内的になんらかのサーバーソフトが動く機器(NASやPCや単体オーディオ機器)が、システムにおいてサーバーの役割を果たす。サーバーソフトはソフト単体で提供されているものから、機能としてオーディオ機器に組み込まれているものまで様々。サーバーソフトの機能を指して「メディアサーバー」と呼称する場合もある。
サーバーソフトが音源を読み込んでデータベース化し、ネットワーク上で共有することで、コントロールアプリからの音源の閲覧やプレーヤーへの配信が可能になる。コントロールアプリに表示される音源の情報は、基本的にサーバー側から提供されたものとなる。
なお、PCで使われる再生ソフトのライブラリ機能は、実質的にサーバーソフトと同じもの。つまり、JRiver Media CenterやAudirvana Plusといった「ライブラリ統合型の再生ソフト」は、ひとつのソフトが「サーバー」と「プレーヤー」の両方を担っていると捉えることができる。Roonも同様である。
ライブラリ統合型の再生ソフトや後述するミュージックサーバーなど、「サーバー」と「プレーヤー」の機能を両方備える製品は、内蔵/外部接続のDACを使って直接音源の再生が可能であり、必ずしもネットワークを介した「配信」を必要としない。そのため、サーバーの本質はライブラリ機能だといえる。
サーバーソフトは読み込んだ個々の音源ファイルについて、ファイル名にくわえてタグに基づいてデータベース化を行うことで、多面的かつ視覚的な音楽ライブラリとして機能させる。ユーザー自身による「音源管理とライブラリの構築」は、まさにサーバーソフトによって、単純なファイル名とフォルダ構造を越えた姿を得る。
データベース化に際してどのタグを参照し、どのように音源/ライブラリを提示するかは使用するサーバーソフトに依存する。この『音源のブラウズ/選曲の際の階層構造』のことを、私は「ナビゲーションツリー」と呼んでいる。他にも様々な呼称があるが、意味するものは同じ。
ナビゲーションツリーはサーバーの使い勝手に直結する。一例として、「指揮者」や「オーケストラ」といったタグを頑張って音源に付加したところで、ナビゲーションツリーに対応する項目が用意されていなければ、選曲の際にタグを活かすことはできない。
もちろん、サーバーソフトの側でタグに基づくデータベース化を行わず、指定した音源フォルダの構造そのままに提示することもできる。これは「フォルダビュー」や「フォルダツリー」と呼ばれ、サーバーソフトが提供するナビゲーションツリーの中に「フォルダ」的な名称で用意されていることが多い。
ちなみに「機器」の話をすると……
「ストレージ」というと、単純に「音源ファイルの保存場所」あるいは「記憶装置それ自体」を意味する。USBメモリでも、HDDでも、SSDでも、外付けでも内蔵でも、NASでも、これらはみな「ストレージ」である。
「NAS」は「Network Attached Storage」、つまり「ネットワーク接続のストレージ」を意味する。USB接続のストレージに比べて多機能かつ少々複雑。製品ジャンルの名称でもある。純粋な「ストレージ」として使うことが可能なほか、内的にサーバーソフトを動かすことで「サーバー」にもなり得る。NAS=サーバーではない。
機器の文脈で「サーバー」と言った時は、前述のとおり「なんらかのサーバーソフトが動き、ライブラリ機能を有する機器」を意味する。サーバーの役割を果たすのはPCでも、NASでも、オーディオ機器でも構わない。
「ミュージックサーバー」とは海外で広く使われている製品ジャンルの呼称であり、「サーバー」と「プレーヤー」の機能を両方備える製品、その中でも特にストレージを内蔵して一台で再生機器として完結する製品を指す。
よって、例えば日本が誇るDELA/fidata/Soundgenicの製品は、「ストレージ」でもあり、「NAS」でもあり、「サーバー」でもあり、「ミュージックサーバー」でもあり、純粋な「ネットワークトランスポート」として使うこともできる、なんとも多機能な製品ということになる。
プレーヤー
プレーヤーとは、サーバーから配信された音源/データを処理・再生するもの。プレーヤーの側から「音源の在り処」であるサーバーに読みに行く場合もある。
プレーヤーもまた「機能」あるいは「役割」と言える。よってオーディオ機器だけでなく、PCの再生ソフトもシステムの中でプレーヤーの役割を果たす。
プレーヤーの本質は(行為としての)再生とかスキップとか停止といったコントロールとは別の、音源の再生機能そのものである。DACの有無は関係なく、プレーヤーはあくまで「データ処理としての再生」を担う。
ここでいう「データ処理としての再生」とは、様々な音源ファイルのデコードと音声データの生成(レンダリング)を行い、DAC(あるいはDDC)に送り出すまでを指す。
一言で「ファイル音源の再生」と言っても、プレーヤーにおける再生(=データ処理)と、DACにおけるD/A変換は明確に分けて考える必要がある。
多くの単体ネットワークプレーヤーはコントロール機能(操作ボタンや物理リモコンにより、機器自体でも一通りの再生操作が可能)を持つが、ネットワークオーディオのシステムでは「コントロール」が独立するため(後述)、その有無は問題ではない。
ただし、音楽再生における満足のいくユーザビリティを実現するためには、優れたコントロールアプリの存在はもちろん、プレーヤーの側にも相応の機能が求められる。例えばUPnPを利用するシステムの場合、プレーヤーがDLNAとOpenHomeのどちらに対応するのかが重要になる。
繰り返すがプレーヤーの本質は「再生」であり、機器からの音声出力はアナログかデジタルかを問わない。DACの有無は関係ない。
ファイル再生/ネットワークオーディオの枠組みで捉える時、DACを搭載するネットワークプレーヤーも、DACを搭載しないネットワークトランスポートも、PCの中で動く再生ソフトも、等しくシステムの中で「プレーヤー」を担っている。
デジタル出力に特化した機器は、オーディオの伝統に則れば「トランスポート」と呼ばれるが、機能としては紛れもなく「プレーヤー」である。機能としての名称と、製品ジャンルとしての名称の違いに注意。
レンダラーやらストリーマーやらミュージックサーバーやらネットワークブリッジやら、様々な呼称/製品ジャンルが存在するが、「音源の再生機能」を持つ以上、これらはみな「プレーヤー」であり、別の角度から表現しているに過ぎない。少なくともこのサイトの中では、「プレーヤー」という呼称に統一している。
さらに「呼び方」の話をすると……
「音源の再生機能そのもの」である「プレーヤー」は、特にその機能/性格を強調して「レンダラー」と呼ばれる場合がある。例えばDLNAのデバイスクラスにもDMR(Digital Media Renderer)の名称がある。ただ、「レンダラー」という呼称は従来のオーディオシステムからすると馴染みがないため、前述のように、私はあくまでも「音源の再生を担うもの=プレーヤー」という呼び方をしている。
TIDALやらQobuzやらSpotifyやらに対応し、「音楽ストリーミングサービスの受け皿」となる類の機器は、特にその機能/性格を指して「ストリーマー」と呼ばれる場合がある。近年の音楽ストリーミングサービスの世界的興隆を受けて、この呼称はかなりメジャーになりつつある。なお、ネットワークによるデータ伝送それ自体も「ストリーム」であり、「ストリーマー」という呼称自体は単純にネットワークプレーヤーを指す意味で、かなり前から使われてはいた。
ネットワーク入力でデータを受けて、USB等の端子からデジタル出力する機器は、その「ネットワークとUSBの橋渡し」という性格を指して「ネットワークブリッジ」と呼ばれる場合がある。このような機器は非常に多機能な場合が多いが、基本的には「USB等のデジタル出力を搭載するネットワークトランスポート」と捉えられる。「ブリッジ」という呼称もまた従来のオーディオシステムからすると馴染みがないため、私が積極的に使うことはない。
※「ブリッジ」と呼ばれるものの中には、Roon Bridge/Roon ReadyデバイスやDirettaを用いたDiretta USB Bridgeなど、機器の側に再生機能を持たず(つまり「プレーヤー」ではない)、純粋にLAN DAC/DDCとして機能するものもあるので要注意。
もっともっともっともっと単純に言ってしまえば、つまるところプレーヤーとは、「リモコンを向けて再生(Play)ボタンを押す機器/ソフト」のことである。
コントロール
コントロールとは、サーバーが提供する音源/ライブラリの情報を参照し、曲を選び、プレイリストを作り、プレーヤーに対して再生・停止・スキップ・シークといった指示を出す、つまり実際に音楽を再生する際の操作、あるいは音楽再生という行為そのもの。また、そのためのインターフェース全般を指す。
システムと同一のネットワーク上にある端末、スマホやタブレットにコントロールアプリを入れることで、「コントロール」の機能を持たせることができる。すなわちネットワークオーディオにおける「コントローラー」とは「コントロールアプリ」のことであり、「コントロールアプリをインストールした端末」のことでもある。この時、「コントロール」は「プレーヤー」から機能的にも物理的にも独立した存在となる。
サーバーを広義の音源、プレーヤーを広義の再生機器と捉えれば、このネットワークを活用した独立端末からのコントロールこそ他の再生スタイルと決定的に異なる要素であり、ネットワークオーディオの本質だと言える。
コントロールアプリは音楽を再生するうえで実際にユーザーが手を触れる事実上唯一の部分であり、その完成度は最終的なユーザー・エクスペリエンスを決定づける。まさにこの点で、ネットワークオーディオにおけるコントロールアプリの重要性は極めて大きい。
「コントロール」の具体的なイメージは、カラオケで曲を選ぶアレそのもの。
他の二つのように「コントローラー」と呼ばず、あえて「コントロール」と呼ぶ理由は、単にコントロールアプリや端末だけでなく、「音楽を聴くという行為そのもの」であり、また「ネットワークオーディオの本質」であるため。
ネットワークオーディオの本質はあくまで「コントロール」であって、「コントローラー」と呼ぶとどうしても意味合いが狭まってしまう。……まぁ、この要素をコントローラーと呼んだところでそれほど問題はないし、わかりやすさを重視するならその方がいいのかもしれないが。
一応言っておくと、アプリにおいて「プレーヤー」と「コントロール」の混同がよく見られるので、その辺は要注意。
例えば、LINNのKinskyやKazooはコントロールアプリであって、プレーヤーアプリではない。コントロールアプリは再生を「指示」しているだけであって、実際に「再生」を担うのは「プレーヤー」である。わかったうえであえて言っているなら話は別なのだが。
図解
ネットワークオーディオについての普遍的な理解を目指して考え出したこの「サーバー・プレーヤー・コントロール」モデルは、DLNAやOpenHomeといったUPnPベースのシステムだけでなく、PCの再生ソフトを使う場合や、オールインワンのミュージックサーバー、そしてRoonにも、まったく問題なく適用できる。
「サーバー・プレーヤー・コントロール」の関係を端的な図に示すとこうなる。
ネットワークオーディオのシステムにおいて、実際に各要素を担う機器はネットワーク/LANで接続されている。
サーバーとプレーヤーは「接続と再生の安定性」という観点から、基本的に有線で接続する。サーバーとプレーヤーを無線で繋ぐこと自体は可能で、特にネットワークプレーヤーは設置の自由度の観点から、Wi-Fiに対応するも数多い。
コントロール端末はもちろん無線で繋ぐ。
以上を踏まえて、ネットワークオーディオの三要素に、無線LANルーターとの接続関係入れ込むとこうなる。
ミュージックサーバー、プレーヤーに直結できるLANポートを持つサーバー、あるいはPCを使うシステムの場合など、さらに詳しくは以下の記事を参照。
ネットワークオーディオとは『音楽再生におけるコントロールのスタイル』である。
ネットワークを介して再生機器からコントロールが独立し、それによって実現される快適な音楽再生こそ、ネットワークオーディオの本懐に他ならない。
大切なのは快適に音楽が聴けること。それを抜きにしてネットワークオーディオは語れない。