ページの先頭です
まずは、ブロードバンド利用者の1日の利用量をいくつかの切口から見ていきます。ここでの1日の利用量は各利用者の1週間分のデータの1日平均です。
図-2は、利用者の1日の平均利用量の分布(確率密度関数)を示します。アップロード(IN)とダウンロード(OUT)に分け、利用者のトラフィック量をX軸に、その出現確率をY軸に示していて、2013年と2014年を比較しています。X軸はログスケールで、10KB(104)から100GB(1011)の範囲を示しています。一部の利用者はグラフの範囲外にありますが、概ね100GB(1011)までの範囲に分布しています。
INとOUTの各分布は、片対数グラフ上で正規分布となる、対数正規分布に近い形をしています。これはリニアなグラフで見ると、左端近くにピークがあり右へなだらかに減少するいわゆるロングテールな分布です。OUTの分布はINの分布より右にずれていて、ダウンロード量がアップロード量より、ひと桁以上大きくなっています。2013年と2014年で比較すると、INとOUT共に分布の山が右に少し移動していて、利用者全体のトラフィック量が増えていることが分かります。昨年の2012年と2013年の比較より移動量が増えていて、トラフィック量の増加率が大きくなっています。
OUTの分布を見ると、分布のピークはここ数年間で着実に右に移動していますが、右端のヘビーユーザの使用量はあまり増えていないので、分布の対称性が崩れてきています。一方で、INの分布は右側の裾が広がっています。以前は、ここによりはっきりした山がINとOUT両方にあり、IN/OUT量が対称なヘビーユーザを示していました。そこで便宜上、大多数のIN/OUT非対称な分布を「クライアント型利用者」、右側の小数のIN/OUT対称なヘビーユーザの分布を「ピア型利用者」と呼んできました。今回もその慣習に従います。ここ数年で、ピア型利用者の山は小さくなりほとんど識別できなくなりました。これは、ヘビーユーザの割合が減少していることを示しています。グラフ左側に少しヒゲが出ていますが、これはサンプリングレートの影響によるノイズで、1パケットのみ観測された場合の最小パケットサイズ及び最大パケットサイズに相当しています。
表-1は、平均値と、分布の山の頂点にある最頻出値の推移を示します。分布の最頻出値を2013年と2014年で比較する と、INでは18MBから28MBに、OUTでは355MBから447MBに増えていて、各利用者のトラフィック量が、特にダウンロード側で増えていることが分かります。一方、平均値はグラフ右側のヘビーユーザの使用量に引っ張られるので、2014年には、INの平均は437MB、OUTの平均は1,287MBと、最頻出値よりかなり大きな値になります。2013年には、それぞれ397MBと1,038MBでした。2010年以降減少していたINが増加に転じて、P2Pファイル共有からWebサービスへの移行が一段落したように思われます。
図-3は、利用者ごとのIN/OUT使用量から5,000人をランダムに抽出してプロットしています。X軸はOUT(ダウンロード量)、Y軸はIN(アップロード量)で、共にログスケールです。利用者のIN/OUTが同量であれば対角線上にプロットされます。
対角線の下側に対角線に沿って広がるクラスタは、ダウンロード量がひと桁多いクライアント型の一般ユーザです。以前は、右上の対角線上あたりを中心に薄く広がるピア型のヘビーユーザのクラスタがはっきり分かりましたが、今では識別ができなくなっています。便宜上、クライアント型とピア型に分けましたが、実際には、クライアント型の一般ユーザでもSkypeなどのピア型のアプリケーションを利用し、また一方のピア型のヘビーユーザもWebなどのダウンロード型のアプリケーションを利用しているので、その境界はあいまいです。つまり、多くの利用者は両タイプのアプリケーションを異なる割合で使用しています。また、各利用者の使用量やIN/OUT比率にも大きなバラツキがあり、多様な利用形態が存在することが窺えます。ここでは、2013年と比較しても、ほとんど違いは確認できません。
図-4は、利用者の1日のトラフィック量を相補累積度分布にしたものです。これは、使用量がX軸の値より多い利用者の、全体に対する割合をY軸に、ログ・ログスケールで示したもので、ヘビーユーザの分布を見るのに有効です。グラフの右側が直線的に下がっていて、ベキ分布に近いロングテールな分布であることが分かります。いずれにせよ、ヘビーユーザは統計的に分布していて、決して一部の特殊な利用者ではないと言えます。
図-5は、利用者間のトラフィック使用量の偏りを示します。使用量上位X%の利用者が、全体トラフィック量のY%を占めることを表します。使用量には大きな偏りがあり、結果として全体は一部利用者のトラフィックで占められています。例えば、上位10%の利用者がOUTの68%、INの93%を占めています。更に、上位1%の利用者がOUTの30%、INの65%を占めています。ここ数年のヘビーユーザ割合の減少に伴い、僅かながら偏りは減ってきています。
ページの終わりです