統計データ[子供の学習費調査/文科省]

FPが様々な場面で根拠となる政府統計データを使って分析していきます。これまでは政府統計データであることだけを頼りに使用していましたが、調査の方法や統計学で使われる分析・検定方法などを勉強しながら駆使し、よりエビデンスベースドポリシーに準ずることができるよう分析能力向上の意味を込めて公開していきます。様々な統計データを分析する過程で、修正する可能性があります。データに対する考え方は様々ですので、ご意見をいただけると幸いです。

『子供の学習費調査』概要

出典 文科省
調査の期日・期間 隔年(偶数年):4月~翌年3月
分類 一般統計調査
標本抽出方法 多段階抽出法(?)・全数調査
リンク先 子供の学習費調査

子供の学習費調査 分析

 集計結果を見るにあたり、用語の確認は大変重要である。子供の学習費調査で使われている用語の定義はまとめられたファイルがあるので随時、確認する。
出典:文科省 「子どもの学習費調査」 用語の解説(項目別定義)
ちなみに、様々な項目について調査しているが、たとえば家庭教師を利用していない世帯は当然、「ゼロ」になるが、支出額が「ゼロ」となっても調査結果に含まれている。

 教育費についての記事を読むと、「一人につき1,000万円必要」と言われますが、これは家計のやり繰りをした結果の標本平均であり「1,000万円」という金額の中には、「支払わなければならない金額」と「必ずしも支払う必要はないが、余裕があれば支払う金額」が混ざっています。すると1,000万円が「必要」とは言えません。加えて、これは標本平均で、大都市の教育費と地方の教育費など様々です。つまり「1,000万円」という金額も検証する必要があります

学校種別の学習費

 公立・私立別の学習費がわかる調査です。調査では、学習費を「学校教育費」「学校給食費」「学校外活動費」に分けています。「学校教育費」「学校給食費」は必ず支払わなければならない支出項目で構成されていますが、「学校外活動費」は家計のやり繰りで増減することができる支出項目です。それぞれ「かける教育費」「かけられる教育費」とし、「かけられる教育費」に計画性を持たせることで、教育費の負担が少しでも減らせるのではと考えています。
 支出項目の金額は、平均値ですので、外れ値の影響を受けやすくなっています。そのため、金額よりも学習費総額に占める「学校教育費」「学校給食費」「学校外活動費」を見ると参考になるでしょう。


FPの現場から

 「学校外活動費」は灰色の部分です。灰色の割合が大きいほど、家計のやり繰りがしやすい、学習費の支出をコントロールしやすいことになります。全体的に「私立」より「公立」の方が支出のコントロールがしやすいと言えます。
 学習費で支出額が大きいのは大学ですが、高校までの支出額を上手くコントロールすることで大学費用の準備を効率的に行えます。つまり習い事などの支出額を減らす方法です。ただ教育は幼少期から行うことが重要(要調査)なので、総合的に考えると必ずしもいいとは限らないかもしれません。

「幼稚園」 学年(年齢)別,所在市町村の人口規模(学科)別の学習費

 学年別・人口規模別の学習費で、「幼稚園」の学習費を分析してみます。資料には標準誤差率が記載されていますので、まずはそこから確認しましょう。
・学習費総額の標準誤差率は、
 公立幼稚園の3~5歳児では1.79~4.62%
 人口規模別では2.73~6.85%
 私立幼稚園の3~5歳児では3.01~3.83%
 人口規模別では3.18~7.32%
・学校給食費の標準誤差率は,
 公立幼稚園の3~5歳児では4.67~7.55%
 人口規模別では5.49~79.03%
 私立幼稚園の3~5歳児では6.48~7.00%
 人口規模別では8.48~19.09%
・学校外活動費の標準誤差率は
 公立幼稚園の3~5歳児では3.93~14.92%
 人口規模別では4.43~10.79%
 私立幼稚園の3~5歳児では3.99~6.11%
 人口規模別では5.39~10.19%

FPの現場から

 学習費総額の標準誤差率が5%以内である、「公立幼稚園の3~5歳児」「私立幼稚園の3~5歳児」は95%信頼区間に含まれると推定されます。母数は学校基本調査で調べて確認します。人口規模別の標準誤差率は5%を超えていますので、母平均は95%信頼区間に含まれないと推定されます。

公立・私立幼稚園 人口規模別学習費

人口規模を「5万人未満」「5万人以上15万人未満」「15万人以上」「指定都市・特別区」の4区分に分けた場合の、学習費の平均額を示しています。


FPの現場から

 学習費総額を見ると、人口規模に関係なく、私立幼稚園は公立幼稚園の3倍弱の金額です。このグラフから読み取れる顕著な違いは、公立幼稚園の学習費総額は人口規模では大きな差がないにもかかわらず、「指定都市・特別区」の学習費総額が高く、それは「学校外活動費」への支出が大きいことがわかります。私立幼稚園は、「学校活動費」も「指定都市・特別区」が他の人口規模に比べて高いですが、「学校外活動費」への支出も高くなっています。「学校外活動費」については、後日、さらに調べていく予定です。
※学習費総額の人口規模別は95%信頼区間に含まれていません。

学校外活動費

 学校外活動費に焦点を当てて分析してみます。分析の前に、学校外活動費の用語の定義について確認しておきましょう。学校外活動費は、補助学習費とその他の学校外活動費に分類されます。

補助学習費

  • 家庭内学習費(物品費): 学習机,いす,本棚,カセットテープレコーダー,パソコン(補助学習用)等の購入費
  • 家庭内学習費(図書費):参考書,問題集,辞書,百科事典,学習用カセットテープ・パソコンソフト等の購入費
  • 家庭教師費等: 家庭教師への月謝(謝礼),教材費また,通信添削などの通信教育を受けるために支出した経費
  • 学習塾費:学習塾へ通うために支出した全ての経費で,入会金,授業料(月謝),講習会費,教材費,通っている学習塾での模擬テスト代,学習塾への交通費
  • その他:予習・復習・補習のための図書館などへの交通費,公開模擬テスト代等

その他の学校外活動費

  • 体験活動・地域活動:ハイキングやキャンプなどの野外活動,ボランティア活動,ボーイスカウト・ガールスカウトなどの活動に要した経費
  • 芸術文化活動:ピアノ,舞踊,絵画などを習うために支出した経費,音楽鑑賞・映画鑑賞などの芸術鑑賞,楽器演奏,演劇活動などに要した経費
  • 芸術文化活動(月謝等):入会金,月謝等
  • 芸術文化活動(その他):入場料,交通費,物品費,図書費等で,楽器,楽譜帳,舞踊のみに使う衣類等
  • スポーツ・レクリエーション活動:水泳・野球・サッカー・テニス・武道・体操などのスポーツ技術を習うために支出した経費及びスポーツイベント等への参加費,スポーツ観戦に要した経費
  • スポーツ・レクリエーション活動(月謝等):入会金,月謝等
  • スポーツ・レクリエーション活動(その他):入場料,交通費,物品費,図書費等で,スポーツ用具の購入費や維持費等を含む
  • 教養・その他:習字,そろばん,外国語会話などを習うために支出した経費及び小説などの一般図書・雑誌購入費,博物館・動物園・水族館・図書館などへの入場料・交通費など
  • 教養・その他(月謝等):入会金,月謝等
  • 教養・その他(図書費):単行本,文庫本,全集,絵本等で,補助学習のために購入した場合を除く
  • 教養・その他(その他):入場料,交通費,物品費等で,補助学習のために購入した場合以外のパソコン,パソコン用ソフト等の購入費を含む
<学校外活動費 幼稚園>

FPの現場から

 学習費調査は、支出額がゼロでも含まれているため、項目別に確認したい場合は、詳細を確認しておく必要があります。この表は、学校外活動費(補助学習費・その他の学校外活動費)の内訳を示しており、一番下には支出者平均額が記載されています。この表から何らかの結論を導き出せるのかどうかが疑問です。「学校外活動費の標準誤差率は、公立幼稚園の3~5歳児では3.93~14.92%、人口規模別では4.43~10.79%、私立幼稚園の3~5歳児では3.99~6.11%、人口規模別では5.39~10.19%」といずれも95%信頼区間に含まれていないためです。分析項目だけは考えておきます。
・「補助学習費」よりも「その他の学校外活動費」の方が支出額は多いと言えるか。
・公立と私立ではどちらがより「学校外活動費」に支出しているか。
※もう少し統計学を勉強して検証できるようにしていきます(現状、どのように分析して良いか分かりません)。

統計データ[消費者物価指数/総務省]

統計データ[消費者物価指数/総務省]

 FPが様々な場面で根拠となる政府統計データを使って分析していきます。これまでは政府統計データであることだけを頼りに使用していましたが、調査の方法や統計学で使われる分析・検定方法などを勉強しながら駆使し、よりエビデンスベースドポリシーに準ずることができるよう分析能力向上の意味を込めて公開していきます。様々な統計データを分析する過程で、修正する可能性があります。データに対する考え方は様々ですので、ご意見をいただけると幸いです。

『消費者物価指数』概要

出典 総務省
調査の期日・期間 毎月末公表
分類 基幹統計調査
指数方式 基準時加重相対法算式(ラスパイレス型)
リンク先 消費者物価指数(CPI)

消費者物価上昇率 分析

消費者物価上昇率と完全失業率 その1

消費者物価上昇率と完全失業率 その2

直線は任意です。後日、回帰分析を行います。

統計データ[民間給与実態統計/国税庁]

 FPが様々な場面で根拠となる政府統計データを使って分析していきます。これまでは政府統計データであることだけを頼りに使用していましたが、調査の方法や統計学で使われる分析・検定方法などを勉強しながら駆使し、よりエビデンスベースドポリシーに準ずることができるよう分析能力向上の意味を込めて公開していきます。様々な統計データを分析する過程で、修正する可能性があります。データに対する考え方は様々ですので、ご意見をいただけると幸いです。

『民間給与実態統計』概要

調査の期日・期間 毎年
分類 基幹統計調査
標本抽出方法 層化無作為抽出法(確認中)
調査の流れ (確認中)
調査対象 各年12月31日現在の源泉徴収義務者(民間の事業所に限る)に勤務している給与所得者(公務員含まない、源泉徴収義務者に勤務している非正規を含む従業員・役員)
リンク先 民間給与実態統計

「民間給与実態統計」 抽出法

(1) 第1段抽出
 事業所を、事業所の従事員数等によって層別し、それぞれの抽出率で標本事業所を抽出した。なお、第1段抽出は、国税庁長官官房企画課で行い、抽出された標本事業所には、国税局総務部企画課(沖縄国税事務所にあっては総務課。)から調査票を送付した。
(2) 第2段抽出
 標本事業所の給与台帳を基にして、一定の抽出率により標本給与所得者を抽出した。ただし、標本事業所において年間給与額が2,000万円を超える者は、全数を抽出した。 なお、第2段抽出は、標本事業所が行った。

「民間給与実態統計」 標準誤差率

 標準誤差率は、いずれにおいても95%信頼区間に含まれる。

「民間給与実態統計」 対象者数

<事業規模別・年齢層別の給与所得者数>

FPの現場から

 給与所得者数を見ると、事業規模が小さいほど高齢化していると言えます。

民間給与実態統計 分析

事業規模別・年齢層別の給与額

FPの現場から

 事業規模により給与額に違いは見られ、年齢別では、年齢が上がるとともに給与額が増え、60歳になると給与額が下がっていることが分かります。この表とグラフだけでは大まかにしか分かりませんので、年齢層が上がるとどの程度変化するか、変化率を加えた表を作成しました。

 上昇率と下落率の顕著な個所に赤枠を付けてみました。おおむね35歳までの上昇率が高く、40歳以降は緩やかに上昇していますが、55歳以上になると下がり始めています。事業規模が大きくなるほど、長く上昇し、下落し始めるのが遅いですが、上昇している分、下落率はかなり高くなっています。この表は、次の年齢階層に移行すると給与額は増えると言えますが、正確に言うと、現在勤務している年齢階層ごとの差になります。

給与階級別・給与所得者数

FPの現場から

 グラフには記載がありませんが、給与額の平均値は421.6万円(500万円以下)、最頻値・中央値は400万円以下となっており、平均値は給与額の高い階級の影響を受けていると言えます。

 累積相対度数を加えたグラフ(パレート図)です。全体(源泉徴収義務者に勤務している給与所得者)の95%の範囲は1,000万円以下になりますので、1,000万円超を外してグラフ化してみます。

給与額1,000万円超を省くと、給与額の平均値は373.9万円となり、階級は400万円以下となります。

統計データ[労働力調査/総務省]

 FPが様々な場面で根拠となる政府統計データを使って分析していきます。これまでは政府統計データであることだけを頼りに使用していましたが、調査の方法や統計学で使われる分析・検定方法などを勉強しながら駆使し、よりエビデンスベースドポリシーに準ずることができるよう分析能力向上の意味を込めて公開していきます。様々な統計データを分析する過程で、修正する可能性があります。データに対する考え方は様々ですので、ご意見をいただけると幸いです。

『労働力調査』概要

調査の期日・期間 毎月末日
分類 基幹統計調査
標本抽出方法 層化2段抽出法※詳細(pdfファイル)
調査の流れ 総務大臣―都道府県知事―指導員―調査員―調査世帯
調査対象 基礎調査票(3万世帯)・特定調査票(1万世帯)※就業状態(約10万人)
リンク先 労働力調査

『労働力調査』分析

完全失業率

統計データ[GDP統計/内閣府]

『国民経済計算(GDP統計)』

『国民経済計算(GDP統計)』概要

国民経済計算は、経済の全体像を国際比較可能な形で体系的に記録することを目的に、国連の定める国際基準(SNA)に準拠しつつ、統計法 に基づく基幹統計として、国民経済計算の作成基準及び作成方法に基づき作成される。
国民経済計算は「四半期別GDP速報」と「国民経済計算年次推計」の2つからなっている。「四半期別GDP速報」は速報性を重視し、GDPをはじめとする支出側系列等を、年に8回四半期別に作成・公表している。「国民経済計算年次推計」は、生産・分配・支出・資本蓄積といったフロー面や、資産・負債といったストック面も含めて、年に1回作成・公表している。

目的

四半期別GDP速報(QE:Quarterly Estimates)は、一国全体のマクロ経済の状況を明らかにする国民経済計算のうち、支出系列及び雇用者報酬について毎四半期毎に公表することで、カレントな景気判断を行うための基礎資料となることを目的としている。1次速報は当該四半期終了後から1ヶ月と2週間程度後、2次速報は、1次速報以降新たに利用可能となった基礎資料を用いて、さらに約1ヶ月後に公表される。

GDP=民間消費+民間投資+政府支出+輸出-輸入

民間消費=民間最終消費支出
民間投資=民間住宅+民間企業設備+民間在庫品増加
政府支出=政府最終消費支出+公的固定資本形成+公的在庫品増加
輸出=財貨・サービスの輸出
輸入=財貨・サービスの輸入

長期推移データ

1955年(昭和30年)からの計数を掲載しているが、現在までの同一基準による一貫したデータは遡及改定していない。長期のデータを参照する場合は、各基準年の計数を繋げることになるが、体系基準年が異なるため直接接続しない。

公表日程(四半期別GDP速報) 1-3月期:5月・6月
4-6月期:8月・9月
7-9月期:11月・12月
10-12月期:翌年2月・3月
公表日程(国民経済計算年次推計) フロー編・ストック編:12月中旬
分類 基幹統計調査
リンク先 GDP統計

GDP推移

名目GDPと実質GDP

名目GDPと実質GDPの違いを確認しておこう。
(具体例)
1年目 年間生産量と価格
:コーヒー10杯/1杯100円/売上1000円

(例1)1年目は10杯100円で売れていたが、売れないため、1杯80円にした。

2年目 年間生産量と価格
:コーヒー10杯/1杯80円/売上800円
□名目GDP成長率 ▲20%
 100円×10杯 → 80円×10杯
□実質GDP成長率 0%
 100円×10杯 → 100円×10杯
■名目GDP成長率が実質GDP成長率を下回る。
※名目GDPでは価格を80円として計算しており物価変動を考慮しているが、実質GDPでは100円のままである。
※販売不振で「100円×8杯」としても、100円で売れないため、例のように、「80円×10杯」となる。不景気で、10杯売れないときは、生産ラインを減らしたり、支店を減らしたりして「80円×8杯」にするだろう。この場合の名目GDP成長率▲36%、実質GDP成長率▲20%となり、名目GDP成長率が実質GDP成長率を下回っている点は変わらず、両成長率の下げ幅が大きくなる。

(例2)1年目の100円ではすぐに売れ切れてしまう(値上げしても売れる)ので、1杯120円にした。

(例2)
2年目 年間生産量と価格
:コーヒー10杯/1杯120円/売上1200円
□名目GDP成長率 20%
 100円×10杯 → 120円×10杯
□実質GDP成長率 0%
 100円×10杯 → 100円×10杯
■名目GDP成長率が実質GDP成長率を上回る。
※名目GDPでは価格を120円として計算しており物価変動を考慮しているが、実質GDPでは100円のままである。

・物価が上昇しているときは、名目GDP成長率が実質GDP成長率を上回る。逆に、物価が下落しているときは、名目GDP成長率が実質GDP成長率を下回る。
・(例2)を見て分かるように、実質GDP成長率を上昇させるためには生産量が増加する必要があるが、価格が上がらないと所得に反映しないので、名目GDP成長率の上昇と伴った実質GDP成長率でなければならない。

潜在的GDP

資本や労働などの生産要素が最大限に活用された場合や過去の平均的な水準まで活用された場合に実現できる総産出量(総供給量)のこと。
デフレギャップは、「潜在的GDP(総供給量) – 名目GDP(総需要)」で求める。
ただ、潜在的GDPをどちらの意味で使っているかを理解する必要がある。内閣府や日銀の潜在的GDPの定義は過去平均の実質GDPとしている。

・実質GDPを潜在的GDPの軌道上に乗せることは、生産力をフル回転させることであるため、「二十四時間働けますか」状態であり、不可能であるという意見もある。
・アベノミクス三本の矢の一つ「民間投資を喚起する成長戦略」では、潜在的GDPを一段階引上げ、実質GDPを現在の潜在的GDPの軌道に乗せようとした。

GDPデフレーター

GDPデフレーターは、実質GDPを算出する際に物価変動の影響を取り除くために使われる。

実質GDP=名目GDP÷GDPデフレーター
GDPデフレーター=名目GDP÷実質GDP

GDPデフレーターは名目GDPを実質GDPで割っていることから、名目GDP成長率が実質GDP成長率を下回るとGDPデフレーターの増加率はマイナスとなりデフレ、名目GDP成長率が実質GDP成長率を上回るとGDPデフレーターの増加率はプラスとなりインフレと考えられる(前述の名目GDPと実質GDPの具体例を見ながら考えると分かりやすい)。

また、GDPデフレーターは、消費者物価指数や企業物価指数のように、値の増減で判断するが、両指標とは異なり、輸入品価格は含まれていない(国内製品のみである)。

・デフレ傾向時は不景気であることは多いが、デフレと不景気は同義語ではなく、デフレ下でも景気が上昇していることがある。

(参考)
「潜在GDP」を「平均GDP」へ改称すべし
需給ギャップと潜在成長率の見直しについて
平均概念で潜在GDPは測れない
平成19年度年次経済財政報告
生産関数と潜在GDP
GDPギャップと潜在成長率
GDPギャップ/潜在GDPの改定について
名目GDP vs.実質GDP
よくわかる経済指標「GDPデフレーター」
GDPとは
GDPデフレーター(支出側と生産側)の不突合と推計方法の見直しに向けて
GDPデフレーターが低下するインフレ
メールマガジン(経済用語解説)
GDP統計の改定結果から探る日本経済の実態
景気判断とGDP統計
四半期別GDP速報について ~その位置付け、特徴、最近の取組~
平成 27 年度国民経済計算年次推計の概要について
参考資料集

統計データ[マネタリーベース/調査統計局]

『マネタリーベース』の概要

マネタリーベースの意味や発表時期を紹介していきます。

公表日程 毎月(翌月第2営業日発表)
リンク先 マネタリーベース

マネタリーベースとは?

マネタリーベースは「日本銀行が供給する通貨」のことで、市中に出回っているお金である流通現金(「日本銀行券発行高」+「貨幣流通高」)と「日銀当座預金」の合計値となる。

なお、1981年3月以前のマネタリーベースの定義とは異なる。
※(1981/3月以前)マネタリーベース=「日本銀行券発行高」+「貨幣流通高」+「準備預金額」

マネタリーベース=「日本銀行券発行高」+「貨幣流通高」+「日銀当座預金」

マネタリーベースを見てみよう

マネタリーベースは日銀が発行する資金量であることがわかった。それでは、実際にマネタリーベースをどのように見ればいいか、統計データとともに見ていこう。

マネタリーベースはどう見ればいい?

マネタリーベースを増やすことは、日銀当座預金や金融機関にお金が増えることなので、金融機関はより金利の高い融資としてお金を活用でき、経済が活性化される。景気が過熱しているときには、マネタリーベースを減らしインフレを抑制する。
お金の量が増えれば、金利が下がるため、借り入れを増やし投資に回そうとするが、お金の量を減らせば、金利が上がり、投資は控えられる。

このことからマネタリーベースが増加傾向にある時期は景気を刺激させようとし、減少傾向にある時期は景気を抑制させようとしていることが分かる。

マネタリーベースをグラフで確認しよう

マネタリーベース

2013年4月4日に「量的・質的金融緩和」を導入し、金融調整目標を無担保コール翌日物金利からマネタリーベースに変更した。当時の日銀副総裁岩田規久男氏は著者「日銀日記」で、政策委員会金融政策決定会合で予想外にほぼ全員一致で賛成したとある。2013年からマネタリーベースが急激に増えているのは、この政策決定会合による影響である。

この時からインフレターゲット2%という目標を設定するが、物価上昇は円の価値が下落することであるため、為替相場での円安を目指していることにもなる。

岩田規久男氏はいわゆるリフレ派で、異次元の金融緩和で投資を活発化させ、景気を刺激し、デフレ脱却を目指した。しかし、2019年8月現在、インフレターゲット2%は達成できておらず、資金があっても個人・企業ともに貯めこんでいるのが現状である。

マネタリーベースの対名目GDP比

GDP規模が異なる他国のマネタリーベースと比較する場合には、「マネタリーベースの対名目GDP比」が利用される。日本のネタリーベースの対名目GDP比が90%近くであるのに対し、米国の水準は20%、ユーロ19ヵ国が28%となっている。

(参考)
異次元緩和の問題点

マネタリーベースとマネーストックの違い

マネタリーベース統計は中央銀行が供給する通貨で、日銀当座預金や金融部門の保有現金(銀行券と貨幣)が含まれるが、マネーストック統計は金融部門全体から経済に対して供給される貨幣のことで、日銀当座預金や金融部門の保有現金(銀行券と貨幣)は含まれない。日銀当座預金や金融部門の保有現金(銀行券と貨幣)は金融部門が保有しており、経済に供給されていないためである。

関連用語

・テーパリングTapering:量的緩和の縮小
・イールドカーブ・コントロール:長短金利操作のことで、2016年9月の日銀院有政策決定会合で「長短金利操作付き量的・質的金融緩和」として導入された。短期金利のマイナス金利政策と10年物国債金利がほぼゼロ%になるような買い入れで、短期から長期までの金利をコントロール。
・オーバーシュート型コミットメント:インフレターゲットである2%を超えたとしても安定的に超えるまでは金融緩和を行うことをコミットメント(約束)したもの

(参考)
マネタリーベース
ゼロからわかる『金融政策:日銀の「長短金利操作付き量的・質的金融緩和」』
量的質的緩和でインフレにならない訳
財政状況と長期金利
最近の金融経済情勢と金融政策運営
平成30年度 年次経済財政報告

統計データ[家計調査/総務省]

 FPが様々な場面で根拠となる政府統計データを使って分析していきます。これまでは政府統計データであることだけを頼りに使用していましたが、調査の方法や統計学で使われる分析・検定方法などを勉強しながら駆使し、よりエビデンスベースドポリシーに準ずることができるよう分析能力向上の意味を込めて公開していきます。様々な統計データを分析する過程で、修正する可能性があります。データに対する考え方は様々ですので、ご意見をいただけると幸いです。

『家計調査』概要

出典 総務省
調査の期日・期間 毎年6月公表(年報)
分類 基幹統計調査
標本抽出方法 層化3段抽出法
リンク先 家計調査

家計調査 分析

2017年12月30日

収支項目分類一覧

収支項目分類 詳細

家計収支編 二人以上の世帯[2016年度/2017年5月16日公表]

 FPに相談する世帯は、単身世帯より二人以上の世帯が多いことから、二人以上の世帯を中心に分析していきます。もちろん、単身世帯も分析し、どのような違いがあるかを分析するのも有益でしょう。まずは二人以上の世帯から勤労者世帯のデータを見ていきたいと思います。
出典:家計収支編 二人以上の世帯[2016年度/2017年5月16日公表]

FPの現場から

 勤め先収入487,934円をはじめ、全体的に金額が大きい。二人以上の世帯でも、収入の高い世帯の影響を受けている可能性があり、模範としての家計収支構成、金額とは言えない。一般的に、収入が高ければ、年収に占める住宅ローンの割合や食費の割合など下がる傾向にあるため、割合を当てはめることもできない。より正確な分析をするためには、年収別の調査対象世帯数をヒストグラムでグラフ化する必要があると思われる。どちらかと言えば、時系列データとして使用した方がいい統計データだと考えられる。

年齢階級別世帯分布

 家計調査を分析する上で重要な年齢別の世帯数分布が見つかったので、グラフ化しました。

 上記のグラフは、調査で採用されている年齢階級別にグラフ化したもので、このままでも平均年齢が高そうなことがわかります。「万分比」は、全体の世帯数を1万世帯とした場合の世帯数となります。基本的に相談者の年齢は子育て世帯であるため、ここで勤労者世帯は65歳未満と仮定して65歳以上の数値を削除してグラフ化してみます。

 上記のグラフは、65歳以上の項目を削除し、累積相対度数とともにグラフ化したものです。60~64歳の世帯数が最も多く、40代(40~49歳)と合わせて全体の半分を占めています。34歳以下の相対度数は9.6%、35~39歳は11.6%となっており、30代は全体に占める割合が20%強です。このことから、一般的に収入の上昇がこれからである30代の影響は少なく、やはり年収の高い世帯に偏りがあると考えられます。ただもう少し分析する必要があり、都市別や年収別などのデータも確認しなければなりません。

年間収入五分位階級別

 年間収入五分位階級別の統計からローレンツ曲線を作成しました。階級別に相対度数と累積相対度数を求め、エクセルのグラフ(散布図)を利用し、グラフ化しています。

家計調査 単回帰分析

[公開]2018年3月29日

統計学の学習が進んだので、練習のため、家計調査の消費支出と可処分所得について単回帰分析を行う。

使用データ:「1946年以降の1世帯当たりの収入(勤労者世帯のみ)及び支出金額(農林漁家世帯を除く・全国1963年~2017年・二人以上の世帯のうち勤労者世帯)」

分析手順

(1) 政府統計データをダウンロード
(2) 「年度」「消費支出」「可処分所得」を抽出して、csvファイルに変換する。このとき、データ形式(数値)を修正すること。
※消費支出:Ce、可処分所得:Di
(3) テキストファイルも作成
(4) 最小二乗法を用いる。ケインズ型消費関数では可処分所得のみを説明変数とするのが基本
※データ読み込み:>data<-read.table("ファイル名.拡張子")
※lm(目的変数~説明変数,data)
(5) 説明変数の符号条件が相応しいか判断する ・・・分析前に判断すべきか?
※説明変数である可処分所得は+(プラス)で理論通りと考えてよい。


※用語の意味
Min:最小値、1Q:第一分位数、Median:中央値、3Q:第三分位数、Max:最大値
Cofficients:係数、Estimate:推定値、Std.Error:標準誤差、t value:t値、Pr(>|t|):t値のP値
Intercept:切片
Multiple R-squared:決定係数(寄与率)
Adjsted R-squared:自由度修正済み決定係数(説明変数が多い場合に使用する)
※決定係数は1に近いほどモデルの正確性が高いことを表わす。

分析結果(単回帰分析)

t値(t検定)

説明変数が0ではないことを判断する。\(y=α+βx\)の回帰直線において、回帰係数である\(β\)が0になってしまうと、\(x\)が説明変数の役割を果たさなくなるため、t検定を行う必要がある。ソフトを使えば自動的に算出される。

・t value:t値
・Pr(>|t|):t値のP値
・Signif. codes:有意水準を表し、0は有意水準\(α=0\)(0%)で★★★(3つ)、0.001は有意水準\(α=0.001\)(0.001%)で★★(2つ)以降同様。一般的に、有意水準\(α=0.01\)(1%)または\(α=0.05\)(5%)を使うことが多い。P値は小さいほど良い。

仮説検定において、\(H_0:β=0\)を帰無仮説、\(H_1:β≠0\)を対立仮説とし、t検定を行う。
・・・InterceptとDiともに★★★(3つ)なので、帰無仮説は棄却?

Intercept(切片)が 11,230、限界消費性向が 0.7149なので、
消費=11,230+0.7149×可処分所得
となる。可処分所得が増加すると、消費が可処分所得の71%増える。
※ケインズ型消費関数 C=c0+cl・YD
C:消費、YD:可処分所得、c0:基礎消費、cl:限界消費性向


分析結果(重回帰分析)

消費は可処分所得のみから影響を受けるわけではないため、物価や金利などの説明変数も加えて分析をする。

つづく・・・

家計調査 ローレンツ曲線とジニ係数

[公開]2018年4月6日

ローレンツ曲線とジニ係数の特徴を理解するために、実際に作成する。2017年の二人以上の勤労世帯で、五分位と十分位を使用する。

十分位

五分位

特徴

・ジニ係数は、45度線とローレンツ曲線の間の面積(三日月型の部分)を2倍する。具体的には、ローレンツ曲線の下部の面積(三角形と台形の面積の合計)を2倍したものを1から引くか0.5からローレンツ曲線の下部の面積を引いたものを2倍して求める。
・ジニ係数は、0から1の間を取り、1に近い(45度線から離れている、ジニ係数が大きい)ほど不平等と判断される。
・階級が細かいほど、同じデータを使用していてもジニ係数は大きくなる。
・二つのローレンツ曲線は交差することがある。

統計データ[毎月勤労統計調査/厚生労働省]

 FPが様々な場面で根拠となる政府統計データを使って分析していきます。これまでは政府統計データであることだけを頼りに使用していましたが、調査の方法や統計学で使われる分析・検定方法などを勉強しながら駆使し、よりエビデンスベースドポリシーに準ずることができるよう分析能力向上の意味を込めて公開していきます。様々な統計データを分析する過程で、修正する可能性があります。データに対する考え方は様々ですので、ご意見をいただけると幸いです。

『労働力調査』概要

調査の期日・期間 毎月末現在(給与締切日の定めがある場合には、毎月最終給与締切日現在)
分類 基幹統計調査
標本抽出方法 第一種事業所(規模30人以上)は無作為抽出法、第二種事業所(規模5~29人)は二段抽出法
調査の流れ 第一種事業所:厚生労働省⇔都道府県統計主管課⇔調査対象事業所
第二種事業所:厚生労働省⇔都道府県統計主管課⇔統計調査員⇔調査対象事業所
調査対象 事業所
リンク先 毎月勤労統計調査

統計データ[標準生命表/日本アクチュアリー会]

『標準生命表』概要

種類 死亡保険用・第三分野用
利用目的 責任準備金の計算の基礎
※予定死亡率の計算の基礎ではない
出典 日本アクチュアリー会
『標準生命表2018』(詳細)
『標準生命表2018』(概要)

『標準生命表』詳細

作成過程

基礎データをもとに標準生命表を作成するが、その間、様々な補整が行われる。
(1) 基礎データ ⇒ 粗死亡率
  :若年齢部分の補整
(2) 粗死亡率 ⇒ 補正前死亡率
  :死亡率改善の反映
(3) 補整前死亡率 ⇒ 標準生命表
  :第1次補整 数学的危機論による補整
  :第2次補整 Grevilleによる補整
  :第3次補整 Gompertz-Makehamによる補整

「截断年数」は選択効果の除くための期間

基礎データは生命保険会社29社からの実績に基づくもので、実績データをもとに粗死亡率を作成する。作成過程を読むと、知らない用語がちらほらあるため、できる限り調べた。

観察年度は、2008、2009、2011年とある。調査の対象となる年度のことだろう。截断年数は、”選択効果を排除し、死亡率の安全性を確保するため、基礎データの截断を行った。截断年数は、截断後の契約件数が50%以上となるように、男女別・年齢群団別に1年截断~10年截断とした。”とあるが、截断年数の意味が分からなかった。

ニッセイ基礎研究所の基礎研レターが参考になる。ふつう、保険加入前に診査があるため、健康状態が基準に満たなければ加入できない(危険選択)。この危険選択の効果(日本アクチュアリー会では選択の効果と呼んでいる)がはたらくため、契約当初から数年間は保険事故は発生しにくい。そこで選択効果がある期間の経験データは截断し、截断期間後のデータを使用することで真の死亡率に近づけようとしている。
参考:ニッセイ基礎研究所「基礎研レター

截断の期間が長すぎるとすでに死亡していたり、解約していたりするため、截断後の契約件数が50%以上となるようにという基準がある模様。ただ「〔表2〕截断年数の設定 保険年度別粗死亡率 死亡指数」の見方が分からないため、もう少し調べる必要がある。〔表2〕のうち「截断年数別 截断後契約残存数」は理解できる。20~24歳の場合、截断なしなら契約数100%とあり、初年度を截断すると残存数は77%、2年度まで截断すると58%、3年度までなら42%と読み取れる。男女別・年齢群団別に設定するので、男性で20~24歳の場合は、3年度まで截断すると50%を切ってしまうため、截断期間は2年となる。またこの截断期間の上限を標準生命表2018では10年としている。

観測量は膨大で、母数に近いと考えられる

経過件数は男性4,068万件、女性3,0002万件、死亡件数は男性26.3万件、女性9.5万件とサンプルサイズから母数を推測するには十分な観測量と考えられる。ちなみに契約年数は30年以下、基本は有診査だが、17歳以下(男性)・27歳以下(女性)は観測量が他の年齢と比べて少なくなるため、無診査も含まれている。

95%信頼区間の上限

95%信頼区間は、「母集団から標本を取り出し、その平均から95%信頼区間を求める、という作業を100回行うと、95回はその区間の中に母平均が含まれる」という意味で、95%の確率で正しいという意味ではない。有意水準95%で両側検定を行っていることがわかる。「95%信頼区間の上限」は上限検定、下限検定の上限のことだろうか。また信頼上限死亡率の算出方法が不明である。ただ、粗死亡率の95%信頼区間の上限」が「粗死亡率の130%」を上回る場合は第21回生命表に置き換えている、という作業自体は理解できた。