1第13回評価分科会 議事録
1 日 時 令和4年5月17日(火)10:00〜11:30
2 場 所 Web会議
3 出席者
【委 員】
菅 幹雄(分科会会長)
、川﨑 茂(分科会長代理)
【臨時委員】
神林 龍、久我 尚子、山本 渉
【説明者】
国土交通省:総合政策局情報政策課交通経済統計調査室長
【事務局(総務省)】統計委員会担当室:萩野室長、小山次長、栗原次長、福田補佐、増成補佐
4 議 事
自動車輸送統計調査(全数バス調査)における欠測値補完手法について
5 議事録
しろまる菅分科会長 ただ今から第 13 回評価分科会を開催いたします。
本日は、
土屋専門員が御
欠席です。
本日は、自動車輸送統計調査の全数バス調査における欠測値補完手法についての審議と
なります。
同調査の欠測値補完手法については、第5回評価分科会(令和2年1月 27 日)において
一度審議が行われているということです。その後、諸般の事情から、再検証が必要となり
ましたので、今回その結果を国土交通省から御報告いただくというものです。再検証が必
要となりました理由も含めて、後ほど国土交通省から御説明いただきます。
それでは、
本日用意されている資料について、
事務局から簡単に御確認をお願いします。
しろまる福田総務省統計委員会担当室室長補佐 資料といたしましては
「自動車輸送統計調査(全数バス調査)における欠測値補完手法について」が資料となっております。
しろまる菅分科会長 それでは、議事に入ります。
自動車輸送統計調査の全数バス調査における欠測値補完手法について、国土交通省から
説明をお願いします。今回、再検証が必要となりました経緯も含めて、よろしくお願いい
たします。
しろまる内田国土交通省総合政策局情報政策課交通経済統計調査室長 本日、御説明のお時間を
いただきまして、誠にありがとうございます。 2資料の説明の前に、今回、改めて説明に至った経緯をまず最初に御説明をさせていただ
きまして、資料の説明に移らせていただきたいと思います。資料の2ページを併せて御覧
いただきながら、お聞きいただければと思います。
まず、サービス統計・企業統計部会と評価分科会の説明に違いが生じてしまった経緯と
いうことでございます。自動車輸送統計調査につきましては、第3期の基本計画におきま
して、調査手法等に関しまして見直しの必要性を指摘されておりました。このことから、
令和2年度から新たな調査手法による実施に向けまして、検討を行ってきたところです。
そのような中で、全数バス調査、これは事業所の全数調査ですが、全数バス調査の欠測
値補完手法については、平成 28 年度の統計法施行状況に関する審議結果報告書の統計精
度検査関連分におきまして、過去の回答結果を使用した単一補完を実施する場合の使用デ
ータの期限のないものというものに整理がなされまして、第3期基本計画において、自動
車輸送統計調査そのものの見直しが指摘されていることから、
当該見直しと整合するよう、
並行してデータの使用期限も含めて検証を行うことが必要であるというふうに指摘を受け
たところです。
自動車輸送統計の見直しに係る承認手続を行った際、全数バス調査の見直しと併せて、
営業用トラック調査の見直しが行われまして、その推計において採用することとしていた
手法と整合が図られるよう、全数バス調査においても層内同一事業所の合計値を前月との
伸び率で推計する手法に変更することとし、この内容をサービス統計・企業統計部会にお
いて説明をさせていただきました。
また、その後、欠測値補完に関する審議が評価分科会において行われることとなりまし
て、その中で全数バス調査の欠測値補完手法について、審議結果報告書における指摘を踏
まえまして、当省で実施しました欠測値補完に係る調査研究業務の分析結果に沿って説明
をさせていただいたところです。その結果、サービス統計・企業統計部会と評価分科会で
の説明に違いが生じたところでございます。当時、管理職や担当者が、両手法について差
異がないというふうに認識していたところが要因と考えています。
今回、補完手法について確認を行ったところ、サービス統計・企業統計部会と評価分科
会での説明に違いが生じているということが判明したことから、改めまして調査研究を行
いまして、その結果を御説明させていただくところでございます。
また、今後におきましては、調査手法や推計手法等を変更する際には、管理職を含めて
関係職員が情報共有を密に行いながら、内容の理解を深めるなど、十分に注意してまいり
たいと考えています。
それでは、資料の方に移らせていただければと思います。
1ページ目を御覧ください。
自動車輸送統計調査の概要です。
当該調査の目的等ですが、
自動車輸送統計、これは自動車による貨物や旅客の輸送実態を明らかにすることを目的と
する基幹統計ですが、これを作成しまして、我が国の経済政策、交通政策を策定するため
の基礎資料を得るために、昭和 35 年から毎月調査ということで実施しています。
調査の概要ですが、真ん中に表がございますが、様式といたしましては1号様式から4
号様式がございまして、1号様式が貨物営業用自動車、これは営業用トラックです。2号 3様式が自家用トラック、4号様式がタクシーでして、3号様式が赤枠で線が引いてあると
ころ、これが今回、御説明させていただきます全数バス調査、これは事業所調査ですが、
欠測値補完をしている部分です。3号様式の2と3号様式の3は、それぞれ一般乗合、高
速乗合、貸切の自動車の調査ということになっています。
調査方法等と結果公表につきましては、記載のとおりです。
3ページ目を御覧いただければと思います。説明の内容の相違点ということですが、サ
ービス統計・企業統計部会で説明をさせていただいた内容が、左側のロジックAというふ
うに名前を付けさせていただいております。右側が評価分科会で説明した内容ということ
で、ロジックBとさせていただいています。現行、調査をやっておりますが、どちらでや
っているかということにつきましては、サービス統計・企業統計部会で説明をさせていた
だいたロジックAのやり方で現在調査を行っているところです。
具体的な内容ですが、まず旅客輸送の特徴として影響を与えるであろうということで、
用途と地域と事業規模、これで層分けをしているということです。
まず、用途は、乗合、貸切、特定、車種の区分になります。地域につきましては、地方
運輸局別で層を区切っております。
また、事業規模ですが、これにつきましては各用途別の各事業所の実在車両数、これで
層を区切っているところです。これにつきましてはロジックA・ロジックB、同じ考え方
のもと、層区分を行っているということです。
補完手法ですが、補完手法は4ページ目を御覧いただければと思います。見やすく図式
をさせていただきましたが、ロジックAの方をまず、御覧いただきたいのですが、4月分
についてはA社、B社、C社、D社の報告がありましたと。5月分についてはA社、B社、
C社の報告があって、D社については未回収ということで、この条件はロジックA、ロジ
ックB、同じ内容で記載しています。
ロジックAのやり方といたしましては、同一層、先ほど層区分と言いましたが、その同
一層の中で事業規模なり用途なり、地域が似通ったところにあるというところにつきまし
て、提出のあったA、B、Cの4月分と、同じく5月分で提出のあったA、B、Cそれぞ
れの層、それぞれの月の走行距離を足していただいて、その足した数字、事業所の層の合
計値の前月比を求めます。ここの表でいうと 1.3 になります。この前月比を4月分のD社
の実績値に掛けることによって、5月のD社の欠測値補完の数値を求めるというやり方で
す。
一方、ロジックBの方ですが、こちらはA、B、Cそれぞれの事業所ごとの4月と5月
それぞれの増減率、前月比を出しまして、その前月比の平均を出したものをD社の4月分
の実績に掛けることによって、5月分の欠測値補完を行うというところです。ですので、
層の合計をしたものの前月比なのか、それぞれの事業所ごとの前月比を出したものの平均
なのか、ここの違いということです。
3ページ目にお戻りいただきまして、メリットということですが、これは欠測値補完、
新しい手法の前のやり方から見たときのメリットということでございまして、これはロジ
ックA・ロジックB、同じなのですが、以前は当該月が欠測した場合、12 か月と 13 か月 4前のデータの伸び率を前月の数字に掛けることによって当該月を出していたということで
ございまして、これをそのまま使っていますと、少なくとも1年以上のデータの蓄積が必
要であったというところが、このやり方をすることによって直近のデータを使うというこ
とができますので、1年以内に開業した等の過去のデータの蓄積が十分でない場合にも適
用が可能ということと、あとは国内景気等のトレンドとか、イベント等による急激な需要
変動を反映できるのがメリットであるというところです。
続きまして、連続補完にする場合のデータの使用期限ということですが、ロジックBで
御説明させていただいたときには、
連続補完を行った場合のデータの使用期限は最大 12 か
月を目途ということでしてございました。乘合、特定については 12 か月、貸切については
6か月ということでございました。ロジックAの方は特段定めてございません。
続きまして、5ページを御覧いただければと思うのですが、欠測値補完の手法というこ
とで、ロジックAとBの比較検証した内容です。各手法の比較検証につきましては、平成
31 年3月から令和2年3月の 13 ×ばつ同一層の他の事業所の合計値の前月比、
ロジックBの方は合計値の前月比のところが違っておりまして、各事業所の前月比の平均
というところに違いがございます。ここは先ほど説明したとおりです。
RMSEにつきましては、二乗平均平方根誤差ということで、実際の値からどれだけば
らついているかという数値を見る内容で、計算式は記載のとおりでございまして、推計値
-実績値、これに二乗してその層(N)の数分を足して平均を取る。それに平方根を取る
というやり方で、誤差を算出するという内容です。
推計値の算出につきましては、
平成 31 年3月分の調査結果を基に、
同年4月分の全ての
調査結果について1事業所ずつ欠測したと仮定しまして、各ロジックごとに推計をいたし
ました。また、5月分の推計につきましても、4月分の調査結果に基づきまして推計値を
算出し、これを各月 12 か月分行ったということでございます。その結果が5ページ、6ペ
ージに記載してございますが、用途ごと、ロジックA・Bごとで四分位なり推計誤差を出
した表になってございます。
6ページ目の検証結果でございます。まず、分かったことでございますが、第1四分位
から第3四分位の幅、四分位範囲でございますが、これにつきましてはロジックA・ロジ
ックBで同程度であったということでございます。また、RMSEにつきましては、A・
Bを比較しまして、ロジックAの方が小さかったということが分かりました。
上記の検証結果によりまして、ロジックAの方が推計誤差が小さいということから、ロ
ジックAが手法としては適切であると考えております。
本調査につきましては全数調査ということでございまして、行政記録情報に基づく毎年
の母集団名簿の整備によりまして、
事業所の改廃等を適切に把握しているということから、 5存在が確認できている事業所の欠測値については、既存データを活用して補完を行うこと
が望ましいと考えています。そのため、引き続き、ロジックAにより欠測値補完を実施す
ることといたしたいということです。
続きまして、7ページ目を御覧いただければと思います。こちらにつきましては、連続
補完によるデータの使用期限の検証というところです。連続補完によるデータの使用期限
の検証につきましては、欠測値補完手法として適切と我々が判断いたしましたロジックA
により行いました。
検証につきましては、平成 30 年3月から令和2年3月の 25 か月間の全ての月に提出の
あった事業所の調査結果、実績値を用いまして、平成 30 年度と令和元年度、各年度それぞ
れにおきまして、12 か月連続で補完を行った場合の推計誤差率の平均値を算出し、行いま
した。
なお、欠測率につきましては、25 か月間の調査期間における各用途の欠測率の最大値を
使用しました。
推計誤差率の算出については、
以下のとおりですが、
平成 30 年度の場合の例を書いてい
ますが、これは平成 30 年度と令和元年度、期間が違うだけで、やり方は一緒です。
まず、1ですが、平成 30 年3月の調査結果を基に、同年4月分の全ての調査結果につい
て1事業所ずつ欠測したというふうに仮定しまして、
全ての事業所の推計値を算出します。
その後、当該推計値をそれぞれの事業所の調査結果(実績値)で割ることで推計誤差率
を算出し、4月分の推計誤差率の平均値を算出します。
5月分の推計の算出におきましては、今度は4月分で算出しました推計値を用いて、5
月分の全ての調査結果について、1事業所ずつ欠測したと仮定し、連続で補完した場合の
推計値、推計誤差率、平均値をそれぞれ算出します。当該方法により、12 か月連続補完し
た場合の推計誤差率の平均値を算出したということです。
各月の推計誤差率の伸び率に、上記で御説明しました 25 か月の調査期間における各用
途の欠測率の最大値を乗じ、各用途の欠測率における推計誤差率の平均値を算出したとい
うことです。
その算出結果が8ページです。平成 30 年度、令和元年度と、それぞれ 12 か月連続で欠
測したものということになります。
乘合は、
欠測率 17.1 も欠測率で算出した内容となって
います。
貸切につきましては欠測率 20.1%、
特定については欠測率 13.9%ということで計
算をした結果です。
検証結果です。9ページを御覧いただければと思いますが、25 か月の調査期間における
最大の欠測率を用いまして1年間連続補完したとしても、各年度とも大幅な精度の低下は
見られないと考えています。
令和2年度における平均欠測率につきましては、乗合が 9.0%、貸切が 11.4%、特定が
7.6%ということですので、
検証で使用した欠測率よりも更に小さいことが、
割合的にも実
際の推計誤差率もより小さくなるのではないかと想定されます。
また、検証に用いた欠測率は、同じ事業者が連続して欠測することが前提となってござ
いますが、実際には欠測となる標本が入れ替わるということになりますので、誤差はより 6小さくなるということが想定されます。
また、令和2年度の調査票の平均回収率が 80%以上ということでございますので、欠測
値補完による推計値が統計全体の集計に与える影響というのも小さいのではないかと考え
てございます。
上記を踏まえまして、輸送実績を適切に捉えるために、連続補完によるデータの使用期
限というものは定めず、前年同期を超えた場合も引き続きロジックAの手法による欠測値
補完を行いたいというふうに結論付けております。
ただし、連続補完を行うに当たっては、より一層の督促の強化を行うということと、よ
り適切な母集団の把握、具体的には毎年母集団名簿を整備していすので、この整備に加え
て、毎月の調査時で把握しました廃業とか実質廃業とか、そういう情報を速やかに反映す
るということを行いまして、補完が不適切な対象を減らしていくということと、連続補完
の期間が短くなるように努めてまいりたいと考えてございます。
10 ページからは参考資料ということですが、10 ページはサービス統計・企業統計部会で
御説明させていただいた資料を参考に付けております。11 ページから最終ページの 13 ペ
ージまでが、評価分科会で説明させていただいた資料です。
国土交通省からの説明は以上です。御審議よろしくお願いいたします。
しろまる菅分科会長 ありがとうございました。それでは、ただ今の御説明について御質問、御
意見を賜りたいと思います。手元に出席者一覧の名簿がありますので、その順番で委員の
先生方の御意見、御質問をお聞きしたいと思います。
まず最初に、川﨑委員、御質問、御意見を賜りたいと思います。
しろまる川﨑分科会長代理 この件、過去には審議されたようですが、私としてはその当時のこ
とをよく知りませんし、また今日の会議の趣旨が、ただコメントを言うだけでいいのかど
うかよく分からないので、状況が分からないなりにも質問や感想を申し上げます。
欠測値の補完ということですが、まず体系を正しく理解しておきたいので、質問の1点
目は、先ほどのお話ですと、欠測の発生がものすごく大きいわけではないという印象を受
けました。資料の何ページかちょっと見当たりませんが、10%前後かそういう数字が出て
いたように思いますので、そんなに大きい数字ではなかったように思うので、補完の精度
を上げれば上げたで、それはそれでいいと思いますが、物すごくこれがクリティカルな要
素になるとはあまり思わないので、これぐらい緻密に検討されていればいいのではないか
と思ったのですが、ただ1点だけ気になったのが、連続補完という概念がよく分からなか
ったということです。
そこでちょっと教えてほしいのですが、2か月以上続けて欠測になるのがどれぐらいあ
るだろうか。それは、例えば1年ぐらい続くのがあるのだろうか、そういう欠測の連続の
分布みたいなデータというのはあるのだろうかというのが1点お尋ねしたいことです。こ
れは連続補完ですね。
それで、その場合に連続補完というか、例えばこの方式だと、前月の比率をずっと掛け
ながらやっていくということになるのだと思うのですが、例えば3か月欠測が続いている
ところであれば、
1か月目の補正率と2か月目の補正率と3か月目の補正率全部を掛けて、 7最後の観測値に掛け算するというやり方なのか、どういうやり方をされているのかという
実態がよく分からなかったので、そこのところを教えていただきたいというのが1点目で
す。欠測の発生と連続補完の考え方を教えていただきたいというのが1点目です。
しろまる内田国土交通省総合政策局情報政策課交通経済統計調査室長 御質問ありがとうござい
ます。分布図というのを御用意してないのですが、連続補完がどれくらいかということに
ついては、各欠測の半分ぐらいが1年以上提出されていないという内容になります。
しろまる川﨑分科会長代理 ちょっと確認させていただきますが、資料の9ページ目の1番目の
資料、
2番目の資料もあるのですね、
それに令和2年度の平均欠測率が 10%前後、
乘合9、
貸切 11、特定7と出ているので、これは単月当たりの欠測値ですね。
しろまる内田国土交通省総合政策局情報政策課交通経済統計調査室長 はい。平均欠測率は、令
和2年度における欠測率を平均したものになります。
しろまる川﨑分科会長代理 そうすると、ある月、特定の月を見ると、例えば 100 事業所があっ
たら、9事業所が欠測になっているということなのだろうと思うのです。私がお尋ねした
い趣旨は、
9の事業所が、
例えば翌月2か月続けて欠測になるのがどれぐらいあるか、
翌々
月の3か月続けてなるのがどれぐらいあるのかという趣旨なのです。それが全部ばらばら
入れ替わりながら、ランダムに入れ替わるような感じなのか。それとも、特定の9%がず
っと続いているのかという趣旨なのですが、その辺りはおよその感覚的なことでもいいの
ですが、分かりますでしょうか。
しろまる内田国土交通省総合政策局情報政策課交通経済統計調査室長 平均欠測率は大体9%、
11%と申しましたが、その半分ぐらいが固定してというか、毎回欠測しています。
しろまる川﨑分科会長代理 だから、例えば9%なら、四、五%ぐらいが数か月つながって欠測
になるということですか。
しろまる内田国土交通省総合政策局情報政策課交通経済統計調査室長 さようです。
しろまる川﨑分科会長代理 分かりました。そういうことですね。ただ、そうすると 100%に対
しての四、五%とか、それぐらいの感じだから、あんまり影響は大きくないなというのを
直感的に感じたところで、その点は数字がそんなに大きくなさそうというのを聞いて、多
少安心したところです。
そこで次にお尋ねしたいのですが、これは推計方法の問題よりもデータの利用について
教えていただきたいと思います。この結果数字というのがどれぐらい厳密な利用を求めら
れているかによって、欠測値の補完をどれぐらい厳密にやるかというのは変わってき得る
と思っています。
例えば個別の給付額に連動するとか、例えば過去の例でいえば、毎月勤労統計みたいに
雇用保険の保険料に連動するとなってくると、相当厳密にやっていかないといけないとこ
ろがあるのですが、例えばマクロ経済の動向を把握するとか、およそ経済が上向いている
か、下向いているか、それはスピードがどれぐらいあるか、そういう感覚を捉えるぐらい
だったら、ある程度の誤差は容認できると思うので、そういった利用が、例えば給付や再
配分にリンクするような指標があるのか、あるいはそれはないけども、マクロ経済の分析
に利用されるか、どういうところで利用されるか、あるいは数字の規模を捉えるために利 8用するのか、変化を利用するのか、そのような利用の状況は分かりますでしょうか。そこ
ら辺を考えながら、この議論をどれだけ厳密にするかと考えた方が私はいいように思って
いるので、その利用の実態など、幾つか例などを交えて教えていただいたらありがたいの
ですが。
しろまる内田国土交通省総合政策局情報政策課交通経済統計調査室長 ありがとうございます。
当該数字については、予算とか予算に係る指標とか、そういうものに使われているという
ことはお聞きしておりません。
どちらかというと、
それぞれの業種について当該輸送状況、
輸送量がどういう状況にあるのかということとか、あとは実際モーダルシフトになったと
きに貨物はどういう状況になるのかとか、そういうところの指標ということで使われるの
ですが、具体的に何かの交付金とか、予算のために数字を厳格に見るとどうこうという指
標にはされていないということす。
しろまる川﨑分科会長代理 分かりました。ということは、現在されているようなこのような補
完の方法というのは、精緻化すれば幾らでも精緻化の余地はあると思うのですが、それぐ
らいの程度のことを考えておられるんだったら、この目的にはかなった方法ではないかな
というのが私の感想です。
その上で、
もう2つだけ、
これも感想として申し上げれば、
できるかどうかは別として、
私が直感的にやったらいいのかなと思ったのは、平均よりも変化率の中央値、個別の事業
者ごとの変化率の中央値とか最頻値を使うのが本当はいいのではないかなと思います。こ
こではロジックA・ロジックBとおっしゃっていますが、私の話はロジックCとかDとか
言っているような話ですが、今お見せになっているスライドのもう一つ前にポンチ絵のよ
うなものがありましたけれども、これでいうと、ロジックBで単純平均を取ると、これは
極端に高い値、低い値が出てくる、それも平均を取るわけですが、私はむしろ欠測が起こ
っているところに対しては、一番ありそうなのは中央値だと考えるのがいいだろうと思う
ので、たくさんある中の中央値を取るとか、あるいは分布がある程度きれいな形をしてい
れば、最頻値を取るのが本当はいいのではないかと思います。ただ、恐らくそれをやって
も結果は大きく違わないだろうから、これはあくまでも感想で、やってみるまでのことも
ないのかなとも思っています。これが一つ感想です。
それから、あともう一つ、これも感想で、できたらいいと思うことを申し上げますと、
補完に使う比率をずっと固定していくというお考えですが、計算すれば毎月出せるのに、
どうして毎月出されないのか。毎月出して、それを使っていかれるのが一番フレッシュで
いいだろう、毎月毎月更新していくというのが本当はベストだろうと思うので、固定する
のはあまり賛成できないと思います。ただ、何らかの事情があるのか、それは計算システ
ムとか、そういうところの制約があるのかとも思いますので、もしそうならばもっと頻度
を上げられるように工夫していただくのが重要じゃないかなと思います。
これも感想です。
しろまる内田国土交通省総合政策局情報政策課交通経済統計調査室長 比率を固定というところ
は、連続補完するに当たっては、毎月毎月補完のための推計値が出てきますので、その推
計値を基に、あとは実際に出てきた当該月のその層の事業所の比率なりを使って推計した
数字を使っていきますので、そういう意味では比率は固定というよりは、毎月毎月という 9ことでございます。
しろまる川﨑分科会長代理 わかりました。9ページ目の資料の検証結果で、連続補完によるデ
ータの使用期限は定めずと書いてあるので、何か同じものをずっと固定していくという意
味かなと思いましたが、これは毎月毎月、計算し直しながら、延長していくという意味な
のですね。
しろまる内田国土交通省総合政策局情報政策課交通経済統計調査室長 さようです。それをする
と、その結果が、8ページにあるとおり、推計誤差率が大体 1.0 何とかという、比較的低
い数字で推移するということです。
しろまる川﨑分科会長代理 ここの使用期限は定めずという言葉で何か固定されるというふうに
私は誤解をしてしまったのかもしれないので、その点もう少し分かりやすく教えていただ
けたらと思いますが。
しろまる内田国土交通省総合政策局情報政策課交通経済統計調査室長 評価分科会で以前ロジッ
クBを御説明したときは、使用期限を最大 12 か月目途というふうに期限を定めておりま
した。それに対して、今回は使用期限を定めずというところです。
しろまる川﨑分科会長代理 分かりました。
しろまる菅分科会長 神林委員の方から御意見、御質問を賜りたいと思います。よろしくお願い
いたします。
しろまる神林臨時委員 ロジックAとロジックBの違いについてなんですが、平均を取って変化
率を取るのと、変化率の平均を取るのではばらつきが異なるというのはメカニカルに違い
ますので、どちらがよいのかというのを評価するのは、それほどアドホックにできる話で
はないと思います。
この統計を取るというか、報告する目的が各月の総距離数を計算することにあるのか、
それとも伸び率を計算することにあるのか、どっちを優先して統計を作るのかと関係する
と思いますので、利用する数字の目的に応じて補完の仕方を選んでいくのが正当なやり方
と思います。その利用目的を特定せずに、ロジックAとロジックBを比較して、ばらつき
がどちらが大きいという話で選択する話ではないかなと思います。それが1点。
もう1点は連続補完の話なのですが、これは前提として監査データがあるのですね。そ
れで閉鎖した事業所に関しては、廃業がわかりますので、これは母集団のところ、9ペー
ジの最後のところですが、廃業した事業所については母集団名簿の方からアップデートで
きる。ですので、欠損で補完する事業所は、母集団名簿からは明らかに営業している事業
所ですが、調査票を出してくれていない、回答をしてくれていないのが確定している事業
所ということになるわけですよね。
そういう実際に営業しているのだけれども、調査票を出してくれない事業所があったと
きに、その状態が 12 か月続こうと 25 か月続こうと、しようがない、やっていることは間
違いないけど、調査票は出してくれない、だから補完をし続けましょうという判断だとい
うことになるのではないかと思います。ほかの統計類ですと、母集団の整備がこれほど頻
繁に行われませんので、廃業してしまったから調査票が戻ってこないのか、それともただ
回答拒否を続けているから、調査票が戻ってこないのかが分かりません。ですので、ある 10程度 12 か月とか6か月とか、
連続して調査票が戻ってこなければ、とりあえず廃業したの
ではないかと推測して、サンプルから外すということをやっているのだと思います。
その違いがこの統計の場合にはありますので、調査母集団は行政データで押さえられて
いる、やっているかどうかというのは分かっているということを多分最初の方にちゃんと
書いた方がよいのではないかなと思います。
それでしたら、欠損を補完し続けるのは仕方がないのかもしれないのですが、何ゆえこ
んな 25 か月とか出してくれないのかということは、きちんと別途検証するべきだろうと
思います。つまり、ランダムに出してくれないのであれば平均値でカバーする、あるいは
中央値でカバーするということは多分理論的にも正しいのですけれど、25 か月連続でやっ
ているにもかかわらず絶対出してくれないのは何かある。背後にその要素というか、要因
があるということになると、平均値でリカバーして構わないのか、少し疑問が出てくると
思います。
何らかの特殊な事情があるので、25 か月連続で出してくれないということを考えると、
平均値でリカバーするよりは、例えばもっと裾野あたりというのでリカバーした方がいい
のかもしれませんし、それは別途、特にケーススタディーのような形で少しずつきちんと
情報を集めていって、25 か月連続、12 か月連続欠損を超えた場合には調査員を派遣して、
どうしてこういう状態なのかというのをきちんと把握するということを併せてやった方が
よいと思います。多分やっているのではないかと思いますけれども、以上2点です。
しろまる内田国土交通省総合政策局情報政策課交通経済統計調査室長
まず、どのような指標で使われているかということですが、自動車輸送統計は基本的に
輸送の大きさをメインで見ておりますので、今回のバスの関係ですと、輸送人員とあと輸
送人キロという視点で見ることがほとんどです。
また、25 か月以上とか、12 か月以上出していただけないところすが、調査対象が全事業
所で 4,400 ぐらいです。そのうちの8割以上は回収できていて、残りの部分が未回収でし
て、基本的に毎月督促をしています。母集団名簿はあるのですが、廃業届とかを出してい
ただくタイミングが遅かったりしますので、その中でも調査票が戻ってきてしまい電話を
かけて連絡が取れないとか、あとは実際にホームページとかも調べて載っていないとか、
そのような状況や実質廃業という情報を見極め、それを母集団名簿に反映しています。
しろまる菅分科会長 久我委員いかがでしょうか。御質問、御意見ありましたら。
しろまる久我臨時委員 御説明でロジックA・Bの比較検証ですとか、連続補完によるデータ期
限の検証などをしていただいて、いずれも検証の結果、実際に生じている誤差よりも小さ
く判断できるということで、私の方から方向性について特に異論はありません。また、川
﨑先生、神林先生の御質問で理解も進んだところです。
細かいところで、念のため単純な質問があるのですが、資料の9ページ、2点目と4点
目のところですが、先ほど川﨑先生が乗合 9.0%とか、この辺りを御質問されたのですけ
れども、これは令和2年度における平均欠測率ということですが、過去も大体同程度なの
か、あるいは上昇傾向にあるのかないのか、その辺り、この程度なので、実際の検証結果
よりもこちらが小さいのでという御判断だったので、数値のトレンドというのを教えてい 11ただきたいというのが1点と、同じように御判断の材料として4点目、調査票の回収率が
8割以上と高いのでという御判断なのですが、
こちらもずっと同程度を維持しているのか、
そのトレンドがどうなっているのか、この2点教えていただけますでしょうか。
しろまる内田国土交通省総合政策局情報政策課交通経済統計調査室長 調査票の回収率は、検証
した 25 か月のときに比べて督促等をかなり頑張って実施していますので、以前は 80%を
下回っていましたが、令和2年度の平均は 80%以上で、回収率は上昇傾向です。それに伴
いまして、今まで出していただけなかったところからもいただけるようになっていますの
で、欠測率は減少方向です。
実際事業をやっていて今出てないところに、より一層督促を強化し、欠測率を下げてい
くということと、そもそも1回も出してくれてないというか新たに調査対象となったが出
してくれないところは、一回は出していただき補完により数字に取り込んでいきたいとい
うことですので、引き続き回収率の強化というのはしていきたいと思いますし、それに伴
い欠測率は今後更に下がっていくのではないかと考えています。
しろまる久我臨時委員 今回の判断の根拠としている数値は改善傾向にあって、更に誤差は実際
には減るのではないかということで承知いたしました。
しろまる菅分科会長 山本委員の方から御質問、御意見よろしくお願いいたします。
しろまる山本臨時委員 およそロジックBではなくて、ロジックAを使うということは、私も先
生方と同様、悪いことではないだろうという感触を抱いております。
その上で、質問です。4ページに補完方法がございまして、ロジックAで比率を計算す
る際の様々な調査値の合計は、4月と5月の両方に存在、回答している事業所の場合は、
4月と5月の両方、回答している事業所のみの合計ということでよろしいのでしょうか、
それとも回答したもの全部合計しているのでしょうか。
しろまる内田国土交通省総合政策局情報政策課交通経済統計調査室長 層区分した中で、4月・
5月両方、回答があったところの合計です。
しろまる山本臨時委員 おそらく、基本は伸び率補完というやり方ですね。
それから、コメントが幾つかあります。先生方が気にされていますように、検証結果の
10 ページぐらいのスライドで今御説明いただいていました、乘合が9%、貸切が 11%、特
定が 7.6%の欠測が大体ある中で、回収率は全体 80 を超えておりますが、それらの半数が
1年以上欠測していると御説明いただいたのですが、連続欠測回数の分布があると少し説
得力が増すような気がしました。
最初、川﨑先生の御質問に対して、半数程度が1年を超えるという御説明をいただいた
ような気がしますけれども、特に連続補完によるデータの使用期限は定めないということ
に関して、最大でどの程度長く使うことになるのかということがやはり気になることは気
になります。
ですので、およそどれぐらいの長さの分布になっているのか、月数とか回数でいいと思
うのですが、連続でどれぐらい長くなるのかという分布が気になります。また、回収率で
見ますと、
統計の規模がちょっと分からないので、
例えば走行キロ数や輸送人員に関して、
大きな値を持っている事業所を少ないが落としているのか、それとも小さな規模の事業所 12が多くなっているので、合計を推計している本統計としては先ほど御紹介いただきました
試算結果のように問題がないということなのか。その辺りを今回使用期限を定めないこと
に関して御検討いただいてなくて、ロジックの上のところ、4ポツは全部、BよりAがい
いということだけの報告だと思いますので、総論としての方向に私も異議はございません
が、念のため本当に定めなくて大丈夫なのかということについて、内部でも構いませんの
で、引き続き御検討いただけたらと思いました。これはコメントです。
しろまる菅分科会長 恐らく後半はコメントですので、
それを今後御検討いただくということで、
前半については両方だということで、御回答いただけますでしょうか。前半については、
両方とも回答した事業所について比率を取っているという回答でよろしいでしょうか。
しろまる山本臨時委員 私もそう御回答いただいたと承知しております。
あとは、追加で申し訳ないですが、6ページの伸び率補完してみたという、その辺りの
結果について、
乗合はいいのですが、
中央値がほぼ1というのがよく分かりませんでした。
それはちょっと置いておくとしても、平均値がおよそ 0.5 増しになっていますので、平均
とかRMSEについて計算すると、そもそもこの補完の仕方は結構大きい方に偏っている
ことになりますよね。
気になりましたのは、平均値の方が第3四分位よりも大きいことが多く、とても大きい
値が結構出て引っ張っているのではないかと思いました。第3四分位まで超えることはた
とえば正規分布だとあまりないように感じます。それでRMSEを比較されているのです
が、これはもしかしたら偏りと分散に分けて検討するのが本来よかったのかもしれないと
いう印象を抱きました。これはコメントです。
しろまる内田国土交通省総合政策局情報政策課交通経済統計調査室長 御指摘いただいて、引き
続き見ていきたいなと感じたところです。偏りと分散、コメントとして承りまして、何か
分かることがあれば、我々の中でももう少し調べられれば調べていきたいと思います。
しろまる菅分科会長 これについては、再度、国土交通省さんの方でちょっと検討していただい
た方がいいと思います。これで大丈夫かなということを。
しろまる山本臨時委員 おそらく偏りがとてもある分布なので、平均で平均を当てるのは難しい
状況だと思います。例えばどちらが望ましいという議論をする意図は私にはなくて、どち
らもそれほどよくないかもしれません。その中で悪くない方を取っているとすると、結論
は一緒になります。そういう意味で少し御検討いただきたいという程度です。この資料そ
のものを見て、どっちもよくないのではないか、他を考えなさいという意図は私の発言に
はありません。
しろまる菅分科会長 では、そのようによろしくお願いいたします。
以上、先生方の御質問、御意見を賜りました。川﨑委員の方からは、それほど大きくな
いのではないか、クリティカルではないのではないかと。連続補完というのがちょっと分
かりづらいということと、具体的に連続補完の分布がどうなっているのかということが重
要ではないかということで、これについては山本委員からもそれがあった方が説得力があ
るのではないかということでした。
もう一つ、川﨑委員から御指摘がありましたのは、データの利用との関係が重要で、ど 13れくらいの厳密さが求められるのかということで、これに関しては交付金給付とのリンク
がないので、それほどの厳密性は今のところ求められていないということでした。
また、神林委員からは、AとBのどちらがいいのかを考えるときに、アドホックではな
くて目的に応じて考えるべきで、レベルなのか、それとも変化率なのかということで、こ
れについてはレベルであるという回答でした。また、廃業について行政記録で把握してい
るということだが、連続的に回答がないのであれば、それについてはよく調べるべきでは
ないかという御意見でした。
久我委員からは、欠測率に関して令和2年だけ載っているが、過去はどうなのかという
こと質問があり、国交省よりは過去は 80%よりも更に低かったという回答があり、これに
ついては改善傾向にあるということは評価できるということでした。
山本委員から質問としては、そもそもこの比率は両方回答した、要するに継続標本で計
算しているのか、そうでないのかという質問があり、国交省からは継続標本であるという
回答があり、また、分布の特性についてもう少し検討、特に大きな事業所の値等を検討す
べきではないかというご意見がありました。
しろまる川﨑分科会長代理 1点だけ、神林さんがおっしゃったことはすごく大事なので、改め
て私の方からも強調してお願いをしたいことがあるので、申し上げます。
それは廃業の確認です。というのは、これは既にお話しになったことですが、廃業され
たところを誤って補完をやってしまうと、総数が伸びてしまいます。一体いつ廃業したの
かというのが実は結構問題で、廃業した、していないというところで1事業者分、過去の
数字がそのまま載る載らないでゼロになるのは、大きな違いが出てくるわけですので、こ
こは相当丁寧にされないとまずいだろうと思います。
これは許可業種ですので、登録を抹消したら廃業かというと、私はひょっとしたらそう
でなはいのではという気がしています。
調査項目は企業の業績のようなものですから、
徐々
に売上げが、あるいは顧客が減少しているところは長期低落傾向があって、あるところで
極めてゼロに近づく、あるいはゼロだけども、登録抹消もしないということが起こってい
るかもしれない。しかもそこに未回答が重なると、これは過去の数字をそのまま載せたこ
とになるので、補完すると、過大になってしまいます。
そういう意味で、未回答の事業所に対してそのような長期低落傾向がないかとか、少し
パネルデータ的にフォローして、そのような閉業間際のものを誤って補完するということ
のないように、チェックはしっかりしていただかないと、これは総数に響くのではないか
と思いますので、その辺を是非頑張っていただきたいというのがお願いです。
しろまる菅分科会長 これは廃業確認等について、休業との違いが微妙なのですが、それについ
てちょっと慎重に、単に補完するのではなくてということだと思います。
しろまる内田国土交通省総合政策局情報政策課交通経済統計調査室長 毎月督促という行為は、
4,400 事業者の一部でございます、督促はしておりますので、そのときに状況、実際やっ
てなければ、やってないから送らないでくださいとか、そういう話はいただきますので、
その中でおおよそ実態は把握できるのかなと思っております。
しろまる神林臨時委員 この統計のとりあえずの目的が総キロ数であったとすると、例えばロジ 14ックAを使うときに、今、山本委員の質問に対する回答として4月と5月、あるいは両方
存在した事業所に関してのみ使って、補完するための数字を作るということになっている
と思うのですが、4ページの図を見ると分かりやすいですね。総距離数であれば、4月に
存在して、5月に廃業してしまったという事業所も、4月には走っていたわけですよね。
逆に5月に新しく開業した事業所も5月に走っているわけですので、
その情報は使わずに、
補完数字を作ることになります。
こういうバランスしたパネルで作るのであれば、ロジックAとロジックBはそれぞれの
レベルのシェアと伸び率がどう相関するかによって答えが変わってくるだけなのですが、
ロジックAを使うメリットのもう一つは開業した事業所、廃業した事業所の情報を使える
ということだと思います。こういう事業所は伸び率は計算できませんから。ですので、ロ
ジックBでは使えないのですが、ロジックAでは使える。
回答してくれた事業所の総距離数を各月で計算をして、その比率を取って、回答がなか
った事業所の伸び率というのをそこから推計してあげるという計算の仕方もあり得ると思
います。そちらの方が情報としては全部使っていますので、統計的な精度というよりはロ
ジカルな精度が上がっていると思います。使える情報を使っていますので。ですので、こ
こはほかの先生方の御意見も交えて検討していただければと思います。
しろまる菅分科会長 要するに片方が存在しなかったら、次の月で存在した場合どうするか、あ
るいは逆のケースですね。
しろまる神林臨時委員 似たような企業、似たような走向距離数の事業所が出たり入ったりして
いれば、結局倍数にしていますので、関係がない。違うかな、全部総足しているから、ち
ょっと関係しますね。ただ、入ってきた事業所はおそらく大きいですよね。廃業する事業
所は、おそらく、廃業直前はあまり走ってないですね。というようなことを考えると、総
距離数を計算するときに両月に存在している事業所だけで計算するのと、単月にそれぞれ
存在した事業所の総距離数を計算するのでは結果が異なってきますので、後者を計算する
とどれだけ変わるのかというのをきちんとフォローしておくべきだろうと思います、ほか
の先生方もし御意見があればお聞きしたいのですが。
しろまる菅分科会長 確かにおっしゃるとおり、前の月はなかった、今回入ってきたという情報
もその次の月から入ってくるので、最初の1か月は稼働がそれほど、例えば1日から稼働
していれば確かにそうだけども、例えば月の半ばで稼働すると半分ぐらいなので、そこは
ちょっと処理が難しいかなとは思いますが、どれくらい参入・退出があるのでしょうか。
しろまる内田国土交通省総合政策局情報政策課交通経済統計調査室長 具体的な数字というのは
持ち合わせてないのですが、乗合とかはそれほど出入りがあるということは考えにくいか
なと思っています。こういうコロナ禍でありますので、参入が多いかというとそういうこ
とはなくて、
廃業の方が多いというのはまず言えます。
乗合については基本的に乗合バス、
町なかで走っている事業所でございますので、そういう意味ではすぐ廃業という話にはな
りにくいということです。貸切については、世の中のトレンドによって増えたりとか、コ
ロナ禍だと実質廃業というか、動かないとか、そういうことがありますので、貸切につい
ては、今の状況ですと、廃業の方向での出は多いのかなと考えています。 15しろまる菅分科会長 参入の方は、貸切の方は出入りがあるので、その影響はもう少し検討した
方がいい感じはありますね。要するに無回答の場合、それはどういう状況なのかという、
それは本当に廃業と言えるのか、単なる休業なのかとか、特にコロナなどの場合、あり得
ますね。それを単純に補完していいのかということと、その辺りの情報をちょっと検討す
る余地はあるのかもしれないということですね。
つまり、
参入・
退出の状況に関するデータがないと何とも言えないところがありますが、
検討した方が、要するに乗合に関してはまずあまりないと思いますが、貸切は確かにあり
得るので、それはちょっと慎重に、例えばコロナなどのときはどうなっているのか、それ
を単純に欠測値地として補完していいのかというのは少し疑問の余地はありますね。
神林委員。今の議論なのですが。特に答えがあるわけではないのですが、参入・退出の
状況に関する情報がないと議論しづらいところはあると思いますけれど、乗合に関しては
あまりない。貸切についてはかなりあり得ると。そこについてもう少し参入・退出状況を
見て、ほかの方法を検討した方がいいとは言えると思いますけど。
しろまる神林臨時委員 そのときに、参入・退出の件もそうなのですが、ターゲットにしている
のが総距離数で、退出した事業所が退出する前に持っていた距離が問題ですので、事業所
の数で何%とかいうのではなくて、500 キロ分いなくなりましたとか、800 キロ分いなくな
りましたとか、500 キロ分新たに入ってきましたとかいう、その数字でのシェアがもっと
クリティカルになるのではないかなと思います。
いずれにしても回答率が8割超えていますので、総計してしまうとすごい数のストック
が既に計算されていますから、よっぽどすごい事業所が出たり入ったりしない限りは、総
計はそう簡単に動かないと思いますので、計算してみたら微妙に変わるだけだとは思いま
す。けれども、方法として正しい方法を考えるべきだろうと思います。ロジックAであれ
ば、
存在した事業所を全部総計する方が自分は正しいのではないかと思います。
山本委員、
どうでしょうか。
しろまる山本臨時委員 私に特に答えは持ち合わせておりませんで、1事業所当たりに基準化し
て伸び率を計算するのと、先生おっしゃいましたように市場規模なので、合計で計算する
のとどっちがいいかなというぐらいの悩みで、今の話を伺っていました。しかし、もし今
後、補完方法についてさらに検討していただく、つまり言い換えると、改善していただく
余地があるとすれば、単に両方ある共通事業所の伸び率だけではないやり方もあるような
気はしております。
しろまる川﨑分科会長代理 今の御議論は大変参考になりました。私は、どちらかと市場規模に
連動するというのが原則としていいと思っています。そういう意味で全部合計同士での比
率でいいのではないかと思いますが、ただしそれにはやっぱり前提があって、要するに無
回答という現象が業績と連動しているかどうかというのが問題だと思い、あす。結局、業
績低落中のところにそれを全体の平均と同じように伸ばしたら、これはやり過ぎになるわ
けですよね。
ですから、先ほど神林さんもおっしゃったように、無回答が全くランダムに発生して、
消えてはまた戻ってくるみたいな現象が起こっているときであれば、私は今のような方式 16でいいだろうと思うのですが、ただ分析してみて、明らかに低落ぎみの事業者ばかりが無
回答だというときには、総計の比率方式はやり過ぎになる可能性はあると思うのです。
ですので、むしろ国土交通省の方々にお願いしたいのは、今すぐということではなく、
これはちょっと分析に時間かかることだと思うのですが、例えばこれ 4,000 ぐらいの事業
所なので、データをパネル化するのは多分それほど難しくないだろうと思うので、一度パ
ネル化して、欠測の発生とか戻り方とか、あるいは業績のアップダウンのトレンドみたい
なものを少し見ていただくとか、そういう分析を少ししていただいた上で結論を出してい
くのがいいのではないかと思うので、非常に大事な指摘を今神林委員にしていただきまし
たので、そこはデータがない以上はここの議論だけで結論が出ないということだと思いま
すので、そういうことをしていただけたらと感じました。
しろまる菅分科会長 いかがでしょうか。継続標本だけではなくて、比率を取るべきだという選
択肢もあるということで、それについてはパネル化して、実際に実験してみないと何とも
言えないということで、今後御検討いただけたらということでよろしいでしょうか。
しろまる内田国土交通省総合政策局情報政策課交通経済統計調査室長 持ち帰らせていただいて、
検討をまずさせていただければと思います。
しろまる菅分科会長 そうですね。いかがでしょうか。そのほかに議論ありますでしょうか。御
意見等。
しろまる川﨑分科会長代理 この議論、どこで終止符を打つか、コンクルージョンするかという
のは非常に難しいと私は思うんですが、正直言いますと、補完の推計というのは改善して
いこうと思えばいろいろな改善の余地があるわけで、これで終わりということは多分ない
のかもしれないです。
ただ、だからといっていつまでも延々とやっていくのも、これまたリソースを幾らでも
食ってしまうことになるので、程々でやらなければいけないと思うのです。ですので、私
自身は今のロジックAを採用するということと、それから特に山本委員がおっしゃったよ
うな期限なしにやっていくのが本当にいいのかというのはちょっとペンディングだという
ことにしつつ、そのうえで、大きな結論として私はこれで了解ということで、ただ今後、
国土交通省御自身の検討課題として、今出たようなことを更に改善の余地はないかという
ことを常に見直していただくことが大事ではないかと思いますので、これは欲を言えば、
どんどん精度を上げていく方向はまだまだあり得ると思うので、そこはエンドレスに、私
自身この場で国土交通省に求めていくというほどのことではなく、むしろ御自身の努力で
頑張っていただきたいと感じたということです。
しろまる菅分科会長 まとめていただきまして、ありがとうございました。私もこれはちょっと
限界があるだろうとは、もともと補完ということ自体に限界があるということと、2つの
方法でそれほど大きな違いが出るはずがないというのも思いますので、ロジックAで継続
していただいて、ただし今回のケースに関しては、当初の評価分科会の説明と実際の運用
が違ったというのは問題だったと思う。むしろそちらの方が問題で、意思疎通ですね、何
をやっているのかということに関してこういうことがないように十分にお願いいたします。
川﨑委員からまとめていただいた形ですけれども、本件に係る国土交通省の対応に関し 17て、大きな方向性としては問題ないという形だろうと思いますが、考え方としてはより整
理すべきところがあるような御指摘をいただいたと思いますが、おおむね妥当であると評
価したいと思います。そのような形でよろしいでしょうか。特に問題ないでしょうか。
なお、今回の検証の中で示された数値について、念には念を入れて、誤り等がないかも
う一度確認するよう、国土交通省さんにはよろしくお願いしたいと思います。
大変有意義な議論だったと思います。予定されました議事が終了しましたので、本日の
分科会はここまでとさせていただきます。
最後に、事務局から御連絡事項をお願いします。
しろまる福田総務省統計委員会担当室室長補佐 次回の日程につきましては、後日、日程調整を
させていただきたいと思っております。
しろまる菅分科会長 本日はこれまでといたします。皆様には大変お忙しいところ、審議に御協
力いただきましてありがとうございます。感謝いたします。ありがとうございました。
それでは、これにて終了したいと思います。

AltStyle によって変換されたページ (->オリジナル) /