2019年7月5日金曜日

第13回 甲状腺検査評価部会 中間とりまとめ(案)およびその前提について
(Typoなどは適宜訂正した)

2019/7/5 いろいろ問題があると考えられるので、下記の趣旨のメールを関係者に送信(相手によって文面などは変更)。


 健康調査検討委員会および甲状腺検査評価部会における議論ありがとうござい ます。
先日の会議および資料
http://www.pref.fukushima.lg.jp/site/portal/kenkocyosa-kentoiinkai-b13.html
資料1-2 市町村別UNSCEAR推計甲状腺吸収線量と悪性あるいは悪性疑 い発見
率との関係性," 第13回甲状腺検査評価部会

を拝見したところ、以下の方法論的な問題があるように思います。とりまとめ の前に再分 析もしくは追加分析すべきだと考えますので、メールさせていた だきます。
ご検討の程よろしくお願い致します。

1)結論について
資料3 甲状腺検査本格検査(検査2回目)結果に対する部会まとめ(案)では次のように述べられています。

「線量としては、暫定的に原子放射線の影響に関する国連科学委員会(UNSCEAR) で公表された年齢別・市町村別の内部被ばくを考慮した推計甲状腺吸収線量を 用いた。 その結果、線量と甲状腺がん発見率に明らかな関連はみられなかっ た。」

 これは、6-14歳を分析した場合には線量と悪性もしくは疑い発見率との関係 は有意ではない。一方、15歳以上を分析した場合には、「負」で有意な関係がある という結果であるためのようです。
 特に後者は質疑応答で大平先生が回答されていたように、常識とは異なる結 果であり、分析自体の妥当性を問うべき問題だと考えます。
 少なくとも全員もしくは6歳以上をプールしたデータで再分析し、それよりも 今回の分析の方がモデルの適合度が高いことを示すべきだと考えますがいかが でしょうか。

 以下具体的に問題点をさせていただきます。

2)対象者を分割した分析について
 0-5歳児を除き、6-14歳、15歳以上に分けてそれぞれについて、分析されて います。これは、UNSCEARの線量が、1、10,成人(20歳)について推定されてい るためでしょうか。
 このようにサンプルを分割すると、statistical powerが低下することは自 明です。
 さらに、UNSCEARの甲状腺吸収線量推定値は、被曝時年齢と負の相関があり ます。例えば、いわき市の1歳、10歳、成人(20歳)の推定値はそれぞれ、 51.9、31.2、17.4(mSv)です。
 このように、被曝時年齢で分析対象を分けることは、被曝量の大小によって サンプルを分割することに等しくなっています。実際、資料の横軸をみても、 6-14歳では、20mGy未満から30mGy以上までの4区分となっているのに対して、 15歳以上では10mGy未満から20mGy以上までの4区分となっています。
 ロジスティック回帰を含む、一般化線形モデルの係数の推定値の検定量(t値 もしくはz値)は説明変数の分散の平方根に比例しますので、線量の範囲を限定 すると、分散も小さくなり、さらに検定力が低下します。
 全員のデータを用いた分析を行うべきだと考えます。

 少なくとも、現在のように分割して推定したモデルと、全データをもちいた 結果のあてはまりをAICなどで比較して、どちらが適合度が高いかを比較すべ きでしょう。

3)線量をカテゴライズした分析について
 線量は連続量ですが、4区分されたようです。関数型を探索するために、こ のような分析をすることは妥当ですが、線量の値をそのまま使った推定も行 い、それとの比較もすべきだと考えます。

4)必要な情報の明示
 分析の基礎となる、各線量毎の対象者人数、罹患数、さらに、資料には示さ れていませんがトレンド検定もされたとのことです。その検定結果や、スコア の与え方についての情報もありません。
 2巡目については、(1)性・検査時年齢、(2)性・検査時年齢・検査年度、(3)性・検査時年齢・検査間隔、(4)性・検査時年齢・検査間隔・検査年度といっ たモデルを推定されています。それぞれのモデルの適合度を明示し、最良のモ デルを選択すべきだと考えます。
 そのためには各モデルの推定値のみならず、尤度、AICなども明示すべきだ と考えます。これら必要な情報を明示して頂けないでしょうか。

5)結果の解釈
 部会でのやりとりによると、トレンド検定もされ、15歳以上、(4)性・検査時年齢・検査間隔・検査年度調整モデルでのみ、負で有意な結果が得られた とのことです(最大、最小値ともに)。
 これは常識と反する結果なので、無視するといった応答をされていますが、 ホルミシス効果など、この結果を活用しようとする者も現れる可能性があります。
 このような結論をだされるのであれば、上述のように、全体を用いた分析よ りも、今回のように分割した分析の方がモデルの適合度が高いこと、線量連続 よりもカテゴリ化した方がモデルの適合度が高いことを示すべきだと考えます。
 同様に(1)から(4)のモデルのなかで、(4)が最良であること、さらに、(検査 時)年齢、検査年度、検査間隔は相関しているはずですので、多重共線性の問 題が生じていないことも確認すべきです。

 これらの観点からも再分析および追加分析をして頂く必要があると考えます。
是非ともご検討の程よろしくお願い致します。

濵岡豊
慶應義塾大学商学部