化学物質特性予測システムの検証結果

   予測システムの予測的中率を以下に示します。現時点では計算できる物質に関してすべて表示しています。トレーニングデータとバリデーションデータの構造の相違による適用範囲は考慮していません(今後検討予定)。

1.生分解性予測
   本システムのトレーニングデータ(1054物質)は平成12年度までに得られた化審法既存化学物質安全性点検の結果を使用しています。バリデーションデータ(200物質)は平成12年度以降の既存点検結果を使用しています。

   標準条件の分解度試験(MITI(I)法:BOD分解度)により実測値を易分解性(BOD分解度60%以上)、中程度分解(BOD分解度10-60%)及び難分解性(BOD分解度10%未満)に分類しています。テストガイドラインではBOD分解度60%以上を易分解とするので予測的中率の計算では中程度分解と難分解性を難分解としています。予測値と実測値の比較から予測的中率を算出しています。

表1.経験則フローの予測的中率
予測 予測困難
実測 42 5 7
1 17 7
1 117 3
的中率 42/44
(95.5%)
134/139
(96.4%)
17/200
(全体の8.5%)
全体の8.5%が予測困難でありそれ以外は95%以上の的中率であった。

   予測困難物質とは現時点で類似構造情報が非常に少なく易・難分解性を予測できない物質です。例えばアミド基を有する物質はアミド基以外の置換基の組み合わせ情報が少なく現時点で易・難分解性の予測をすることができません。生分解性の正因子・負因子が混在する物質と正因子・負因子の両方が存在しない物質も予測困難となります。詳細は今後公開予定の経験則フローをご覧ください。

   次に、予測失敗した7物質を表2に示します。
表2.経験則フローの検証で予測失敗物質

構造式 予測 実測 備考
1 アルキルスルホン酸類
未公表物質
逆転条件で試験中
メタンスルホン酸・アルケンモノスルホン酸は易分解
2 ピロール、イミダゾールは易分解
類似構造情報が少ない
3 BOD分解度60%以上
t-BuOHが残留
化審法は難分解判定
4 水中でゆっくり変化
類似構造情報が少ない
5 予想変化残留物であるジエチレングリコールは標準条件で中程度分解
6 BOD分解度60%以上
ペンタエリトリオールが残留
化審法は難分解判定
7 ベタイン類
類似構造情報が少ない

   表中の化学物質2,4,7はトレーニングセットに類似構造を有する物質が少なかったため予測失敗していると考えられます。化学物質1の類似物質は予測が易分解性ですが実測は分解速度が遅く標準条件では中程度分解でした。化学物質3,6は予測システム開発時の易分解性の判断基準にしている実測BOD分解度が60%以上であり、易分解性物質として取り扱っていますが、実際の試験では難分解性の変化残留物があり難分解性物質として取り扱われています。したがってBOD分解度だけを基準に見ると予測失敗ですが、環境中運命等を考慮した場合予測的中とみなすことができます。

表3.SAR式の予測的中率
予測
実測 32 13 9
12 6 7
14 21 86
的中率 32/58
(55.2%)
6/40
(15.0%)
86/102
(84.3%)
  易分解性の予測的中率が55.2%、難分解性予測でも的中率は84.3%と経験則より低い結果でした。今回の検証ではSAR予測式の適用範囲を規定していないため、予測した物質と予測に使用された予測式を確認し、今後適用範囲を考慮した予測的中率を検証する予定です。

2.生物濃縮性予測

本システムの予測的中率は100%ではありません。したがって、必ず予測失敗物質が存在することを十分考慮した上で使用しなければなりません。

本システムの濃縮性予測トレーニングデータ(580物質)は平成12年度までに得られた化審法既存化学物質安全性点検の結果を使用しています。バリデーションデータ(92物質)は平成12年度〜平成18年度に得られた既存点検結果を使用しています。

生物濃縮倍率(BCF)の実測値は低濃縮性の目安として1000倍未満、高濃縮性の目安として5000倍以上及び1000倍から5000倍の間に分類しました。

BCFの予測は定性的な低濃縮性予測(解離性物質や高分子量物質等)と計算logPowから定量的にlogBCF予測値の実数を算出した定量的予測を実施しました。

定量的な予測の検証ではBCFの実測値と予測値をBCF1000倍未満、1000倍以上5000倍未満、5000倍以上に分類して、予測値が実測値と同じBCFの範囲内にある場合を予測的中としました。予測値が実測値よりも大きい場合をフォールスポジティブ、予測値が実測値よりも小さい場合をフォールスネガティブ(FN)としました。

また、検証で用いたlogPow値はKowwinによる計算値です。

表4.濃縮性予測の検証結果
濃縮ver.2.18
(検証データ)
定性予測 logPow-logBCF相関による定量予測 予測
困難
特定率
BCF<1000 <1000 1000〜5000 5000<


B
C
F
<1000 32 33 3 0 8 76 73.9%
(68/92)
1000〜5000 0 1 0 2 4 7
5000< 0 1 0 3 5 9
32 35 3 5 17 92
的中率 100%
(32/32)
94.3%
(33/35)
0%
(0/3)
60.0%
(3/5)
18.5%
(17/92)
83.7%(36/43)
90.7%(68/75)

  ■はフォールス・ネガティブを示す

 

図1.濃縮性予測 検証フロー

予測値が実測値より小さいFNは2物質で、クロロシクロペンタジエン類及び六塩化ブタジエン(87-68-3)でした。表5にFNの2物質を示します。

表5.濃縮予測 ver.2.18のフォールス・ネガティブ2物質

  構造式 logPow
計算値
実測値(手法)
実測
logBCF
(BCF)
予測
logBCF
(BCF)
実測値と予測値との差
1 クロロシクロ
ペンタジエン類
未公表物質
4.63
4.89(SF)
5.04(HPLC)
3.62
(4200)
2.76
(570)
0.86
2
87-68-3
4.72
5.1(SF)
4.8(HPLC)
3.88
(7630)
2.83
(670)
1.05

  * SF(フラスコ振とう法)、HPLC(HPLC法)

BCF予測の検証で予測困難物質はlogPowが7以上及びフッ素化合物でした。表6に予測困難で実測BCFが5000以上であった5物質を示します。

表6.予測困難物質

構造式 実測BCF(logBCF) 予測 計算値
1 ポリブロモ化ビフェニル類
未公表物質
22000(4.34) 困難 8.21
2 ポリブロモ化ビフェニル類
未公表物質
11000(4.03) 困難 9.1
3 パーフルオロカルボン酸類
未公表物質
19000(4.27) 困難 12.1
4 パーフルオロカルボン酸類
未公表物質
10000(4.00) 困難 10.2
5 パーフルオロシクロヘキサン類
未公表物質
7700(3.89) 困難 4.75