日立と損保ジャパン日本興亜、 全国初、さいたま市でAIを活用したインフルエンザ予報サービスの実証を開始
今日は、回帰について学んでいきましょう。
まずは、日立が12月4日にプレスリリースした以下の記事からどうぞ。
インフルエンザの流行状況をお知らせするほか、予防に役立つ関連情報も配信
日立と、損保ジャパン日本興亜は、このたび、さいたま市において、AIを活用し、インフルエンザの流行状況を予測・情報配信するサービスの実証を、2019年12月6日から開始します。
本サービスは、日本医師会ORCA管理機構が全国4,000以上の協力医療機関から提供を受けた、インフルエンザを含む感染症の罹患者数データを市区町村別に纏めた「ORCAサーベイランス」を用いており、医療機関の提供データに基づいた高精度な予報サービスです。なお、インフルエンザなど感染症予報に関する実証を自治体規模で行うことは、全国で初めての取り組みとなります。
今回の実証では、今後流行が予測されるインフルエンザの罹患率の低下に向けて、さいたま市における4週間先までのインフルエンザの流行度合い(レベル0~レベル3)を予報する住民向けWebサイトを立ち上げ、公開します。
情報元:
https://www.hitachi.co.jp/New/cnews/month/2019/12/1204.html
住民向けWebサイト
※Webサイトを見る限り、1週間に1度更新するとなっている。その日の天候により感染のしやすさは変化すると思われるので、感染者数の推移とその日の天候で予報しないのだろうか。また、子供、大人でも感染者数にばらつきがでるのではないだろうか。感染経路を見つけるくらいのことができないとあまり、AIを使用しているとはいえないのではないだろうか。
【解説】回帰
蓄積されたデータから機械が関係性を読み取り、新しいデータや未来のデータを予測する方法です。株価の予測や売り行きなどの連続値になります。
回帰の種類
- 線形単回帰
- 線形重回帰
- ラッソ回帰
- リッジ回帰
- ElasticNet回帰
- 非線形
- 時系列
回帰のコード
時系列モデルの中で統合的な SARIMA のコードを以下に示します。
import statsmodels.api as sm
# SARIMAモデルを適用する
fit_SARIMA_flu = sm.tsa.statespace.SARIMAX("データ",order=(0, 0, 0),seasonal_order=(0, 1, 1, 12)).fit()
# predに予測データを代入する
pred = fit_SARIMA_flu.predict("2019-12-31", "2020-3-31")