欧州疾病予防管理センター (ECDC) の COVID-19 のケース
欧州疾病予防管理センター (ECDC) が提供する、COVID-19 のケースの感染者の世界の地理的分布の最新の公開データです。 各行/エントリには、日あたり、国または地域あたりの新規感染者数が含まれています。
注意
Microsoft は、Azure Open Datasets を "現状有姿" で提供します。 Microsoft は、データセットの使用に関して、明示または黙示を問わず、いかなる保証も行わないものとし、条件を定めることもありません。 現地の法律の下で認められている範囲内で、Microsoft は、データセットの使用に起因する、直接的、派生的、特別、間接的、偶発的、または懲罰的なものを含めたいかなる損害または損失に対しても一切の責任を負わないものとします。
このデータセットは、Microsoft がソース データを受け取った元の条件に基づいて提供されます。 データセットには、Microsoft が提供するデータが含まれている場合があります。
データセット
データセットの編集版は、CSV、JSON、JSON-Lines、Parquet 形式で入手でき、毎日更新されます。
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
すべての編集済みバージョンには iso_country_region コードと読み込み時間が追加されており、小文字の列名とアンダースコアの区切り文字が使用されています。
生データ: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
以前のバージョンの編集済みデータおよび生データ: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
データ ボリューム
2020 年 5 月 28 日時点で、19,876 行 (CSV 1.5 MB、JSON 4.9 MB、JSONL 4.9 MB、Parquet 54.1 KB) が含まれています。
データ ソース
生データは、毎日 ECDC の csv ファイルから取り込まれます。 このデータセットのオリジンを含む詳細については、ECDC のデータ収集に関するページを参照してください。
データ品質
ECDC はデータの正確性と適時性については保証しません。 免責事項をお読みください。
ライセンスと使用権、帰属
本データは、こちらの ECDC 著作権ポリシーで許可された範囲内で利用することができます。 著作権が第三者に帰属する文書の複製許可については、著作権者の許諾を得る必要があります。
このデータの提供元として ECDC が常に明示されている必要があります。 この明示は、資料の各コピーに含める必要があります。
Contact
ご質問がある場合や、このデータセットおよび COVID-19 Data Lake の別のデータセットについてのご意見がある場合は、お問い合わせくださいaskcovid19dl@microsoft.com。
[列]
Name | データ型 | 一意 | 値 (サンプル) | 説明 |
---|---|---|---|---|
cases | smallint | 5,515 | 1 2 | 報告された感染事例の数 |
continent_exp | string | 6 | ヨーロッパ アフリカ | 大陸名 |
countries_and_territories | string | 214 | カナダ ベルギー | 国または準州の名前 |
country_territory_code | string | 213 | KOR ISL | 3 文字の国または準州のコード |
date_rep | date | 350 | 2020-12-11 2020-11-22 | レポートの日付 |
day | smallint | 31 | 14 13 | 月の日付 |
deaths | smallint | 1,049 | 1 2 | 報告された死亡者数 |
geo_id | string | 214 | CA SE | geo 識別子 |
iso_country | string | 214 | SE US | ISO 3166 国または地域コード |
load_date | timestamp | 1 | 2021-04-26 00:06:22.123000 | データが Azure に読み込まれた日付 |
month | smallint | 12 | 10 8 | 月の番号 |
year | smallint | 2 | 2020 2019 | Year |
プレビュー
date_rep | day | month | year | cases | deaths | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | アフガニスタン | AF | AFG | Asia | 2021/4/26 午前 12:06:22 | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | アフガニスタン | AF | AFG | Asia | 2021/4/26 午前 12:06:22 | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | アフガニスタン | AF | AFG | Asia | 2021/4/26 午前 12:06:22 | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | アフガニスタン | AF | AFG | Asia | 2021/4/26 午前 12:06:22 | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | アフガニスタン | AF | AFG | Asia | 2021/4/26 午前 12:06:22 | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | アフガニスタン | AF | AFG | Asia | 2021/4/26 午前 12:06:22 | AF |
2020-12-08 | 8 | 12 | 2020 | 200 | 6 | アフガニスタン | AF | AFG | Asia | 2021/4/26 午前 12:06:22 | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | アフガニスタン | AF | AFG | Asia | 2021/4/26 午前 12:06:22 | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | アフガニスタン | AF | AFG | Asia | 2021/4/26 午前 12:06:22 | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | アフガニスタン | AF | AFG | Asia | 2021/4/26 午前 12:06:22 | AF |
データ アクセス
Azure Notebooks
このノートブックには、Azure Blob Storage にホストされているさまざまなデータセット ファイル形式の欧州疾病予防管理センター (ECDC) の COVID-19 のケースのデータセット URL にアクセスするための URL とサンプル コードが記載されています。¶ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Pandas の組み込みのダウンロード機能を使用して、データセット ファイルを http URL からダウンロードします。 Pandas には、次のようなさまざまなファイル形式のリーダーがあります。
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
このプラットフォームとパッケージの組み合わせでは、サンプルは利用できません。
Azure Synapse
このプラットフォームとパッケージの組み合わせでは、サンプルは利用できません。
例
このデータセットの使用例を参照してください。
- Synapse SQL サーバーレス エンドポイントを使用して COVID データを分析する
- Azure Synapse Analytics での SQL エンドポイントを使用した COVID データの線形回帰分析
次のステップ
Open Datasets カタログの残りのデータセットを表示します。