SIGNATE レンタル自転車利用者数予測 に投稿しました 1位 2020/03/01

2020年11月29日

日本のデータサイエンス訓練サイトSIGNATEに投稿しました。ここでは、PJの内容についてとランキングをお知らせしたいと思います。

概要 今回投稿した概要 投稿リンク 暫定評価は 0.98667 斉藤建一

 

レンタル自転車の利用者数予測季節情報や気象情報から、レンタル自転車の利用者数を予測しました

2年間の季節情報や気象情報から、各日の1時間ごとのレンタル自転車の利用者数を予測するこのモデルを作成していただきます。 昨今、観光地や都内でもレンタル自転車を見かける機会が増えてきました。
目的地周辺の散策に便利で、お財布にも優しいレンタル自転車の利用は今後も増えていくと考えられます。

データ概要

課題種別:時系列
データ種別:多変量
学習データサンプル数:8645
説明変数の数:13
欠損値:無し

データ説明


学習用データ(train.tsv)、評価用データ(test.tsv)

カラム ヘッダ名称 データ型 説明
0 id int インデックスとして使用
1 dteday date 日付(2011-01-01~2012-12-31)
2 season int 季節(1=春, 2=夏, 3=秋, 4=冬)
3 yr bit 年(0=2011, 1=2012)
4 mnth int
5 hr int 時間
6 holiday bit 祝日(1=祝日)
7 weekday int 曜日(0=日, 1=月…6=土)
8 workingday bit 平日(0=平日, 1=祝日)
9 weathersit int 天気(1=晴,やや曇り, 2=薄い霧+曇り,霧+千切れ曇,霧+やや曇り,薄い霧, 3=小雪,小雨+雷雨+千切れ曇,小雨+千切れ曇, 4=大雨+凍雨+雷雨+霧,雪+濃い霧)
10 temp float 規格化した温度(摂氏)((t-t_min)/(t_max-t_min), t_min=-8, t_max=+39)
11 atemp float 規格化した体感温度(摂氏)((t-t_min)/(t_max-t_min), t_min=-16, t_max=+50)
12 hum float 規格化した湿度(最大値の100で割った値)
13 windspeed float 規格化した風速(最大値の67で割った値)
14 cnt int 利用者数

※黄色く色付けされた変数が目的変数です(評価用データには含まれません)

 

応募用サンプルファイル(sample_submit.csv)

列目に評価用データの”id”を、2列目に予測した使用者数を記入したファイルを、ヘッダ無しcsv形式で投稿ください。

カラム ヘッダ名称 データ型 説明
0 無し int インデックスとして使用
1 無し int 予測した利用者数

弊社では、データ分析依頼企業を募集しています。
お気軽にご相談ください。092-437-1110 

レンタル自転車利用予測