SIGNATE レンタル自転車 に投稿しました 1位 2020/03/01

日本のデータサイエンス訓練サイトSIGNATEに投稿しました。ここでは、PJの内容についてとランキングをお知らせしたいと思います。

概要 今回投稿した概要 投稿リンク 暫定評価は 0.98667 斉藤建一

レンタル自転車の利用者数予測季節情報や気象情報から、レンタル自転車の利用者数を予測しました

2年間の季節情報や気象情報から、各日の1時間ごとのレンタル自転車の利用者数を予測するこのモデルを作成していただきます 。 昨今、観光地や都内でもレンタル自転車を見かける機会が増えてきました。
目的地周辺の散策に便利で、お財布にも優しいレンタル自転車の利用は今後も増えていくと考えられます。

データ概要

課題種別:時系列
データ種別:多変量
学習データサンプル数:8645
説明変数の数:13
欠損値:無し

データ説明


学習用データ(train.tsv)、評価用データ(test.tsv)

カラムヘッダ名称データ型説明
0idintインデックスとして使用
1dtedaydate日付(2011-01-01~2012-12-31)
2seasonint季節(1=春, 2=夏, 3=秋, 4=冬)
3yrbit年(0=2011, 1=2012)
4mnthint
5hrint時間
6holidaybit祝日(1=祝日)
7weekdayint曜日(0=日, 1=月…6=土)
8workingdaybit平日(0=平日, 1=祝日)
9weathersitint天気(1=晴,やや曇り, 2=薄い霧+曇り,霧+千切れ曇,霧+やや曇り,薄い霧, 3=小雪,小雨+雷雨+千切れ曇,小雨+千切れ曇, 4=大雨+凍雨+雷雨+霧,雪+濃い霧)
10tempfloat規格化した温度(摂氏)((t-t_min)/(t_max-t_min), t_min=-8, t_max=+39)
11atempfloat規格化した体感温度(摂氏)((t-t_min)/(t_max-t_min), t_min=-16, t_max=+50)
12humfloat規格化した湿度(最大値の100で割った値)
13windspeedfloat規格化した風速(最大値の67で割った値)
14cntint利用者数

※黄色く色付けされた変数が目的変数です(評価用データには含まれません)

応募用サンプルファイル(sample_submit.csv)

列目に評価用データの”id”を、2列目に予測した使用者数を記入したファイルを、ヘッダ無しcsv形式で投稿ください。

カラムヘッダ名称データ型説明
0無しintインデックスとして使用
1無しint予測した利用者数

弊社では、データ分析依頼企業を募集しています。
お気軽にご相談ください。092-437-1110