お知らせ

利用者数を予測する

日本のデータサイエンス訓練サイトSIGNATEに投稿しました。ここでは、PJの内容についてとランキングをお知らせしたいと思います。

概要 今回投稿した概要 投稿リンク 暫定評価は 0.9915254 斉藤 ...

お知らせ

利用者数を予測する

日本のデータサイエンス訓練サイトSIGNATEに投稿しました。ここでは、PJの内容についてとランキングをお知らせしたいと思います。

概要 今回投稿した概要 投稿リンク 暫定評価は 0.985242 ...

お知らせ

利用者数を予測する

日本のデータサイエンス訓練サイトSIGNATEに投稿しました。ここでは、PJの内容についてとランキングをお知らせしたいと思います。

  • 山火事予測 機械学習 SIGNATE

概要 今回投稿した概要 投稿リンク 暫定評価は 2.5572678 斉藤建一

 

不快指数や風速などの気象データ等から、ポルトガル北東部の森林火災焼失面積を予測するモデルを作成予測しました

山中では消火設備が整備されておらず、交通も不便なため、消火活動が非常に難しいという特徴があります。そのため、森林火災は広範囲に及ぶ危険性が非常に高くなります。
さらに森林は一度消失すると、再生までに長い年月が必要となります。

地球の貴重な環境資源を守るために、森林火災消失面積を予測するモデルを作成

データ概要

課題種別:回帰
データ種別:多変量
学習データサンプル数:258
説明変数の数:13
欠損値:無し

データ説明


学習用データ(train.tsv)、評価用データ(test.tsv)

カラム ヘッダ名称 データ型 説明
0 id int インデックスとして使用
1 X int モンテジーニョ公園地図内のx軸の空間座標(1~9)
2 Y int モンテジーニョ公園地図内のy軸の空間座標(2~9)
3 month char
4 day char 曜日
5 FFMC float FFMC指数【ファインフューエルモイスチャー指数】
ファインフューエルモイスチャーコード(Fine Fuel Moisture Code:FFMC)
ごみおよびその他の硬化した微細燃料の含水量を数値で評価したもの。
6 DMC float DMC指数【ダフモイスチャー指数】Duff Moisture Code(DMC)
適度な深さの緩やかに圧縮された有機層の平均含水量の数値評価。
7 DC float DC指数【干ばつ指数】Drought Code(DC)
深くてコンパクトな有機層の平均含水率を数値で表したもの。
8 ISI float ISI指数【初期拡散指数】初期拡散指数(ISI)
予想される火災伝播率の数値評価。
9 temp float 気温(摂氏)((F):2.2~33.30)
10 RH float 相対湿度((%):15.0~100)
11 wind float 風速((km / h):0.40~9.40)
12 rain float 降雨量((mm / m2):0.0~6.4)
13 area float 森林の焼失面積((ha):0.00~1090.84)

※黄色く色付けされた変数が目的変数です(評価用データには含まれません)

 

応募用サンプルファイル(sample_submit.csv)

列目に評価用データの”id”を、2列目に予測した使用者数を記入したファイルを、ヘッダ無しcsv形式で投稿ください。

カラム ヘッダ名称 データ型 説明
0 無し int インデックスとして使用
1 無し float 予測した利用者数

弊社では、データ分析依頼企業を募集しています。
お気軽にご相談ください。092-437-1110 

お知らせ

画像認識では、以下のようなより詳細なタスクがあります。
・画像分類:画像が何の画像であるかを識別する
・物体検出:画像内の対象物の場所を検出する
・異常検知:画像の中から異なる状態を検出する
・画像生成 ...

お知らせ

「AIガバナンス サーベイ 2019」デトロイトトーマツグループによりますと
AIの利活用を開始している企業は半数を超え、PoCを実施した企業のうち7割が本番運用、6割が目的達成まで実施できているというデータも出ています。

お知らせ

まず機械学習とは、「機械にデータを読み込ませて反復的に学習し、そこに潜むパターンを見つけ出すことで、分類や予測などのタスクを実行するアルゴリズムを自動構築する技術」のことです。

入力データの種類によって、
画像認識 ...

お知らせ

利用者数を予測する

日本のデータサイエンス訓練サイトSIGNATEに投稿しました。ここでは、PJの内容についてとランキングをお知らせしたいと思います。

  • レンタル自転車利用予測

概要 今回投稿した概要 投稿リンク 暫定評価は 0.98667 斉藤建一

 

レンタル自転車の利用者数予測季節情報や気象情報から、レンタル自転車の利用者数を予測しました

2年間の季節情報や気象情報から、各日の1時間ごとのレンタル自転車の利用者数を予測するこのモデルを作成していただきます 。 昨今、観光地や都内でもレンタル自転車を見かける機会が増えてきました。
目的地周辺の散策に便利で、お財布にも優しいレンタル自転車の利用は今後も増えていくと考えられます。

データ概要

課題種別:時系列
データ種別:多変量
学習データサンプル数:8645
説明変数の数:13
欠損値:無し

データ説明


学習用データ(train.tsv)、評価用データ(test.tsv)

カラム ヘッダ名称 データ型 説明
0 id int インデックスとして使用
1 dteday date 日付(2011-01-01~2012-12-31)
2 season int 季節(1=春, 2=夏, 3=秋, 4=冬)
3 yr bit 年(0=2011, 1=2012)
4 mnth int
5 hr int 時間
6 holiday bit 祝日(1=祝日)
7 weekday int 曜日(0=日, 1=月…6=土)
8 workingday bit 平日(0=平日, 1=祝日)
9 weathersit int 天気(1=晴,やや曇り, 2=薄い霧+曇り,霧+千切れ曇,霧+やや曇り,薄い霧, 3=小雪,小雨+雷雨+千切れ曇,小雨+千切れ曇, 4=大雨+凍雨+雷雨+霧,雪+濃い霧)
10 temp float 規格化した温度(摂氏)((t-t_min)/(t_max-t_min), t_min=-8, t_max=+39)
11 atemp float 規格化した体感温度(摂氏)((t-t_min)/(t_max-t_min), t_min=-16, t_max=+50)
12 hum float 規格化した湿度(最大値の100で割った値)
13 windspeed float 規格化した風速(最大値の67で割った値)
14 cnt int 利用者数

※黄色く色付けされた変数が目的変数です(評価用データには含まれません)

 

応募用サンプルファイル(sample_submit.csv)

列目に評価用データの”id”を、2列目に予測した使用者数を記入したファイルを、ヘッダ無しcsv形式で投稿ください。

カラム ヘッダ名称 データ型 説明
0 無し int インデックスとして使用
1 無し int 予測した利用者数

弊社では、データ分析依頼企業を募集しています。
お気軽にご相談ください。092-437-1110 

レンタル自転車利用予測

お知らせ

日本のデータサイエンス訓練サイトSIGNATEに投稿しました。ここでは、PJの内容についてとランキングをお知らせしたいと思います。

https://signate.jp/competitions/107/leaderboard  今回投稿した概要 
 ご確認ください → 投稿リンク 0.95535  2/15 

国政調査からの収入予測

教育年数や職業等の国勢調査データから年収が$50,000ドルを超えるかどうかを予測するモデルを作成していただきます

国勢調査は、すべての人を対象として実施される、国の最も重要かつ基本的な統計調査です。調査から得られる情報は,基礎データとして幅広い用途に利用され、国民生活に役立てられています。

今回は国勢調査から年収の予測($50,000を超えるか否か)に挑戦していただきます。

本コンペを活用して、SIGNATEでのデータ解析・モデル構築を体験してください。

データ概要

課題種別:分類
データ種別:多変量
学習データサンプル数:16280
説明変数の数:14
欠損値:あり

データ説明


学習用データ(train.tsv)、評価用データ(test.tsv)

カラムヘッダ名称データ型説明
0idintインデックスとして使用
1ageint年齢
2workclassvarchar職業クラス
3fnlwgtintfnlwgt
4educationvarchar教育
5education-numint教育年数
6marital-statusvarchar配偶者の有無
7occupationvarchar職業
8relationshipvarchar関係
9racevarchar人種
10sexvarchar性別
11capital-gainintキャピタルゲイン
12capital-lossintキャピタルロス
13hours-per-weekint週あたりの時間
14native-countryvarchar母国
15Yvarchar年収カテゴリ(>50K, <=50K)

応募用サンプルファイル(sample_submit.csv)

1列目に評価用データの”id”を、2列目に予測した年収カテゴリ(>50K, <=50K)を記入したファイルを、ヘッダ無しcsv形式で投稿ください。

カラムヘッダ名称データ型説明
0無しintインデックスとして使用
1無しvarchar予測した年収カテゴリ(>50K, <=50K)

弊社では、データ分析依頼企業を募集しています。
お気軽にご相談ください。092-437-1110 

お知らせ

日本のデータサイエンス訓練サイトSIGNATEに投稿しました。ここでは、PJの内容についてとランキングをお知らせしたいと思います。

概要 今回投稿した概要 投稿リンク  1.05985 ランキング 斉藤建一

自 ...

お知らせ

日本のデータサイエンス訓練サイトSIGNATEに投稿しました。ここでは、PJの内容についてとランキングをお知らせしたいと思います。

https://signate.jp/competitions/1/leaderboard  斉藤建一
今回投稿した概要 投稿リンク 0.99439 2019/07/15

本コンペを活用して、SIGNATEでのデータ解析・モデル構築を体験してください。
活用するデータは、実際のビジネス環境で得られたもので、マーケティングキャンペーンの効率化を図るためのモデリングを行います。
過去、このデータを使用して書かれた論文によるモデリング精度を超えることを目指し、腕試しがてらコンペに参加してみてください。

データ概要

データ
使用するデータは、ある銀行の顧客属性データおよび、過去のキャンペーンでの接触情報、などで、これらのデータを元に、当該のキャンペーンの結果、口座を開設したかどうかを予測します。

学習用のデータは、27,168名の顧客データとキャンペーンの結果(口座開設の有無)です。
予測する対象は、18,083名のキャンペーンに対する反応(結果)を予測していただきます。

予測に使用する変数(説明変数)は16で、これらの変数は学習用、予測対象の両方のデータに含まれます。
予測対象となる変数は、学習用のデータにのみ含まれます。

変数の詳細や、データ形式については、「データをダウンロード」ページをご参照ください。

本コンペで使用するデータは、以下のサイトおよび論文からの引用です。

Bache, K. & Lichman, M. (2013). UCI Machine Learning Repository [http://archive.ics.uci.edu/ml]. Irvine, CA: University of California, School of Information and Computer Science.

[Moro et al., 2011] S. Moro, R. Laureano and P. Cortez. Using Data Mining for Bank Direct Marketing: An Application of the CRISP-DM Methodology. In P. Novais et al. (Eds.), Proceedings of the European Simulation and Modelling Conference – ESM’2011, pp. 117-121, Guimarães, Portugal, October, 2011. EUROSIS.

データ説明


学習用データ(train.tsv)、評価用データ(test.tsv)

予測対象となる目的変数はカラム番号”17″の定額預金申し込み有無です。ただし、検証用データには含まれません。

カラムヘッダ名称データ型説明
0idint行の通し番号
1ageint年齢
2jobvarchar職種
3maritalvarchar未婚/既婚
4educationvarchar教育水準
5defaultvarchar債務不履行があるか(yes, no)
6balanceint年間平均残高(€)
7housingvarchar住宅ローン(yes, no)
8loanvarchar個人ローン(yes, no)
9contactvarchar連絡方法
10dayint最終接触日
11monthchar最終接触月
12durationint最終接触時間(秒)
13compaignint現キャンペーンにおける接触回数
14pdaysint経過日数:前キャンペーン接触後の日数
15previousint接触実績:現キャンペーン以前までに顧客に接触した回数
16poutcomevarchar前回のキャンペーンの成果
17yboolean定額預金申し込み有無(1:有り, 0:無し)

応募用サンプルファイル(sample.csv)

応募用ファイルのサンプルデータです。

カラムヘッダ名称データ型説明
0無しintインデックスとして使用する通し番号
1無しfloat予測した定額預金申し込みの確率値

※黄色く色付けされた変数が目的変数です(評価用データには含まれません)

弊社では、データ分析依頼企業を募集しています。
お気軽にご相談ください。092-437-1110