SIGNATE 銀行の顧客ターゲティング

日本のデータサイエンス訓練サイトSIGNATEに投稿しました。ここでは、PJの内容についてとランキングをお知らせしたいと思います。

https://signate.jp/competitions/1/leaderboard 要 今回投稿した概要 投稿リンク 0.93719 2019/07/15

本コンペを活用して、SIGNATEでのデータ解析・モデル構築を体験してください。
活用するデータは、実際のビジネス環境で得られたもので、マーケティングキャンペーンの効率化を図るためのモデリングを行います。
過去、このデータを使用して書かれた論文によるモデリング精度を超えることを目指し、腕試しがてらコンペに参加してみてください。

データ概要

データ
使用するデータは、ある銀行の顧客属性データおよび、過去のキャンペーンでの接触情報、などで、これらのデータを元に、当該のキャンペーンの結果、口座を開設したかどうかを予測します。

学習用のデータは、27,168名の顧客データとキャンペーンの結果(口座開設の有無)です。
予測する対象は、18,083名のキャンペーンに対する反応(結果)を予測していただきます。

予測に使用する変数(説明変数)は16で、これらの変数は学習用、予測対象の両方のデータに含まれます。
予測対象となる変数は、学習用のデータにのみ含まれます。

変数の詳細や、データ形式については、「データをダウンロード」ページをご参照ください。

本コンペで使用するデータは、以下のサイトおよび論文からの引用です。

Bache, K. & Lichman, M. (2013). UCI Machine Learning Repository [http://archive.ics.uci.edu/ml]. Irvine, CA: University of California, School of Information and Computer Science.

[Moro et al., 2011] S. Moro, R. Laureano and P. Cortez. Using Data Mining for Bank Direct Marketing: An Application of the CRISP-DM Methodology. In P. Novais et al. (Eds.), Proceedings of the European Simulation and Modelling Conference – ESM’2011, pp. 117-121, Guimarães, Portugal, October, 2011. EUROSIS.

データ説明


学習用データ(train.tsv)、評価用データ(test.tsv)

予測対象となる目的変数はカラム番号”17″の定額預金申し込み有無です。ただし、検証用データには含まれません。

カラムヘッダ名称データ型説明
0idint行の通し番号
1ageint年齢
2jobvarchar職種
3maritalvarchar未婚/既婚
4educationvarchar教育水準
5defaultvarchar債務不履行があるか(yes, no)
6balanceint年間平均残高(€)
7housingvarchar住宅ローン(yes, no)
8loanvarchar個人ローン(yes, no)
9contactvarchar連絡方法
10dayint最終接触日
11monthchar最終接触月
12durationint最終接触時間(秒)
13compaignint現キャンペーンにおける接触回数
14pdaysint経過日数:前キャンペーン接触後の日数
15previousint接触実績:現キャンペーン以前までに顧客に接触した回数
16poutcomevarchar前回のキャンペーンの成果
17yboolean定額預金申し込み有無(1:有り, 0:無し)

応募用サンプルファイル(sample.csv)

応募用ファイルのサンプルデータです。

カラムヘッダ名称データ型説明
0無しintインデックスとして使用する通し番号
1無しfloat予測した定額預金申し込みの確率値

※黄色く色付けされた変数が目的変数です(評価用データには含まれません)

弊社では、データ分析依頼企業を募集しています。
お気軽にご相談ください。092-437-1110